飛槳(PaddlePaddle)是國(guó)內(nèi)唯一功能完備的端到端開源深度學(xué)習(xí)平臺(tái),,集深度學(xué)習(xí)訓(xùn)練和預(yù)測(cè)框架、模型庫(kù),、工具組件,、服務(wù)平臺(tái)為一體,其兼具靈活和效率的開發(fā)機(jī)制,、工業(yè)級(jí)應(yīng)用效果的模型,、超大規(guī)模并行深度學(xué)習(xí)能力、推理引擎一體化設(shè)計(jì)以及系統(tǒng)化的服務(wù)支持,致力于讓深度學(xué)習(xí)技術(shù)的創(chuàng)新與應(yīng)用更簡(jiǎn)單,。 從Paddle Fluid v1.0以來,,飛槳致力于打造更好的用戶體驗(yàn),,趁著百度開發(fā)者大會(huì),,也為用戶精心準(zhǔn)備了一份大禮,在開發(fā),、訓(xùn)練及部署全流程上進(jìn)行了全新升級(jí),,發(fā)布了飛槳的五大優(yōu)勢(shì),接下來將一一解讀,。 一,、動(dòng)態(tài)圖&靜態(tài)圖 - 兼具動(dòng)態(tài)圖和靜態(tài)圖兩種計(jì)算圖的優(yōu)勢(shì)從飛槳核心框架Padlde Fluid v1.5開始,飛槳同時(shí)為用戶提供動(dòng)態(tài)圖和靜態(tài)圖兩種機(jī)制,。 靜態(tài)圖是先定義網(wǎng)絡(luò)結(jié)構(gòu)而后運(yùn)行,,對(duì)定義好的圖結(jié)構(gòu)進(jìn)行分析,可以使運(yùn)行速度更快,,顯存占用更低,,在業(yè)務(wù)部署上線上的具有非常大的優(yōu)勢(shì),為用戶的AI應(yīng)用落地提供高效支持,。但是靜態(tài)圖組網(wǎng)和執(zhí)行階段是分開,,對(duì)于新用戶理解起來不太友好。 飛槳從最新版本開始,,提供了更方便的動(dòng)態(tài)圖模式,,所有操作可以立即獲得執(zhí)行結(jié)果,而不必等到執(zhí)行階段才能獲取到結(jié)果,,這樣可以更方便進(jìn)行模型的調(diào)試,,同時(shí)還減少了大量用于構(gòu)建Executor等代碼,使得編寫,、調(diào)試網(wǎng)絡(luò)的過程變得更加便捷,。 用戶可以使用更加便捷的動(dòng)態(tài)圖模式進(jìn)行調(diào)試、訓(xùn)練,,然后可以把訓(xùn)練好的模型轉(zhuǎn)換為靜態(tài)圖的結(jié)構(gòu),,快速上線部署。 二,、應(yīng)用效果最佳的官方模型 – 覆蓋三大主流任務(wù) 基于百度多年的產(chǎn)業(yè)應(yīng)用經(jīng)驗(yàn),,以及百度生態(tài)伙伴的人工智能解決方案實(shí)踐,飛槳為用戶提供70+精選經(jīng)過真實(shí)業(yè)務(wù)場(chǎng)景驗(yàn)證的,、應(yīng)用效果最佳的官方算法模型,,涵蓋視覺、NLP、語(yǔ)音和推薦等AI核心技術(shù)領(lǐng)域,。 飛槳自然語(yǔ)言處理模型庫(kù)PaddleNLP:基于飛槳打造的工業(yè)級(jí)中文NLP開源工具集,,擁有當(dāng)前業(yè)內(nèi)效果最好的中語(yǔ)義表示模型和基于百億級(jí)大數(shù)據(jù)訓(xùn)練的預(yù)訓(xùn)練模型,并將自然語(yǔ)言處理領(lǐng)域的多種模型用一套共享骨架代碼實(shí)現(xiàn),,可大大減少用戶在開發(fā)過程中的重復(fù)工作,。 用戶在極大地減少研究和開發(fā)成本的同時(shí),也可以獲得更好的基于工業(yè)實(shí)踐的應(yīng)用效果,。本次發(fā)布PaddleNLP-Research,,支持NLP前沿研究,現(xiàn)已開源MRQA2019閱讀理解競(jìng)賽Paddle Fluid基線,、 DuConv (ACL2019),、ARNOR(ACL2019)、MMPMS(IJCAI2019),、MPM(NAACL2019) 等近期百度在 NLP 學(xué)術(shù)領(lǐng)域的工作,。 飛槳視覺模型庫(kù)PaddleCV:基于飛槳打造的業(yè)界效果最好的CV開源工具集,并開源多個(gè)百度自研,、國(guó)際賽事奪冠方案模型,。物體檢測(cè)統(tǒng)一框架、圖像分類庫(kù),、圖像生成庫(kù),、視頻識(shí)別庫(kù)多個(gè)基礎(chǔ)任務(wù)庫(kù)中,既具備高精度模型,、也具備高速推理模型,。基于易擴(kuò)展,、易模塊化的操作,,用戶可以高效完成各類視覺任務(wù)的工業(yè)應(yīng)用。
基于預(yù)訓(xùn)練模型,,用戶可以更便捷地完成自己的AI應(yīng)用,,飛槳為用戶提供預(yù)訓(xùn)練模型管理和遷移學(xué)習(xí)組件PaddleHub,可一鍵加載工業(yè)級(jí)預(yù)訓(xùn)練模型。本次新增發(fā)布29個(gè)預(yù)訓(xùn)練模型,,共為用戶提供40+預(yù)訓(xùn)練模型,,覆蓋文本、圖像,、視頻三大領(lǐng)域八類模型,。 PaddleHub提供Fine-tune API,10行代碼即可完成大規(guī)模預(yù)訓(xùn)練模型的遷移學(xué)習(xí),。PaddleHub還引入「模型即軟件」的理念,,通過Python API或者命令行工具,一行代碼完成預(yù)訓(xùn)練模型的預(yù)測(cè),。 三,、大規(guī)模分布式訓(xùn)練 - 業(yè)界最強(qiáng)的超大規(guī)模并行深度學(xué)習(xí)能力 飛槳同時(shí)支持稠密參數(shù)和稀疏參數(shù)場(chǎng)景的超大規(guī)模深度學(xué)習(xí)并行訓(xùn)練,支持千億規(guī)模參數(shù),、數(shù)百個(gè)節(jié)點(diǎn)的高效并行訓(xùn)練,,也是最早提供如此強(qiáng)大的深度學(xué)習(xí)并行技術(shù)的深度學(xué)習(xí)平臺(tái)。 飛槳提供高性價(jià)比的多機(jī)CPU參數(shù)服務(wù)器解決方案,,基于真實(shí)的推薦場(chǎng)景的數(shù)據(jù)驗(yàn)證,,可有效地解決超大規(guī)模推薦系統(tǒng)、超大規(guī)模數(shù)據(jù),、自膨脹的海量特征及高頻率模型迭代的問題,,實(shí)現(xiàn)高吞吐量和高加速比。 基于Paddle Fluid v1.5,,分布式訓(xùn)練新發(fā)布High-level API Fleet,,單機(jī)轉(zhuǎn)分布式訓(xùn)練成本顯著降低;GPU多機(jī)多卡性能顯著提升,,在ResNet50,、BERT、ERNIE等模型中4x8 v100配置下相比此前發(fā)布的Benchmark提速超過50%,。 四,、端到端部署 - 推理引擎一體化設(shè)計(jì),訓(xùn)練到多端推理的無(wú)縫對(duì)接移動(dòng)端加速 基于Paddle Fluid v1.5,,飛槳完整支持多框架,、多平臺(tái)、多操作系統(tǒng),,為用戶提供高兼容性,、高性能的多端部署能力、全面領(lǐng)先的底層加速庫(kù)和推理引擎Paddle Mobile 和Paddle Serving,。 對(duì)于開發(fā)者來說,,除了模型的訓(xùn)練,,在產(chǎn)品化過程中還會(huì)遇到各種各樣的工程化問題。隨著移動(dòng)設(shè)備被廣泛使用,,在移動(dòng)互聯(lián)網(wǎng)產(chǎn)品應(yīng)用深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)技術(shù)已經(jīng)成為必然趨勢(shì),。例如在移動(dòng)端部署,就需要面臨很多的問題,,例如安裝包大小,、運(yùn)行內(nèi)存占用大小、推理速度和效果等,。當(dāng)前主流的模型很難直接部署到移動(dòng)設(shè)備中,。 在4月份的發(fā)布中,PaddleSlim 實(shí)現(xiàn)了目前主流的網(wǎng)絡(luò)量化,、剪枝,、蒸餾三種壓縮策略,并可快速配置多種壓縮策略組合使用,。針對(duì)體積已經(jīng)很小的 MobileNet 模型,,在模型效果不損失的前提下實(shí)現(xiàn) 70% 以上的體積壓縮,。 本次版本PaddleSlim更是進(jìn)一步升級(jí),,新增基于模擬退火的自動(dòng)剪枝策略和輕量級(jí)模型結(jié)構(gòu)自動(dòng)搜索功能Light-NAS,對(duì)比MobileNet v2在ImageNet 1000類分類任務(wù)上精度無(wú)損情況下FLOPS 減少17%,,并在百度的OCR識(shí)別,、人體檢測(cè)、人臉關(guān)鍵點(diǎn)檢測(cè)等業(yè)務(wù)線應(yīng)用,,精度無(wú)損甚至提高的情況下,,速度帶來了30%~40%的提升。 五,、服務(wù)支持 – 唯一提供系統(tǒng)化深度學(xué)習(xí)技術(shù)服務(wù)的平臺(tái) 飛槳已經(jīng)實(shí)現(xiàn)了API的穩(wěn)定和向后兼容,,為用戶提供從入門教程到安裝編譯文檔、使用手冊(cè),、模型文檔,、API接口及索引文檔在內(nèi)的完善的中英雙語(yǔ)使用文檔。同時(shí),,提供系統(tǒng)的服務(wù)體系為企業(yè)合作伙伴護(hù)航,,幫助高校和教育伙伴構(gòu)建完善體系,為開發(fā)者提供不同層次的培養(yǎng)體系,。 |
|