一文看盡飛槳PaddlePaddle最新升級(jí)：5大優(yōu)勢(shì),，更低門檻使用深度學(xué)習(xí)

黃爸爸好 2019-07-04

展開全文

飛槳（PaddlePaddle）是國(guó)內(nèi)唯一功能完備的端到端開源深度學(xué)習(xí)平臺(tái),，集深度學(xué)習(xí)訓(xùn)練和預(yù)測(cè)框架、模型庫(kù),、工具組件,、服務(wù)平臺(tái)為一體，其兼具靈活和效率的開發(fā)機(jī)制,、工業(yè)級(jí)應(yīng)用效果的模型,、超大規(guī)模并行深度學(xué)習(xí)能力、推理引擎一體化設(shè)計(jì)以及系統(tǒng)化的服務(wù)支持，致力于讓深度學(xué)習(xí)技術(shù)的創(chuàng)新與應(yīng)用更簡(jiǎn)單,。

從Paddle Fluid v1.0以來,，飛槳致力于打造更好的用戶體驗(yàn),，趁著百度開發(fā)者大會(huì),，也為用戶精心準(zhǔn)備了一份大禮，在開發(fā),、訓(xùn)練及部署全流程上進(jìn)行了全新升級(jí),，發(fā)布了飛槳的五大優(yōu)勢(shì)，接下來將一一解讀,。

一,、動(dòng)態(tài)圖&靜態(tài)圖 - 兼具動(dòng)態(tài)圖和靜態(tài)圖兩種計(jì)算圖的優(yōu)勢(shì)

從飛槳核心框架Padlde Fluid v1.5開始，飛槳同時(shí)為用戶提供動(dòng)態(tài)圖和靜態(tài)圖兩種機(jī)制,。

靜態(tài)圖是先定義網(wǎng)絡(luò)結(jié)構(gòu)而后運(yùn)行,，對(duì)定義好的圖結(jié)構(gòu)進(jìn)行分析，可以使運(yùn)行速度更快,，顯存占用更低,，在業(yè)務(wù)部署上線上的具有非常大的優(yōu)勢(shì)，為用戶的AI應(yīng)用落地提供高效支持,。但是靜態(tài)圖組網(wǎng)和執(zhí)行階段是分開,，對(duì)于新用戶理解起來不太友好。

飛槳從最新版本開始,，提供了更方便的動(dòng)態(tài)圖模式,，所有操作可以立即獲得執(zhí)行結(jié)果，而不必等到執(zhí)行階段才能獲取到結(jié)果,，這樣可以更方便進(jìn)行模型的調(diào)試,，同時(shí)還減少了大量用于構(gòu)建Executor等代碼，使得編寫,、調(diào)試網(wǎng)絡(luò)的過程變得更加便捷,。

用戶可以使用更加便捷的動(dòng)態(tài)圖模式進(jìn)行調(diào)試、訓(xùn)練,，然后可以把訓(xùn)練好的模型轉(zhuǎn)換為靜態(tài)圖的結(jié)構(gòu),，快速上線部署。

二,、應(yīng)用效果最佳的官方模型 – 覆蓋三大主流任務(wù)

基于百度多年的產(chǎn)業(yè)應(yīng)用經(jīng)驗(yàn),，以及百度生態(tài)伙伴的人工智能解決方案實(shí)踐，飛槳為用戶提供70+精選經(jīng)過真實(shí)業(yè)務(wù)場(chǎng)景驗(yàn)證的,、應(yīng)用效果最佳的官方算法模型,，涵蓋視覺、NLP、語(yǔ)音和推薦等AI核心技術(shù)領(lǐng)域,。

飛槳自然語(yǔ)言處理模型庫(kù)PaddleNLP：基于飛槳打造的工業(yè)級(jí)中文NLP開源工具集,，擁有當(dāng)前業(yè)內(nèi)效果最好的中語(yǔ)義表示模型和基于百億級(jí)大數(shù)據(jù)訓(xùn)練的預(yù)訓(xùn)練模型，并將自然語(yǔ)言處理領(lǐng)域的多種模型用一套共享骨架代碼實(shí)現(xiàn),，可大大減少用戶在開發(fā)過程中的重復(fù)工作,。

用戶在極大地減少研究和開發(fā)成本的同時(shí)，也可以獲得更好的基于工業(yè)實(shí)踐的應(yīng)用效果,。本次發(fā)布PaddleNLP-Research,，支持NLP前沿研究，現(xiàn)已開源MRQA2019閱讀理解競(jìng)賽Paddle Fluid基線,、 DuConv (ACL2019),、ARNOR(ACL2019)、MMPMS(IJCAI2019),、MPM(NAACL2019) 等近期百度在 NLP 學(xué)術(shù)領(lǐng)域的工作,。

飛槳視覺模型庫(kù)PaddleCV：基于飛槳打造的業(yè)界效果最好的CV開源工具集，并開源多個(gè)百度自研,、國(guó)際賽事奪冠方案模型,。物體檢測(cè)統(tǒng)一框架、圖像分類庫(kù),、圖像生成庫(kù),、視頻識(shí)別庫(kù)多個(gè)基礎(chǔ)任務(wù)庫(kù)中，既具備高精度模型,、也具備高速推理模型,。基于易擴(kuò)展,、易模塊化的操作,，用戶可以高效完成各類視覺任務(wù)的工業(yè)應(yīng)用。

PaddleDetection物體檢測(cè)統(tǒng)一框架,，覆蓋主流的檢測(cè)算法,，即具備高精度模型、也具備高速推理模型,，包含F(xiàn)aster-RCNN (支持FPN), Mask-RCNN (支持FPN), Cascade-RCNN, RetinaNet, Yolo v3, SSD算法并提供一系列的預(yù)訓(xùn)練模型,，具有工業(yè)化、模塊化,、高性能的優(yōu)勢(shì),。結(jié)合飛槳核心框架的高速推理引擎，訓(xùn)練到部署無(wú)縫銜接,；提供模塊化設(shè)計(jì),，模型網(wǎng)絡(luò)結(jié)構(gòu)和數(shù)據(jù)數(shù)據(jù)處理均可定制,；基于高效的核心框架，訓(xùn)練速度和顯存占用上有一定的優(yōu)勢(shì),，例如,，YOLO v3訓(xùn)練速度相比同類框架快1.6倍。此外,，本次除了統(tǒng)一檢測(cè)框架,，還發(fā)布一系列預(yù)訓(xùn)練模型，例如基于改進(jìn)版的ResNet的檢測(cè)模型,，不增加計(jì)算量的情況下,，精度普遍提高約1%左右,。
圖像分類庫(kù)本次新增9個(gè)圖像分類模型,，截至目前，覆蓋10種,、超過25個(gè)ImageNet預(yù)訓(xùn)練模型,，其中ResNet模型持續(xù)改進(jìn)，發(fā)布計(jì)算量相當(dāng)?shù)母倪M(jìn)模型,，例如ResNet50 Top1準(zhǔn)確率從76.5%提升到79.84%（+3.34%）,。
PaddleGAN為用戶提供易上手的、一鍵式可運(yùn)行的GAN模型,，覆蓋主流GAN算法,，包括CGAN、DCGAN,、Pix2Pix,，CycleGAN，StarGAN,，STGAN,，ATTGAN，其中STGAN是百度自研的人臉屬性編輯編輯模型,，發(fā)表于CVPR 2019,。
PaddleVideo業(yè)界首個(gè)視頻識(shí)別與定位工具集繼4月份發(fā)布，本次持續(xù)優(yōu)化訓(xùn)練速度,，部分模型速度優(yōu)于同類產(chǎn)品的30%,；本次新增加C-TCN，百度自研的視頻動(dòng)作定位模型,，也是2018年ActivityNet奪冠方案,，在飛槳上首次開源。

基于預(yù)訓(xùn)練模型,，用戶可以更便捷地完成自己的AI應(yīng)用,，飛槳為用戶提供預(yù)訓(xùn)練模型管理和遷移學(xué)習(xí)組件PaddleHub，可一鍵加載工業(yè)級(jí)預(yù)訓(xùn)練模型。本次新增發(fā)布29個(gè)預(yù)訓(xùn)練模型,，共為用戶提供40+預(yù)訓(xùn)練模型,，覆蓋文本、圖像,、視頻三大領(lǐng)域八類模型,。

PaddleHub提供Fine-tune API，10行代碼即可完成大規(guī)模預(yù)訓(xùn)練模型的遷移學(xué)習(xí),。PaddleHub還引入「模型即軟件」的理念,，通過Python API或者命令行工具，一行代碼完成預(yù)訓(xùn)練模型的預(yù)測(cè),。

三,、大規(guī)模分布式訓(xùn)練 - 業(yè)界最強(qiáng)的超大規(guī)模并行深度學(xué)習(xí)能力

飛槳同時(shí)支持稠密參數(shù)和稀疏參數(shù)場(chǎng)景的超大規(guī)模深度學(xué)習(xí)并行訓(xùn)練，支持千億規(guī)模參數(shù),、數(shù)百個(gè)節(jié)點(diǎn)的高效并行訓(xùn)練,，也是最早提供如此強(qiáng)大的深度學(xué)習(xí)并行技術(shù)的深度學(xué)習(xí)平臺(tái)。

飛槳提供高性價(jià)比的多機(jī)CPU參數(shù)服務(wù)器解決方案,，基于真實(shí)的推薦場(chǎng)景的數(shù)據(jù)驗(yàn)證,，可有效地解決超大規(guī)模推薦系統(tǒng)、超大規(guī)模數(shù)據(jù),、自膨脹的海量特征及高頻率模型迭代的問題,，實(shí)現(xiàn)高吞吐量和高加速比。

基于Paddle Fluid v1.5,，分布式訓(xùn)練新發(fā)布High-level API Fleet,，單機(jī)轉(zhuǎn)分布式訓(xùn)練成本顯著降低；GPU多機(jī)多卡性能顯著提升,，在ResNet50,、BERT、ERNIE等模型中4x8 v100配置下相比此前發(fā)布的Benchmark提速超過50%,。

四,、端到端部署 - 推理引擎一體化設(shè)計(jì)，訓(xùn)練到多端推理的無(wú)縫對(duì)接移動(dòng)端加速

基于Paddle Fluid v1.5,，飛槳完整支持多框架,、多平臺(tái)、多操作系統(tǒng),，為用戶提供高兼容性,、高性能的多端部署能力、全面領(lǐng)先的底層加速庫(kù)和推理引擎Paddle Mobile 和Paddle Serving,。

對(duì)于開發(fā)者來說,，除了模型的訓(xùn)練,，在產(chǎn)品化過程中還會(huì)遇到各種各樣的工程化問題。隨著移動(dòng)設(shè)備被廣泛使用,，在移動(dòng)互聯(lián)網(wǎng)產(chǎn)品應(yīng)用深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)技術(shù)已經(jīng)成為必然趨勢(shì),。例如在移動(dòng)端部署，就需要面臨很多的問題,，例如安裝包大小,、運(yùn)行內(nèi)存占用大小、推理速度和效果等,。當(dāng)前主流的模型很難直接部署到移動(dòng)設(shè)備中,。

在4月份的發(fā)布中，PaddleSlim 實(shí)現(xiàn)了目前主流的網(wǎng)絡(luò)量化,、剪枝,、蒸餾三種壓縮策略，并可快速配置多種壓縮策略組合使用,。針對(duì)體積已經(jīng)很小的 MobileNet 模型,，在模型效果不損失的前提下實(shí)現(xiàn) 70% 以上的體積壓縮,。

本次版本PaddleSlim更是進(jìn)一步升級(jí),，新增基于模擬退火的自動(dòng)剪枝策略和輕量級(jí)模型結(jié)構(gòu)自動(dòng)搜索功能Light-NAS，對(duì)比MobileNet v2在ImageNet 1000類分類任務(wù)上精度無(wú)損情況下FLOPS 減少17%,，并在百度的OCR識(shí)別,、人體檢測(cè)、人臉關(guān)鍵點(diǎn)檢測(cè)等業(yè)務(wù)線應(yīng)用,，精度無(wú)損甚至提高的情況下,，速度帶來了30%～40%的提升。

五,、服務(wù)支持 – 唯一提供系統(tǒng)化深度學(xué)習(xí)技術(shù)服務(wù)的平臺(tái)

飛槳已經(jīng)實(shí)現(xiàn)了API的穩(wěn)定和向后兼容,，為用戶提供從入門教程到安裝編譯文檔、使用手冊(cè),、模型文檔,、API接口及索引文檔在內(nèi)的完善的中英雙語(yǔ)使用文檔。同時(shí),，提供系統(tǒng)的服務(wù)體系為企業(yè)合作伙伴護(hù)航,，幫助高校和教育伙伴構(gòu)建完善體系，為開發(fā)者提供不同層次的培養(yǎng)體系,。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn),。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購(gòu)買等信息,，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,，請(qǐng)點(diǎn)擊一鍵舉報(bào),。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：黃爸爸好 > 《devOps》

舉報(bào)/認(rèn)領(lǐng)