【【科技紅利】全球人工智能AI芯片有望提前在安防領(lǐng)域落地】http://toutiao.com/group/6516411722343907853/?iid=15906422033&app=explore_article×tamp=1517737849&tt_from=copy_link&utm_source=copy_link&utm_medium=toutiao_ios&utm_campaign=client_share 人工智能應(yīng)用場景眾多,,認同AI安防優(yōu)先落地,有些場景需要在終端實現(xiàn),,對芯片功耗,、效率,運算能力要求較高,,這是當(dāng)前AI芯片發(fā)展方向,,也是制約AI終端應(yīng)用大范圍落地的瓶頸。深鑒科技就在朝著這個方向努力,,從基于FPGA和ASIC芯片的硬件定制化架構(gòu),,到算法壓縮,深鑒致力于提供高效,、低能耗的處理器,。當(dāng)前已有標準化模組產(chǎn)品,助力圖像識別,、結(jié)構(gòu)化算法加速,,測試結(jié)果表明深鑒產(chǎn)品與其他終端處理器相比,,在性能、效率方面等均有優(yōu)勢,。 人工智能場景:應(yīng)用場景眾多,,復(fù)雜程度不一。主要典型場景如下: 阿爾法狗下圍棋場景:行為較為單一,,任務(wù)其實相對簡單,。 機器人運動場景:人的行走相對復(fù)雜,考慮因素眾多,,相對復(fù)雜,。 自動駕駛場景:更為復(fù)雜,需要考慮社群行為,。即除了自動駕駛行為決策外,,還要考慮其他行駛者行為的影響。 行業(yè)應(yīng)用落地場景:認同AI落地第一個場景-AI安防的觀點,。 當(dāng)前AI安防已經(jīng)有大量需求,,2016年安防監(jiān)控出貨量:1億4千萬個模組和傳感器。安防主要部署在終端,,對處理器的成本,、帶寬,延時等性能都有較高要求,。 其他終端應(yīng)用場景:機器人和無人機 要求:時延低,,功耗低,價格敏感,,是AI具有挑戰(zhàn)性場景,。 目前市場上已經(jīng)有消費類產(chǎn)品:家庭陪伴機器人,掃地機器人,,家庭語音聊天機器人等,。主要是通過云端進行語音識別進行人機交互。 還有提升空間,,核心處理轉(zhuǎn)移到前端將會帶來市場空間,。 AI處理器現(xiàn)狀,目前尚處于早期,,效率,,功耗等均有待提高。阿爾法狗戰(zhàn)勝李世石用了2千個CPU,,3千個GPU,,同時還花費電費3千美元,難以在現(xiàn)實場景應(yīng)用,。AI真實場景應(yīng)用,,對計算能力,,功耗,開發(fā)門檻要求較高,。終端應(yīng)用對功耗要求更高,,無論是終端還是云端都面臨成本壓力:降低前期投入成本和后期運維成本。 AI三個關(guān)鍵因素:數(shù)據(jù),,算法,,硬件。當(dāng)前許多AI處理都在是云端完成,,因為需要計算集群提供強大運算能力,,短時間完成算法優(yōu)化、數(shù)據(jù)清洗,、適配,,訓(xùn)練數(shù)據(jù),快速迭代,。但是有些場景不適用云端場景:延時要求較高的場景,。終端設(shè)備無需連接服務(wù)器、延時較低,,可以適用這些場景,。預(yù)計未來終端應(yīng)用將會增加,,數(shù)據(jù)也越來越多,,形成數(shù)據(jù)量和處理能力之間的剪刀差。這是阻礙AI大范圍應(yīng)用的主要因素,。 當(dāng)前大量公司開發(fā)硬件,,基本所有AI相關(guān)公司都有想法或已經(jīng)付諸行動,部署相應(yīng)加速硬件,。未來趨勢,,未來AI大規(guī)模應(yīng)用落地,高效,、合適的計算平臺是必要條件,。 深度學(xué)習(xí)處理器:大公司都在做,比如谷歌,,百度,,英偉達為典型。 創(chuàng)業(yè)公司主要有:寒武紀,、深鑒科技,、地平線機器人等等。 大家共同的目標:便宜高效完成AI計算,。 深鑒科技主要擅長: 1.硬件加速:基于賽靈思的FPGA硬件和ASIC專為深度學(xué)習(xí)定制,,設(shè)計專門AI硬件架構(gòu),。 2.算法壓縮和量化:人類神經(jīng)元數(shù)量連接數(shù)量3-5歲達到最高峰,十幾歲人腦功能達到穩(wěn)定,,連接數(shù)減少到2/3-3/4,。這一階段是學(xué)習(xí)最快的階段,大腦會自動砍掉無效連接,。算法壓縮就在做同樣的事,,在不損失精度情況下壓縮網(wǎng)絡(luò)。對模型進行剪枝,、壓縮,、量化,在不損精度情下,,可以將運算速度提升數(shù)倍至數(shù)十倍,。 測試1.分類網(wǎng)絡(luò)壓縮: 對分類網(wǎng)絡(luò)做壓縮前后,兩類不同對象處理性能對比:可以在將模型壓縮到51%神經(jīng)元的情況下,,達到同樣精度,,大大提高處理速度。 測試2.SSD網(wǎng)絡(luò)壓縮: 測試表明:可以在實現(xiàn)相同精度情況下,,將網(wǎng)絡(luò)縮小至10%,。也就是原來一秒1張圖片,現(xiàn)在可處理10張圖片,。 功耗需求: 面向AI終端定制芯片的目標功耗是:1-10W區(qū)間,,這一領(lǐng)域尚處空白,各公司均向這方向努力,。 橫坐標:功耗,,縱坐標:運行速度,斜率越高效率越高,。 1-10w的紅圈區(qū)域:空白區(qū),。當(dāng)前IOT功耗是幾十-幾百W,需要大規(guī)模量產(chǎn)化才能降低成本,,并且?guī)资甒難以作為應(yīng)用端芯片,。其他性能強大的芯片過高功耗,需要的成本較高,。 測試3.效率比較: 衡量芯片兩個關(guān)鍵指標:峰值性能:取決于公司的技術(shù)水平以及財力,,較高工藝需要較大成本。 效率:取決于公司技術(shù)情況,。 效率定義:運行時工作芯片單元占總芯片單元數(shù)比重,,即100個計算單元,每個時鐘周期有多少在工作。 深鑒科技可達50%以上,;iphone8可以達到20-40%,;Kirin970:20%左右。 深鑒科技產(chǎn)品: 當(dāng)前市場主流AI應(yīng)用場景:安防,,數(shù)據(jù)中心,,機器類相關(guān)。深鑒科技也都在做,。 深鑒目前標準量產(chǎn)化產(chǎn)品:前端智能模組,,可以提高前端運算能力??梢酝ㄟ^增加硬件的方式,,實現(xiàn)支持多路、實時視頻處理,,可以輔助進行人臉識別,,結(jié)構(gòu)化模型處理。 |
|