久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

車端的地平線,,瞄著云端的英偉達(dá)

 汽車公社 2022-10-29 發(fā)布于上海

導(dǎo)語

Introduction

你有GPU,我有DSA,。

作者丨王小西

責(zé)編丨李思佳

編輯丨朱錦斌

說到AI芯片領(lǐng)域,,最近的一件大事是,10月13日地平線和大眾旗下軟件公司CARIAD官宣合作,。雙方成立合資企業(yè),,CARIAD控股60%,,投資約24億歐元,預(yù)計(jì)會(huì)在2023年上半年完成,。

這算是地平線迄今為止最重磅的一個(gè)合作,。而一個(gè)插曲是,半年前地平線才宣布第三代產(chǎn)品征程5芯片首個(gè)定點(diǎn)合作,,花落比亞迪,,上車時(shí)間2023年。不過,,有意思的是,,比亞迪同時(shí)也將投產(chǎn)搭載英偉達(dá)DRIVE Orin計(jì)算平臺(tái)的車型。

而公社C次元最近一篇文章《英偉達(dá)不要的,,地平線都要》,對(duì)地平線和英偉達(dá)在汽車領(lǐng)域AI芯片應(yīng)用的競(jìng)爭(zhēng)情況也做了介紹,,所以,,這篇我們就科普科普,到底這兩家企業(yè)競(jìng)爭(zhēng)些什么,,以及車企的選擇背后是怎樣的考慮,?

都是AI芯片,有啥不一樣,?

論及雙方,,他們的產(chǎn)品都是用于自動(dòng)駕駛領(lǐng)域的AI芯片。但是區(qū)別還是很大的,。

AI芯片的應(yīng)用場(chǎng)景,,主要分為云端和終端,還有邊緣端,。目前,,云端應(yīng)用的更多,相對(duì)成熟,。此外,,云端應(yīng)用又可分為訓(xùn)練和推理兩種,其中訓(xùn)練的市場(chǎng)規(guī)模占比較高,。

云端應(yīng)用的霸主,,就是英偉達(dá)。而云端(服務(wù)器,、數(shù)字中心)和終端(手機(jī),、智能汽車等移動(dòng)端)應(yīng)用場(chǎng)景中,AI芯片的運(yùn)算方式有著本質(zhì)性的差別,。

比如,,云端處理大批量一次性到達(dá)的累積數(shù)據(jù)(擴(kuò)大批處理量,,batch size),可以“等”數(shù)據(jù)“夠了”再開始處理,。但車端芯片則需要處理流數(shù)據(jù),,隨著行駛(時(shí)間)陸續(xù)到來的數(shù)據(jù);需要實(shí)時(shí)完成計(jì)算,,盡可能得降低延遲,。

對(duì)于交互性,終端要求更高,。云端任務(wù)本身是限定在虛擬世界,無需考慮與現(xiàn)實(shí)世界的交互,。終端則身處現(xiàn)實(shí)世界,,每一個(gè)任務(wù)都需要考慮交互性。

此外,,功耗和成本在車端AI芯片的考量中也占據(jù)更重的分量,。可見,,對(duì)于汽車終端來講,,AI芯片除了須保證計(jì)算能效,還有低功耗,、低延遲,、低成本的要求。

目前,,AI芯片主要有三種,,分別是通用型的GPU,可定制的FPGA,,以及專用的ASIC,。英偉達(dá)的Orin芯片,是基于通用GPU,。而地平線的征程5芯片,,既是ASIC芯片,也是DSA(Domain Specific Architecture 特定領(lǐng)域架構(gòu))芯片,。值得注意的是,,Orin芯片的核心GPU架構(gòu)仍是云端架構(gòu)。

不過,,對(duì)車企來說,,芯片的兼容性越強(qiáng)越好,因?yàn)檐嚻罂梢砸徊降轿?,而且無需再?gòu)念^做驗(yàn)證,,用一個(gè)芯片就能實(shí)現(xiàn)未來高階智能駕駛的硬件預(yù)埋,,為未來更高階的智能駕駛做好準(zhǔn)備。這也是很多品牌愿意選擇英偉達(dá)Orin芯片的原因,。

而地平線采用面向特定場(chǎng)景的軟硬結(jié)合方法論來設(shè)計(jì)芯片,,也就是DSA芯片的做法,極大提升了芯片的有效算力。但是,,我們的疑問是,,征程5芯片的極限到達(dá)后,更高級(jí)別的自動(dòng)駕駛需求就要換用征程6,,那么,,這個(gè)換裝的綜合成本,誰來買單承受呢,?

除了算力,,還有FPS

除了通用和定制的區(qū)別,目前業(yè)內(nèi)存在“唯算力論”,,好像芯片算力越高覺得越好,。其實(shí),這有失偏頗,。實(shí)際上,,還是要看FPS(每秒傳輸幀數(shù))才行。

FPS通俗來講就是指動(dòng)畫或視頻的每秒畫面數(shù),。FPS是測(cè)量用于保存,、顯示動(dòng)態(tài)視頻的信息數(shù)量。簡(jiǎn)單來說,,F(xiàn)PS數(shù)值越大,,性能越好。對(duì)于自動(dòng)駕駛所有應(yīng)用的計(jì)算平臺(tái)來說,,F(xiàn)PS被認(rèn)為是衡量先進(jìn)算法運(yùn)行效率的評(píng)價(jià)標(biāo)準(zhǔn)之一,。

比如,在芯片算力上,,單片英偉達(dá)Orin和征程5的算力分別為254TOPS(每秒萬億次計(jì)算)和128TOPS,,功率為45W和30W,功耗比分別為4.6TOPS/W和4.2TOPS/W,。征程5只有英偉達(dá)Orin的一半,。

但是,征程5的FPS(每秒傳輸幀數(shù))卻為1283,。比Orin的1001FPS(基于同安培架構(gòu)的英偉達(dá)RTX3090進(jìn)行調(diào)整后測(cè)算得出)高出不少,。地平線征程5畫面?zhèn)魉鸵曨l的流暢度明顯要好于英偉達(dá)Orin。怪不得地平線BPU算法負(fù)責(zé)人羅恒要說,,“能效上來看,,我們(征程5相比Orin)有6倍多的提升,。” 

其實(shí),,不僅是地平線以FPS來算帳,。2017年發(fā)布自研的FSD芯片時(shí),特斯拉創(chuàng)始人馬斯克便以此前應(yīng)用的英偉達(dá)Drive PX2作比,,從算力來看FSD是Drive PX2的3倍,但FPS是Drive PX2的21倍,。

此外,,低延遲性能也是衡量AI芯片性能的關(guān)鍵指標(biāo),。因?yàn)椋舆t問題直接關(guān)乎駕駛證安全,。比如,,在緊急制動(dòng)場(chǎng)景下,100毫秒意味著近1.7~3.3米的剎車距離,。

而按照地平線的說法,,征程5的8M單目前視感知結(jié)構(gòu)化輸出延遲小于60毫秒,,比英偉達(dá)ORIN的延遲性能更好。而Orin芯片的低延遲數(shù)據(jù)未知,。

所以,從FPS和低延遲,、低成本來說,,地平線在汽車領(lǐng)域的發(fā)展機(jī)會(huì)還是很大的,目前有超過20家車企的70多款車型應(yīng)用了征程系列芯片,,這也是地平線通過定制路線的“奇兵”收獲的成果,。

架構(gòu),,決勝

而在第五波計(jì)算浪潮之下,,決定芯片的核心,當(dāng)然是架構(gòu)。因?yàn)?,架?gòu)是芯片企業(yè)最底層的核心技術(shù),迭代成本巨大,,也是最值錢的技術(shù),。

作為提出DSA架構(gòu)的泰山北斗,,John Hennessy與David Patterson在獲得2017年圖靈獎(jiǎng)時(shí)的獲獎(jiǎng)演說中指出:“未來十年,,將是計(jì)算機(jī)體系結(jié)構(gòu)的黃金年代”,。這是一個(gè)很好的注腳,。

而地平線的征程系列芯片,從其架構(gòu)來說,,經(jīng)歷了名為高斯,、伯努利和貝葉斯的三代BPU(Brain Processing Unit, 地平線自主設(shè)計(jì)研發(fā)的高效的人工智能處理器架構(gòu))架構(gòu),。

從低到高,,高斯架構(gòu)主要處理感知,就是圖像識(shí)別,,識(shí)別攝像頭,,雷達(dá),傳感器等的圖像,,采用40nm工藝,。而伯努利架構(gòu)加入了深度學(xué)習(xí),20nm工藝,。貝葉斯架構(gòu)則是加入貝葉斯網(wǎng)絡(luò),,結(jié)合深度學(xué)習(xí)來提高AI的準(zhǔn)確率,16nm工藝,。

再來看英偉達(dá),。創(chuàng)立于1993年的英偉達(dá)厲害之處在于,1999年發(fā)明GPU(圖形處理器),,2006年發(fā)布CUDA?通用并行計(jì)算架構(gòu),,實(shí)現(xiàn)了軟硬解耦。開發(fā)者不必再使用高難度的GPU專用開發(fā)語言,,而能使用通用性的編程語言調(diào)用GPU算力,。

通過軟硬解耦,將圖形處理的專用芯片GPU變?yōu)檫m用于大規(guī)模并行計(jì)算的通用型芯片,,英偉達(dá)站上AI時(shí)代的C位,。對(duì)于地平線以及其他芯片企業(yè)來說,也是高山仰止,、拼命追趕的對(duì)象,。

而英偉達(dá)的Orin是基于Ampere(安培)架構(gòu),這也是推動(dòng)英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)增長(zhǎng)近9成的主力產(chǎn)品架構(gòu),。換句話說,,面向高級(jí)別自動(dòng)駕駛場(chǎng)景的Orin,用的還是魔改的通用架構(gòu),。這就像,,今年大熱的高通8155芯片,,是從消費(fèi)電子芯片魔改而來。

通用架構(gòu)的好處是“上手容易”,,拿來就能用,,而且工具豐富。不過,,缺點(diǎn)是,,很多硬件性能前期是浪費(fèi)的,暫時(shí)用不上的,。

那么,,為什么站在云端的英偉達(dá)仍然在用通用架構(gòu),?看看汽車業(yè)務(wù)占比就明白。

5月26日,,英偉達(dá)發(fā)布2023財(cái)年Q1財(cái)報(bào)(截至2022年3月),,本季營(yíng)收82.9億美元,同比增長(zhǎng)46%,。其中,,由超大規(guī)模計(jì)算、云端和AI業(yè)務(wù)推動(dòng)的數(shù)據(jù)中心業(yè)務(wù)占比45.23%,;顯卡支撐的游戲業(yè)務(wù)占比43.67%,。汽車業(yè)務(wù)呢?微不足道,,占比2.1%,。

地平線的營(yíng)收情況,沒有公開的披露,。不過,,2020年《晚點(diǎn)LatePost》曾報(bào)道,,地平線2020年?duì)I收為2~2.3億元,,其中70%來自向車廠提供芯片等產(chǎn)品的收入,,客戶包括長(zhǎng)安、一汽和理想汽車等,。

從營(yíng)收來看,,地平線和英偉達(dá)的差距還不是一個(gè)數(shù)量級(jí)的,,還根本無法威脅到英偉達(dá)的地位,是海洋界鯨魚和海豚的關(guān)系,。所以,,英偉達(dá)沒什么動(dòng)力去做面向車企的ASIC芯片。這也給了地平線和其他芯片企業(yè)巨大的機(jī)會(huì),。

當(dāng)然,,地平線還處于發(fā)展初期也就是要不斷砸錢的階段。根據(jù)企查查的數(shù)據(jù),,如果不計(jì)算未披露的融資金額,,地平線累計(jì)融資超34億美元(約合人民幣243.3億元)。最近一筆,,是奇瑞汽車的,。

地平線目前的核心業(yè)務(wù)只有端側(cè)的汽車領(lǐng)域。市場(chǎng)方面,,地平線征程系列芯片目前累計(jì)出貨超過150萬片,。而通過針對(duì)自動(dòng)駕駛場(chǎng)景算法和需求專門設(shè)計(jì)的專用芯片,實(shí)現(xiàn)在效率上的更高效,,只是地平線追趕英偉達(dá)的第一步,。

就像前面說的,比亞迪并不是唯一一個(gè)同時(shí)部署英偉達(dá)和地平線的車企,。理想在2021理想ONE以及后續(xù)的理想L8 Pro上搭載了征程5,,而在理想L8 MAX和L9上則使用的是英偉達(dá)Orin。

所以,,地平線更難的是構(gòu)建出好用的軟件體系,,以及能支撐持續(xù)演進(jìn)迭代的用戶生態(tài),而這正是英偉達(dá)CUDA體系的王牌所在,。地平線的天工開物還有很長(zhǎng)的路要走,。不過,,無論怎樣,地平線給中國(guó)汽車企業(yè)帶來了一個(gè)DSA芯片的可選項(xiàng),,都是件“極好的”事,。

王小西

比天空更遼闊的……

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多