【新智元導(dǎo)讀】又到了一年一度的英偉達(dá)GTC China大會(huì),,NVIDIA創(chuàng)始人兼CEO黃仁勛和大家分享了英偉達(dá)取得的成績(jī):NVIDIA已經(jīng)售出15億塊GPU,并重磅發(fā)布TensorRT 7,,以及支持L2-L5自動(dòng)駕駛的系統(tǒng)級(jí)芯片Orin,。戳右邊鏈接上 新智元小程序 了解更多!又到了一年一度的英偉達(dá)GTC China大會(huì),,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛又是一身黑色皮衣亮相蘇州,,為大家分享了英偉達(dá)取得的成績(jī):NVIDIA已經(jīng)售出15億塊GPU。據(jù)悉,,這是有史以來參會(huì)人數(shù)最多的一次,,現(xiàn)場(chǎng)有超過6100人參會(huì),比三年前增長(zhǎng)了250%,。黃教主一口氣講了兩個(gè)多小時(shí),先奉上黃仁勛這次的演講重點(diǎn):- NVIDIA加速計(jì)算,,持續(xù)加速著圖形,,HPC及AI領(lǐng)域的計(jì)算任務(wù)。
- 在過去的一年中,,又有三大類應(yīng)用成功運(yùn)行在了 NVIDIA 的平臺(tái)上:光線追蹤(RTX),,5G(Aerial),以及最新的基因組處理(Parabricks),。
- NVIDIA 與騰訊 Start 團(tuán)隊(duì)攜手將游戲帶到了云端,。
- NVIDIA與 ARM平臺(tái)現(xiàn)在可以結(jié)合進(jìn)行高性能計(jì)算。
- 在人工智能領(lǐng)域,,推薦系統(tǒng)是驅(qū)動(dòng)互聯(lián)網(wǎng)的引擎,,現(xiàn)在通過深度推薦網(wǎng)絡(luò),這類最重要的應(yīng)用可以獲益于 GPU 的加速,。
- TensorRT 7 現(xiàn)在可以加速所有種類模型的線上推理-CNN,,Transformer & RNN網(wǎng)絡(luò)
- 運(yùn)用 TRT7,對(duì)話式AI現(xiàn)在可以變得有互動(dòng)性和更加自然,。
- Orin 是NVIDIA最新的機(jī)器人平臺(tái)芯片——更快,,可以處理更高精度的傳感器感知數(shù)據(jù),以及擁有世界級(jí)的安全和防范能力。
- 在創(chuàng)建下一代人工智能——智能機(jī)器人——的征途上,,NVIDIA的 Isaac SDK 提供了模擬仿真和訓(xùn)練的平臺(tái),,開放了計(jì)算能力,多種預(yù)訓(xùn)練模型,,及多種參考應(yīng)用樣例,。
重磅發(fā)布TensorRT 7,支持超千種計(jì)算變換 今天黃仁勛也正式發(fā)布了TensorRT 7,,并稱其是“我們實(shí)現(xiàn)的最大飛躍”,。TensorRT是一種計(jì)算圖優(yōu)化編譯器,以如TensorFlow等深度學(xué)習(xí)框架訓(xùn)練得到的模型作為輸入,,為CUDA GPU生成優(yōu)化了的模型運(yùn)行時(shí),。TensorRT 通過尋找計(jì)算圖中可以融合的節(jié)點(diǎn)和邊,從而減少計(jì)算和內(nèi)存訪問,。去年在GTC China大會(huì)上,,英偉達(dá)發(fā)布了TensorRT 5,支持自動(dòng)低精度推理,,將FP32模型轉(zhuǎn)換成FP16或INT8模型,,而不損失準(zhǔn)確率。但TensorRT 5僅支持CNN,,這是一個(gè)不足,,因?yàn)榇蠖鄶?shù)語音模型需要RNN的支持,而語音推理需要大量的工作負(fù)載,。今天發(fā)布的TensorRT 7解決了這一不足,,它支持各種類型的RNN,Transformer 和 CNN,。相比TRT5 只支持30種模型,,TRT 7能夠支持多達(dá)1000種不同的計(jì)算變換和優(yōu)化,包括最新的BERT,、RoBERTa等,。TensorRT 7能夠融合水平和垂直方向的運(yùn)算,可以為開發(fā)者設(shè)計(jì)的大量RNN配置自動(dòng)生成代碼,,逐點(diǎn)融合LSTM單元,,甚至可跨多個(gè)時(shí)間步長(zhǎng)進(jìn)行融合。并且盡可能做自動(dòng)低精度推理,。TensorRT 7強(qiáng)大功能的典型代表是支持交互式會(huì)話AI,。作為NVIDIA第七代推理軟件開發(fā)套件,,它為實(shí)現(xiàn)更加智能的AI人機(jī)交互打開了新大門,,從而能夠?qū)崿F(xiàn)與語音代理、聊天機(jī)器人和推薦引擎等應(yīng)用進(jìn)行實(shí)時(shí)互動(dòng),。AI在語音和自然語言理解方面的突破使會(huì)話AI成為可能,,但會(huì)話是交互式、應(yīng)答式的,,因此低延遲至關(guān)重要,。一套端到端的流程可能由二三十種模型組成,用到不同的模型結(jié)構(gòu),,包括CNN,、RNN、transformer,、自編碼器,、MLP等。TensorRT 7內(nèi)置新型深度學(xué)習(xí)編譯器,,該編譯器能夠自動(dòng)優(yōu)化和加速遞歸神經(jīng)網(wǎng)絡(luò)與基于Transformer的神經(jīng)網(wǎng)絡(luò),。使用CPU推理,這樣一套流程的延遲是3秒?,F(xiàn)在,,使用TensorRT 7,我們可以對(duì)所有模型進(jìn)行編譯,,使其在NVIDIA GPU上運(yùn)行,。T4 GPU上推理會(huì)話AI只需要0.3秒。與在CPU上運(yùn)行時(shí)相比,,會(huì)話式AI組件速度提高了10倍以上,,從而將延遲降低到實(shí)時(shí)交互所需的300毫秒閾值以下。黃仁勛在主題演講中表示:“我們已進(jìn)入了一個(gè)機(jī)器可以實(shí)時(shí)理解人類語言的AI新時(shí)代,。TensorRT 7使這成為可能,為世界各地的開發(fā)者提供工具,,使他們能夠構(gòu)建和部署更快,、更智能的會(huì)話式AI服務(wù),從而實(shí)現(xiàn)更自然的AI人機(jī)交互,?!?/span>自主機(jī)器平臺(tái)DRIVE AGX Orin,全面助力L2-L5自動(dòng)駕駛本次發(fā)布平臺(tái)名為NVIDIA DRIVE AGX Orin,。內(nèi)置全新Orin系統(tǒng)級(jí)芯片,,晶體管數(shù)量達(dá)到170億個(gè),集成NVIDIA新一代GPU架構(gòu)和Arm Hercules CPU內(nèi)核以及全新深度學(xué)習(xí)和計(jì)算機(jī)視覺加速器,,每秒可運(yùn)行200萬億次計(jì)算,,幾乎是NVIDIA上一代Xavier系統(tǒng)級(jí)芯片性能的7倍。Orin可處理在自動(dòng)駕駛汽車和機(jī)器人中同時(shí)運(yùn)行的大量應(yīng)用和深度神經(jīng)網(wǎng)絡(luò),能夠支持從L2級(jí)到L5級(jí)完全自動(dòng)駕駛汽車開發(fā)的兼容架構(gòu)平臺(tái),,助力OEM開發(fā)大型復(fù)雜的軟件產(chǎn)品系列,。由于Orin和Xavier均可通過開放的CUDA、TensorRT API及各類庫(kù)進(jìn)行編程,,因此開發(fā)者能夠在一次性投資后使用跨多代的產(chǎn)品,。NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“打造安全的自動(dòng)駕駛汽車,也許是當(dāng)今社會(huì)所面臨的最大計(jì)算挑戰(zhàn),。實(shí)現(xiàn)自動(dòng)駕駛汽車所需的投入呈指數(shù)級(jí)增長(zhǎng),,面對(duì)復(fù)雜的開發(fā)任務(wù),像Orin這樣的可擴(kuò)展,、可編程,、軟件定義的AI平臺(tái)不可或缺?!?/span>Navigant Research首席研究分析師Sam Abuelsamid表示:“ NVIDIA對(duì)交通運(yùn)輸行業(yè)的長(zhǎng)期承諾,,以及其創(chuàng)新的端對(duì)端平臺(tái)和工具,已經(jīng)構(gòu)成了一個(gè)廣闊的生態(tài)系統(tǒng),。幾乎每家自動(dòng)駕駛汽車領(lǐng)域的企業(yè),,都在其計(jì)算堆棧中使用NVIDIA的解決方案。Orin可以看作是整個(gè)行業(yè)向前邁出的重要一步,,它將幫助我們?cè)谶@個(gè)技術(shù)不斷發(fā)展的行業(yè)中書寫新的篇章,。”NVIDIA DRIVE AGX Orin系列將包含一系列基于單一架構(gòu)的配置,,并將于2022年開始投產(chǎn),。新版Isaac軟件開發(fā)套件,為構(gòu)建自主機(jī)器統(tǒng)一平臺(tái)樹立里程NVIDIA發(fā)布全新版本Isaac軟件開發(fā)套件(SDK),,為機(jī)器人提供更新的AI感知和仿真功能,。Isaac SDK包括Isaac Robotics Engine(提供應(yīng)用程序框架),Isaac GEM(預(yù)先構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)模型,、算法,、庫(kù)、驅(qū)動(dòng)程序和API),,用于室內(nèi)物流的參考應(yīng)用程序以及Isaac Sim的第一個(gè)版本(提供導(dǎo)航功能),。為了加快AI機(jī)器人的開發(fā)速度,全新Isaac SDK包括各種基于攝像頭的感知深度神經(jīng)網(wǎng)絡(luò),。其中:- 對(duì)象檢測(cè)——識(shí)別用于導(dǎo)航,、交互或操控的對(duì)象
- 自由空間分割——檢測(cè)和分割外部世界,例如確定人行道在哪里,,以及機(jī)器人可以在哪里行駛
- 3D姿態(tài)估計(jì)——了解目標(biāo)的位置和方向,,從而實(shí)現(xiàn)諸如機(jī)械臂拾取物體的任務(wù)
- 2D人體姿態(tài)估計(jì)——將姿態(tài)估計(jì)應(yīng)用于人,,這對(duì)于與人互動(dòng)的機(jī)器人(例如配送機(jī)器人)和協(xié)作機(jī)器人(專門設(shè)計(jì)用于與人合作)非常重要
新版本引入了一項(xiàng)重要功能——使用Isaac Sim訓(xùn)練機(jī)器人,并將所生成的軟件部署到在現(xiàn)實(shí)世界中運(yùn)行的真實(shí)機(jī)器人中,。這有望大大加快機(jī)器人的開發(fā)速度,,從而實(shí)現(xiàn)綜合數(shù)據(jù)的訓(xùn)練。全新SDK也提供了多機(jī)器人仿真,。這使開發(fā)人員可以將多個(gè)機(jī)器人放入仿真環(huán)境中進(jìn)行測(cè)試,,以便它們學(xué)會(huì)彼此相關(guān)的工作。各個(gè)機(jī)器人可以在共享的虛擬環(huán)境中移動(dòng)時(shí),,運(yùn)行獨(dú)立版本的Isaac導(dǎo)航軟件堆棧,。全新SDK還集成了對(duì)NVIDIA DeepStream軟件的支持,該軟件廣泛用于處理分析功能,。開發(fā)人員可以在支持機(jī)器人應(yīng)用程序的邊緣AI部署DeepStream和NVIDIA GPU,,以實(shí)現(xiàn)對(duì)視頻流的處理。對(duì)于已經(jīng)開發(fā)了自己代碼的機(jī)器人開發(fā)人員,,全新SDK也能集成他們的工作,,并添加了基于C編程語言的新API。這使開發(fā)人員可以將自己的軟件堆棧連接到Isaac SDK,,并最大程度地減少編程語言轉(zhuǎn)換——為用戶提供通過C API訪問路由的Isaac功能,。全新Isaac SDK可以大大加快研究人員、開發(fā)人員,、初創(chuàng)企業(yè)和制造商開發(fā)和測(cè)試機(jī)器人的速度,。它使機(jī)器人能夠通過仿真獲得由人工智能技術(shù)驅(qū)動(dòng)的感知和訓(xùn)練功能,從而可以在各種環(huán)境和情況下對(duì)機(jī)器人進(jìn)行測(cè)試和驗(yàn)證,。這樣一來,,可以節(jié)省成本。可以說,,在建立統(tǒng)一的機(jī)器人開發(fā)平臺(tái)以實(shí)現(xiàn)AI,、仿真和操控功能方面,Isaac SDK邁出了重要的里程碑,。NVIDIA的GPU技術(shù)將為騰訊游戲的START云游戲服務(wù)賦力,,讓玩家可以隨時(shí)隨地,即使是在配置不足的設(shè)備上也能玩3A大作,。 NVIDIA個(gè)人電腦業(yè)務(wù)高級(jí)副總裁Jeff Fisher表示:“作為全球領(lǐng)先的游戲開發(fā),、發(fā)行和運(yùn)營(yíng)平臺(tái)之一,騰訊游戲?qū)?huì)推出出色的云游戲,。將騰訊平臺(tái)與NVIDIA的GPU技術(shù)相結(jié)合,,將為全球各地的游戲玩家提供世界級(jí)的體驗(yàn),。”騰訊游戲高級(jí)副總裁馬曉軼表示:“NVIDIA打造了全球最強(qiáng)大的GPU,,是GPU領(lǐng)域的領(lǐng)導(dǎo)者,,又具有云解決方案方面的經(jīng)驗(yàn),這兩大優(yōu)勢(shì)能夠幫助我們將START平臺(tái)擴(kuò)展到數(shù)百萬玩家,。今天對(duì)于我們公司來說是一個(gè)新的契機(jī),,我們將進(jìn)一步擴(kuò)大我們?cè)谟螒蚴袌?chǎng)的疆域?!?/span>NVIDIA和騰訊游戲還宣布成立一個(gè)游戲聯(lián)合創(chuàng)新實(shí)驗(yàn)室,。雙方將共同探索AI在游戲、游戲引擎優(yōu)化和新光照技術(shù)(包括光線追蹤和光線烘焙)中的新應(yīng)用,。另外,,NVIDIA和滴滴今日宣布,滴滴將使用NVIDIA GPU和其他技術(shù)開發(fā)自動(dòng)駕駛和云計(jì)算解決方案,,雙方在L4自動(dòng)駕駛合作,。滴滴將在數(shù)據(jù)中心使用NVIDIA GPU訓(xùn)練機(jī)器學(xué)習(xí)算法,并采用NVIDIA DRIVE為其L4級(jí)自動(dòng)駕駛汽車提供推理能力,。滴滴在8月將其自動(dòng)駕駛部門升級(jí)為獨(dú)立公司,,并與產(chǎn)業(yè)鏈合作伙伴開展廣泛合作。作為滴滴自動(dòng)駕駛AI處理的一部分,,NVIDIA DRIVE借助多個(gè)深度神經(jīng)網(wǎng)絡(luò)融合來自各類傳感器(攝像頭,、激光雷達(dá)、雷達(dá)等)的數(shù)據(jù),,從而實(shí)現(xiàn)對(duì)汽車周圍環(huán)境360度全方位的理解,,并規(guī)劃出安全的行駛路徑。NVIDIA自動(dòng)駕駛汽車副總裁Rishi Dhall表示:“不論是在云端還是汽車中,,開發(fā)安全的自動(dòng)駕駛技術(shù),,端到端的AI都不可或缺。借助NVIDIA的AI技術(shù),,滴滴將能夠開發(fā)更安全高效的交通運(yùn)輸系統(tǒng),,并提供豐富的云服務(wù)?!?/span>為了訓(xùn)練這些深度神經(jīng)網(wǎng)絡(luò),,滴滴將采用NVIDIA GPU數(shù)據(jù)中心服務(wù)器。在云計(jì)算方面,,滴滴還將構(gòu)建領(lǐng)先的AI基礎(chǔ)架構(gòu),,并推出計(jì)算型、渲染型和游戲型vGPU云服務(wù)器,。
|