作者 | 楊麗 出品 | AI科技大本營 2015 年,,有投資人跟云知聲創(chuàng)始人/ CEO 黃偉說:“老黃啊,你要專注賽道,,做好語音識別就夠了,。” 不過,,他并沒有聽,。“人工智能必須實現(xiàn)云,、端,、芯的一體化”,這個念頭已經(jīng)在他的腦中縈繞了近兩年,。 這一年,,黃偉組建了芯片團隊。 不僅公司內(nèi)部,,就連業(yè)內(nèi)同行多數(shù)投來了不理解的目光,。“一個做軟件的,,搞什么芯片,?” 2018 年 5 月 16 日,,云知聲發(fā)布了第一代 UniOne 物聯(lián)網(wǎng) AI 芯片“雨燕”及解決方案,并且有望在下月實現(xiàn)量產(chǎn),。在這 5 天前,,他們剛剛拿到資本 1 億美元的 C 輪融資。 年初,,中興事件的發(fā)酵,,掀起了科技界的一股造“芯”熱。不少人幡然醒悟,。半年間,不少創(chuàng)業(yè)公司,,紛紛號稱要做自己的芯片,。 AI 科技大本營統(tǒng)計發(fā)現(xiàn),綜合了國內(nèi)多家已發(fā)布的人工智能榜單數(shù)據(jù),,截止到目前,,國內(nèi)公開可查的 50 家主流 AI 創(chuàng)業(yè)公司中,宣布已經(jīng)“推出 AI 芯片或芯片模組”的至少有 8 家,。 這批有著激進時間表的公司大多在當前各自領(lǐng)域占據(jù)了一定優(yōu)勢地位,。有的很早就開始著手 AI 芯片的研發(fā),有的才剛剛推出芯片模組,。 在近日創(chuàng)業(yè)黑馬的 AI 獨角獸評選活動上,,與云知聲站同一登臺亮相的還有寒武紀、地平線,、出門問問,、思必馳…… 他們不約而同盯上的,正是芯片,。為何一定要造芯,? ▌場景定義芯片 人工智能芯片這個賽道上,GPU 成為 AI 芯片代名詞,,F(xiàn)PGA,、ASIC 日受青睞。目前,,老牌芯片巨頭英偉達,、AMD、英特爾,、高通等扮演著主要角色,。 而云知聲做的則是針對 IoT 場景下的全棧式終端芯片,這也決定了其“云端芯”概念的定位,。 “當時我們講的‘云端芯’,,‘云’是云端服務(wù)資源的聚合,;‘端’是不同設(shè)備終端的交互;‘芯’是一種泛芯片,,不是一個獨立的芯片,。所以,我們第一代產(chǎn)品也是通過若干個芯片來實現(xiàn)一個功能,。而語音交互是一個非常復雜的鏈路過程,,在過去,一個芯片只能實現(xiàn)一個功能,。所以,,為了實現(xiàn)語音交互這種能力,需要將若干芯片配湊在一起,?!秉S偉講到。 因此,,彼時的云知聲選擇了諸如高通,、全志等廠家的芯片,再將自己的算法融入進去,,構(gòu)建 AI 芯片模組,。 不過,“AI 不會只發(fā)生在云端,,一定有邊緣智能,,而且想要滲入到每個場景,對端一定會提出很多個性化的需求,?!边@個想法的推動下,以 2015 年成立芯片團隊后,,云知聲走上了自研芯片的道路,,并于今年 1 月成功流片。 黃偉認為:“無論是 CPU,、GPU 還是 FPGA,,現(xiàn)有的芯片架構(gòu)并非為 AI 專門設(shè)計,并不能滿足 IoT AI 算力的需求,?!毖邪l(fā)芯片是需要規(guī)模化地使用算力,,衡量一個芯片最主要的標準,,就是看它能不能大規(guī)模的出貨。 清華大學微電子所魏少軍教授表示:“做語音芯片一定要看應(yīng)用場景,,目前很多場景下并不需要用到人工智能技術(shù)或者專門的語音芯片,?!?/span> 這個問題同樣也拷問著黃偉。 他認為:“未來 AI 可能會融入到每一個場景,,只是說需要的能力不太一樣,。關(guān)鍵是,AI 是一種能力,,可能未來所有場景都需要 AI,,只是說哪些先被 AI 賦能而已?!?/span> 那么,,這個未來又有多遠呢? ▌是做眼前的生意,,還是未來的機會 據(jù)最新資料顯示,,云知聲已在智慧生活(家居、車載,、機器人等)和智慧服務(wù)(醫(yī)療、教育,、司法等)等場景有所布局,,其合作伙伴數(shù)量超過 2 萬家,覆蓋用戶超過 2 億,,云平臺日調(diào)用量 4 億次,。 其實,不少創(chuàng)業(yè)公司在以上領(lǐng)域均有業(yè)務(wù)布局的交叉,,且彼此均占有不小的市場份額,,可以說市場競爭相當激烈。那么,,“這就在于一個判斷,,你是想做未來的機會,還是眼前的生意,。首先,,一定要選擇一個自己比較有競爭優(yōu)勢的行業(yè),比如,,這個行業(yè)比較新,,還未形成壟斷的壁壘。我們會選擇當下比較困難,,但未來是有機會點的領(lǐng)域,。” 談及未來,,黃偉表示:沒有任何一個企業(yè)的創(chuàng)始人在創(chuàng)業(yè)早期就能確定一個很明確的商業(yè)模式,,而且明確自己以后一定能夠成功。商業(yè)模式是不斷地試錯,、修正的,。很多上市公司,上市時的商業(yè)模式和它成立時的戰(zhàn)略是不一樣的,。 所以,,回到自己身上,“目前我們?nèi)蕴幵谙M紦?jù)更多的設(shè)備,、服務(wù)更多的用戶,,然后產(chǎn)生更多的數(shù)據(jù)這個階段。如果你有用戶和流量了,,你未來一定是有價值的,。” 對于盈利,,黃偉頗為自信,他認為這個時間點將很快來臨,?!耙灾悄芤粝錇槔?,2017 年雙十一之后的季度出貨量基本在 100 萬臺,而 2018 年這個數(shù)字有望上升到 1000 萬臺,。這個反映出:IoT 的市場和起步速度在增長,。此外,企業(yè)對這個領(lǐng)域的研發(fā)投入正在增加,?!?/span> ▌數(shù)據(jù)很重要,但不是最決定性的 對于在 2012 年 11 月就發(fā)布了的深度學習框架,,黃偉是非常自信的,。 網(wǎng)上流傳著這樣一個故事:
深度學習在于需要大量的數(shù)據(jù)進行訓練,很快,,云知聲就發(fā)布了自己的“語音識別公有云”,,短短不過一年,平臺上就已經(jīng)有 1000 名開發(fā)者加入,。利用開發(fā)者以聯(lián)動各家 App,,將收集的用戶的語音數(shù)據(jù)快速集中到平臺上,以加強自身模型的訓練,。 目前,,云知聲已形成了“金字塔”式的技術(shù)架構(gòu),底層是 DeepFlow 集群,;中間層是 Atlas 超算平臺,,將統(tǒng)計學習和深度學習里的通用算法抽樣出來;頂層是應(yīng)用層技術(shù),,如有 ASR,、TTS、NLU,、NMT 等應(yīng)用層技術(shù)的輸出,。 值得一提的是,數(shù)據(jù)積累到一定程度后,,海量數(shù)據(jù)帶來的紅利會越來越少。如語音識別,,數(shù)據(jù)量從 1 萬小時增長到 10 萬小時,,準確率會提高 1%~2%,但這差別應(yīng)該不是很大,。如果此時還僅靠深度學習技術(shù)按照傳統(tǒng)的方式訓練數(shù)據(jù),,基本很難樹立更高的技術(shù)壁壘。 黃偉表示贊同,,但他認為,,在 AI 的能力里面,數(shù)據(jù)很重要,,但數(shù)據(jù)只是能力之一,,不是最決定性的?!鞍l(fā)布深度學習框架之前,,我們的統(tǒng)計模型是基于統(tǒng)計學習的,就是用結(jié)構(gòu)化模型去描述復雜物理世界的一些問題。當時,,對我們來說,,幾百小時和幾千小時的差距不會特別大,甚至比科大訊飛的準確性還要高,?!?/span> ▌現(xiàn)階段,以技術(shù)推動產(chǎn)品 人工智能領(lǐng)域,,目前仍然具有較高的行業(yè)門檻,,這也隨之拉大了企業(yè)之間的競爭激烈性,而 AI 專業(yè)人才尤其是有相關(guān)項目研發(fā)經(jīng)驗的人才更是屈指可數(shù),。除了從各大技術(shù)公司挖角外,,創(chuàng)業(yè)公司也紛紛開始創(chuàng)辦自己的 AI 研究院,以擴充自身人才,,加強技術(shù)壁壘,。 2015 年底,云知聲成立了 Unisound AI Labs,,匯集了從語音,、語義、機器學習,、超算等各個技術(shù)方向的人才,。截止目前,團隊人數(shù)已近百人,,博士生幾乎占到一半,。 談到如何進行人才管理和設(shè)計總體的未來路線圖,黃偉表示:“AI Labs 是不需要管理的,,技術(shù)人的自制力本身很強,。難的是在于如何去建設(shè)、招攬人才,。錢絕對不是第一位,,他們看重的是能否在團隊里獲得成長?!?/span> 實際上,,這個團隊是為產(chǎn)品服務(wù)的,并非純研究的團隊,。目前云知聲也開始從產(chǎn)品驅(qū)動技術(shù)的階段向技術(shù)定義產(chǎn)品的階段過渡,。也就是說,“研究院應(yīng)該提供一些更具前瞻性的技術(shù)能力,,一種產(chǎn)品原型,,用原型去驅(qū)動市場。以技術(shù)推動產(chǎn)品,這才是一個真正有創(chuàng)新力的技術(shù)公司應(yīng)該做的事情,?!彼詈筇岬健?/span> ▌定位決定了你的挑戰(zhàn) 據(jù)AI科技大本營了解,,除了云知聲5月成功推出 AI 芯片 UniOne之外,,云天勵飛、出門問問,、Rokid,、思必馳也暗暗籌謀自己的“芯片”。說起來,,這幾家企業(yè)并非研發(fā)芯片出身,。 為什么敢做芯片?黃偉這樣解釋:“在 IoT 這個場景里面,,算法起的作用比較大,,而且它也不追求芯片的制成。這種芯片是放置在冰箱,、音箱中的,,可以理解成:用人工智能最領(lǐng)先的算法和芯片行業(yè)一年前的能力相結(jié)合,就可以滿足這個行業(yè)產(chǎn)品的需要,。所以,,芯片設(shè)計本身不構(gòu)成我們今天最大的問題?!?/span> 但與寒武紀,、地平線相比,“它們對標的是英偉達,,這是高端芯片,,這種比拼更像一種軍備賽。他們可能也會考慮商業(yè)層面的成本,、價格功耗等問題,但最優(yōu)先級的一定是計算能力,?!?/span> 放在自然語義理解這個領(lǐng)域,目前對于整個行業(yè)來說均未取得一個比較明顯的效果,。在他看來,,主要有以下三點因素:
對于云知聲來說,黃偉坦言:“在理論框架真正得到一個大幅度的改善之前,,我認為唯一能做的就是在場景里把它做到最優(yōu),。能夠把產(chǎn)品的用戶需求摸透,把數(shù)據(jù),、用戶體驗和技術(shù)很好的匹配起來,。” |
|