技術(shù)的暴力美學(xué),,落地的人本主義,。 @科技新知 原創(chuàng) 作者丨古廿 編輯丨伊頁 3月15日,OpenAI推出GPT4,,進(jìn)一步更新的AI能力,,引發(fā)大模型的海嘯狂飆。 當(dāng)大多數(shù)人談大模型時(shí),,往往會(huì)從技術(shù)視角去預(yù)設(shè)未來的可能性,,甚至引發(fā)文明是否將從碳基文明轉(zhuǎn)向硅基文明的大討論。 不過隨著討論的深入,就會(huì)發(fā)現(xiàn)大模型也是按照人類學(xué)習(xí)語言的模式進(jìn)行發(fā)展的,。不同角度,、不同視野下,能否穿透大模型百家狂飆的海嘯,,找到技術(shù)風(fēng)暴中的踏浪點(diǎn),,決定了企業(yè)能否抓住甚至引領(lǐng)開拓大模型的無限可能性。 5月6日,,科大訊飛在安徽合肥發(fā)布星火認(rèn)知大模型,。科大訊飛董事長劉慶峰,、研究院院長劉聰現(xiàn)場實(shí)測大模型七大核心能力,,并發(fā)布教育、辦公,、汽車,、數(shù)字員工四大行業(yè)應(yīng)用成果。 在這場發(fā)布會(huì)上,,從技術(shù)到落地,,科大訊飛由內(nèi)向外展示了中國企業(yè)探索大模型的自信力。 01 對(duì)于大模型的出現(xiàn),,人們常常喜歡用暴力美學(xué)來形容誕生于“大數(shù)據(jù)+大算力+強(qiáng)算法”的范式主義,。 但是技術(shù)的暴力美學(xué)僅僅只是大模型智慧涌現(xiàn)的結(jié)果,所謂暴力美學(xué)的實(shí)現(xiàn),,核心是建立在確定的方向和長期的技術(shù)投入中,。從這個(gè)角度來看,發(fā)布引領(lǐng)行業(yè)的AI大模型,,一定程度上是科大訊飛技術(shù)發(fā)展的必然,。 通常來說,人工智能大致可以分為:感知智能,、認(rèn)知智能,、運(yùn)動(dòng)智能三個(gè)階段,分別對(duì)應(yīng)的能力是:聽說能力,、推演學(xué)習(xí),、智能執(zhí)行。 不妨來看看科大訊飛如何走過這三個(gè)發(fā)展階段,。時(shí)間回到2011年,,彼時(shí)科大訊飛提出讓機(jī)器人像人一樣能說會(huì)聽,同時(shí)承建了語音及語言信息處理國家工程實(shí)驗(yàn)室,。 當(dāng)時(shí)看起來不大不小的一件事,,為今天星火認(rèn)知大模型打下感知智能的基礎(chǔ)條件,。 有了感知智能的基礎(chǔ),2014年科大訊飛又推出“訊飛超腦計(jì)劃”,,明確提出:讓機(jī)器人像人一樣能理解會(huì)思考,,成為科大訊飛踏入人工智能第二階段的開端。 作為認(rèn)知智能階段的技術(shù)雛形,,訊飛超腦發(fā)布之初,,就選擇使用深度神經(jīng)網(wǎng)絡(luò)、大數(shù)據(jù)和漣漪效應(yīng)三大技術(shù)路徑,。其中深度神經(jīng)網(wǎng)絡(luò)是當(dāng)前各類大模型AI算法的基礎(chǔ),大數(shù)據(jù)和漣漪效應(yīng)后來不斷發(fā)展為數(shù)據(jù)標(biāo)注,、無監(jiān)督學(xué)習(xí)等大模型AI的必備技術(shù),。 2022年,科大訊飛又推出“訊飛超腦2030計(jì)劃”,,提出讓懂知識(shí),、善學(xué)習(xí)、能進(jìn)化的通用人工智能技術(shù)成為每個(gè)人未來發(fā)展的重要機(jī)會(huì),。 按照規(guī)劃,,在2023年—2025年的項(xiàng)目中期,訊飛將在此前軟硬一體機(jī)器人的形態(tài)基礎(chǔ)上推出能夠自適應(yīng)行走的外骨骼機(jī)器人與家庭服務(wù)機(jī)器人,。 這類產(chǎn)品在形態(tài)逐漸接近人形,,能夠模仿人類完成更多工作,實(shí)現(xiàn)更多的智能執(zhí)行能力,,為人工智能第三階段的產(chǎn)品爆發(fā)積蓄實(shí)力,。 技術(shù)路徑的選擇規(guī)劃僅僅只是方向,想要出成果,,還需要長期的資源投入,。在基礎(chǔ)硬件資源儲(chǔ)備方面,得益于訊飛超腦的訓(xùn)練,,在大模型浪潮來臨前,,科大訊飛就已經(jīng)布局了長期算力儲(chǔ)備。 同時(shí)位于合肥總部的科大訊飛數(shù)據(jù)中心,,在工程技術(shù)方面能實(shí)現(xiàn)百億參數(shù)大模型推理效率的近千倍加速,。這也是使其大模型能夠真正落地,并快速實(shí)現(xiàn)規(guī)?;瘧?yīng)用的基礎(chǔ),。 技術(shù)儲(chǔ)備的扎實(shí)力,來自于科大訊飛真金白銀投入,。 數(shù)據(jù)顯示,,在去年,,科大訊飛用于研發(fā)上的投入高達(dá)33.6億元,同比提升14.28%,,研發(fā)投入占營收的比例為17.83%,。一年的投入只是冰山一角,得益于長期大手筆資源投入的積累,,早在2021年科大訊飛就已經(jīng)在全球126個(gè)國家拿下3234項(xiàng)獨(dú)家專利,。 科大訊飛還摘獲了一系列與大模型技術(shù)相關(guān)的獎(jiǎng)項(xiàng),包括但不限于:世界頂級(jí)人工智能挑戰(zhàn)賽Open Graph Benchmark(OGB),、常識(shí)推理挑戰(zhàn)賽CommonsenseQA 2.0,、國際語義評(píng)測大賽(The 16th International Workshop on Semantic Evaluation, SemEval 2022)、國際口語機(jī)器翻譯評(píng)測比賽(IWSLT)…… 技術(shù)積累只是AI底座,,如何將這些技術(shù)能力全面發(fā)揮出來,,在于系統(tǒng)主義的工程方法論。 正如科大訊飛董事長劉慶峰所說:“我們要向OpenAI致敬和學(xué)習(xí),,同時(shí)也要快速追趕并努力超越,,而這需要一套科學(xué)系統(tǒng)的評(píng)測體系?!?/span> 作為人工智能“國家隊(duì)”之一,,科大訊飛通過認(rèn)知智能全國重點(diǎn)實(shí)驗(yàn)室牽頭設(shè)計(jì)了通用認(rèn)知大模型評(píng)測體系,并與中科院人工智能產(chǎn)學(xué)研創(chuàng)新聯(lián)盟和長三角人工智能產(chǎn)業(yè)鏈聯(lián)盟共同探討形成了覆蓋7大類481個(gè)細(xì)分任務(wù)類型,。 得益于技術(shù)底座的實(shí)力和工程方法論的系統(tǒng)能力,,據(jù)了解,在文本生成和數(shù)學(xué)能力上,,星火認(rèn)知大模型已經(jīng)國內(nèi)顯著領(lǐng)先,,且相比ChatGPT也具有一定優(yōu)勢;在語言理解和知識(shí)問答方面也達(dá)到接近ChatGPT水平,,處于國內(nèi)領(lǐng)先水平,。 厚積薄發(fā)的技術(shù)能力,也讓整場發(fā)布會(huì)底氣十足,。不僅AI演示現(xiàn)場實(shí)測互動(dòng),,同時(shí)科大訊飛公布大模型年內(nèi)三次升級(jí)時(shí)間點(diǎn),10月底將整體趕超ChatGPT,。后續(xù)還將聯(lián)合開發(fā)者推動(dòng)大模型應(yīng)用落地,,共建人工智能“星火”生態(tài)。 富有節(jié)奏感的進(jìn)度表背后,,正是科大訊飛進(jìn)擊人工智能新賽道的決心與恒心,。 02 在這樣一個(gè)巨變的時(shí)代,面對(duì)AI技術(shù)大爆炸的科技周期,,科大訊飛正在用自己的技術(shù)積累,,成長為推動(dòng)中國大模型生長的重要引擎,。 當(dāng)大模型的科技浪潮來臨,雖然先進(jìn)的技術(shù)往往是改造一切的起點(diǎn),,但這場變革不僅僅只是技術(shù)的,,同時(shí)也是社會(huì)的、商業(yè)的和人文的,,最終更強(qiáng)調(diào)的是以人為中心,,多場景下的智慧涌現(xiàn)。 因此,,在發(fā)布會(huì)上,,圍繞星火大模型,科大訊飛帶來了更多的生態(tài)場景建設(shè)和開放賦能的落地能力,。 在場景建設(shè)方面,,生態(tài)的共建,往往來自于組織者的引領(lǐng)能力,。 作為“星火”生態(tài)的主導(dǎo)者,一場圍繞自身生態(tài)產(chǎn)品的大模型落地場景率先在發(fā)布會(huì)上亮相,。首先在教育領(lǐng)域,,“大模型+AI學(xué)習(xí)機(jī)”,讓AI像老師一樣批改作文,,像口語老師一樣實(shí)景對(duì)話,。 相比于傳統(tǒng)學(xué)習(xí)機(jī)只能針對(duì)字詞標(biāo)點(diǎn)糾錯(cuò)、識(shí)別句式修辭錯(cuò)誤這些基礎(chǔ)批改,,訊飛AI學(xué)習(xí)機(jī)可以圍繞寫作要求分析全篇結(jié)構(gòu)和文采,,實(shí)現(xiàn)深度高階批改。在口語對(duì)話方面,,陪伴式對(duì)話練習(xí),,幫助孩子擺脫啞巴英語,提升口語表達(dá)能力,。 在辦公行業(yè),,“大模型+智能辦公本”,針對(duì)口語稿閱讀困難,、紀(jì)要整理耗費(fèi)精力,、已有素材難成稿、長篇章難抓要點(diǎn)等痛點(diǎn),,搭載大模型技術(shù)的訊飛智能辦公本可以輕松將一篇語音轉(zhuǎn)寫文稿規(guī)整成書面化內(nèi)容,,使用戶的閱讀效率提升50%。 “大模型+訊飛聽見”,,輸入音頻錄音后,,除了能夠?qū)崿F(xiàn)語音轉(zhuǎn)文字外,,訊飛聽見還能通過AI分析文字內(nèi)容,一鍵生成全文摘要,、宣傳稿件等多種文本,。還可以針對(duì)原文件內(nèi)容,進(jìn)行AI對(duì)話提問溯源,。 此外還有訊飛智能錄音筆,、訊飛智能麥克風(fēng)等辦公產(chǎn)品結(jié)合星火大模型的相關(guān)功能也在快速落地中,推動(dòng)智慧辦公邁入全新階段,。 結(jié)合已有的硬件生態(tài)落地大模型應(yīng)用,,只是圍繞星火認(rèn)知大模型“1+N”架構(gòu)中的一部分。 在外部合作領(lǐng)域,,科大訊飛還發(fā)布了大模型在汽車,、數(shù)字員工等多個(gè)方向的行業(yè)應(yīng)用成果?!按竽P?智能座艙”,,實(shí)現(xiàn)車內(nèi)跨業(yè)務(wù)、跨場景人車自由交流,;“大模型+數(shù)字員工”,,幫助企業(yè)員工完成大量重復(fù)性工作。 除了上述領(lǐng)域外,,未來訊飛星火認(rèn)知大模型還將賦能包括醫(yī)療,、城市、政法,、工業(yè)等在內(nèi)的更多行業(yè),,滿足更多專業(yè)領(lǐng)域的需求,向更廣闊的產(chǎn)業(yè)領(lǐng)域延伸,。 正如訊飛董事長劉慶峰所強(qiáng)調(diào)的:“今天要看一個(gè)大模型系統(tǒng)到底好不好,,首先要看它是不是能解決剛需、是不是真的有用,,而不是一個(gè)簡單的單點(diǎn)測試,。” 技術(shù)上的長期主義和產(chǎn)品上的以人為本,,正在成為科大訊飛在大模型賽道上越跑越快的自信力,。 未來,科大訊飛計(jì)劃將這種自信力,,通過能力開放,、插件開放、行業(yè)共創(chuàng),,傳遞給更多的企業(yè),。 科大訊飛認(rèn)為,,人工智能的發(fā)展絕不是單個(gè)企業(yè)和單個(gè)科研機(jī)構(gòu)的事情,而是需要大家合作共贏的,。 首批來自36個(gè)行業(yè)的3000余家企業(yè)開發(fā)者將接入星火大模型,,進(jìn)一步推動(dòng)科大訊飛聯(lián)合各行業(yè)合作伙伴共建大模型“星火”生態(tài),與生態(tài)伙伴一起,,燎原新一輪產(chǎn)業(yè)變革,。 接下來,科大訊飛還將進(jìn)一步在智慧教育,、智慧辦公,、智慧城市、智慧醫(yī)療等領(lǐng)域推動(dòng)大模型應(yīng)用場景落地,,并且將一個(gè)個(gè)單點(diǎn)技術(shù)集合起來形成平臺(tái),,持續(xù)讓更多企業(yè)、用戶受益,。 顯然能夠引領(lǐng)大模型的企業(yè),,一定不能僅僅去崇拜現(xiàn)有的技術(shù),而是要突破現(xiàn)有的技術(shù),,建立自己的AI生態(tài),。只有堅(jiān)信自己的技術(shù)路線,關(guān)注用戶的痛點(diǎn),,不斷自我更新,才能見到效果,。 正是長期堅(jiān)定AI賽道,,堅(jiān)定布局、踏實(shí)前進(jìn),、長期主義,,科大訊飛才可以快速打造出技術(shù)實(shí)力領(lǐng)先的國產(chǎn)大模型,并邁出了“在中國率先實(shí)現(xiàn)智慧涌現(xiàn)”這一堅(jiān)實(shí)的步伐,。 |
|