懷揣著“讓世界聆聽我們的聲音”的夢想,,科大訊飛依托世界領(lǐng)先的核心技術(shù),,引領(lǐng)智能浪潮,服務(wù)億萬用戶,,從中國語音產(chǎn)業(yè)的拓荒者一躍成為世界人工智能產(chǎn)業(yè)的領(lǐng)軍者,,而最初科大訊飛把語音作為切入點(diǎn)卻是源于偶然…… 戳視頻,聽聽科大訊飛執(zhí)行總裁,、消費(fèi)者事業(yè)群總裁胡郁先生如何解讀,。 源于偶然:讓機(jī)器開口說話科大訊飛1999年成立的時(shí)候,手上只有一項(xiàng)技術(shù)就是語音技術(shù),,當(dāng)時(shí)的目標(biāo)是讓機(jī)器開口說話,。 胡郁笑談:
人類的智能相對于其他動物或者相對于機(jī)器,最重要的是認(rèn)知智能,,而認(rèn)知智能的主要來源是人類對語言的掌握和對知識的表達(dá),,然后在這個(gè)基礎(chǔ)上進(jìn)行邏輯推理和復(fù)雜的決策。以語音和語言為中心的認(rèn)知革命,,是人類智慧的最高水平,,也是現(xiàn)在人工智能所面臨的最大挑戰(zhàn)。 作為訊飛超腦的總牽頭人,,胡郁作出了這樣的詮釋:
當(dāng)前,,“訊飛超腦”利用大數(shù)據(jù)來進(jìn)行訓(xùn)練以提升相關(guān)算法,這其中的“訓(xùn)練”指代的并不是那種填鴨式的數(shù)據(jù)輸入和訓(xùn)練,,而是來自于真實(shí)應(yīng)用場景的真實(shí)交互數(shù)據(jù),,讓系統(tǒng)能夠依據(jù)真實(shí)數(shù)據(jù)實(shí)現(xiàn)自主學(xué)習(xí)和提升,胡郁稱之為漣漪效應(yīng),,就像水滴入水面產(chǎn)生的漣漪一樣,,隨著產(chǎn)品覆蓋面的不斷增加,數(shù)據(jù)量級也在快速攀升,,進(jìn)而帶來產(chǎn)品體驗(yàn)的快速優(yōu)化迭代,,這一切的背后都依賴于“訊飛超腦”這個(gè)強(qiáng)大的人工智能引擎。 科大訊飛在語音合成,、識別,、評測,翻譯等領(lǐng)域都擁有全球領(lǐng)先的核心技術(shù),。 2005年至2018年,,在全球最高水平的語音合成比賽Blizzard Challenge中,科大訊飛取得13連冠,,同時(shí)科大訊飛各項(xiàng)關(guān)鍵指標(biāo)均名列第一,。在國際機(jī)器翻譯評測IWSLT2014、NIST2015等大賽中科大訊飛連奪冠軍,。 在過去6年中,,科大訊飛的語音識別技術(shù)準(zhǔn)確率從60.2%提升到98%以上。語音技術(shù)上的優(yōu)勢為科大訊飛向人工智能發(fā)展,,同時(shí)落地行業(yè)與應(yīng)用打下良好的根基,。 訊飛在布局當(dāng)前的大數(shù)據(jù)人工智能的同時(shí),也在關(guān)心人工智能發(fā)展的另一方面,,即與人腦相結(jié)合,,基于類腦計(jì)算,,試圖找到人腦智能的奧秘,發(fā)現(xiàn)其中的智能動力學(xué),,進(jìn)而真正讓機(jī)器具備像人一樣的智能,,同時(shí)不受人腦物理空間的局限,以此來實(shí)現(xiàn)人工智能領(lǐng)域真正的突破,。 訊飛翻譯機(jī),,出境游so easy科大訊飛是真正把人工智能的應(yīng)用落地了。在2010年,,科大訊飛開發(fā)了世界上第二個(gè),、中國第一個(gè)語音輸入法,僅次于谷歌,,訊飛輸入法主打語音輸入,,語音識別準(zhǔn)確率超98%,同時(shí)支持22種方言的語音輸入,。 在2016年,,科大訊飛發(fā)布了第一個(gè)智能終端產(chǎn)品訊飛翻譯機(jī)。 2018年4月又推出了訊飛翻譯機(jī)2.0,,主打中文與33種語言實(shí)時(shí)互譯,、方言翻譯和拍照翻譯,并獨(dú)家具備4G,、Wi-Fi和離線翻譯模式。 翻譯機(jī)86%的用戶用于出境游,??紤]到用戶可能不會使用標(biāo)準(zhǔn)普通話,訊飛翻譯機(jī)同時(shí)搭載了方言和帶方言口音非標(biāo)準(zhǔn)普通話的識別能力,,目前已支持粵語,、四川話、東北話,、河南話四大方言,。 方言種類還在持續(xù)增加中,并能根據(jù)用戶的不同使用場景與用詞習(xí)慣,,準(zhǔn)確識別并給出最符合語境的翻譯結(jié)果,,真正做到了落地實(shí)用?!翱梢哉f,,訊飛翻譯機(jī)2.0是至今世界上銷量最好、好評度最高的手持式智能翻譯系統(tǒng),?!?/p> 為了構(gòu)建未來人工智能產(chǎn)業(yè)生態(tài)體系,,在2010年訊飛發(fā)布了語音云平臺。目前平臺上的開發(fā)者已經(jīng)超過86萬,,連接19億設(shè)備,,每日提供近46億次交互服務(wù),數(shù)以百萬計(jì)的開發(fā)者正在借助科大訊飛的核心技術(shù)開發(fā)智能產(chǎn)品,,服務(wù)于人們生活的方方面面,。 2015年,科大訊飛進(jìn)一步發(fā)布了對人工智能產(chǎn)業(yè)具有里程碑意義的人機(jī)交互界面——AIUI,,重新定義了萬物互聯(lián)時(shí)代的人機(jī)交互標(biāo)準(zhǔn),。胡郁說道:
賦能公檢法,、教育等傳統(tǒng)行業(yè)智能語音和人工智能技術(shù)對傳統(tǒng)行業(yè)賦能方面,,科大訊飛也做了很多嘗試,例如公檢法,、教育等行業(yè),。 在公檢法領(lǐng)域,科大訊飛通過與最高法,、最高檢開展創(chuàng)新合作,。2016年在安徽開展的測試顯示,人工智能判斷詐騙電話的準(zhǔn)確率極高,;人工智能還充當(dāng)起法庭書記員,,經(jīng)測試,智能語音識別參與庭審取得實(shí)際效果,,庭審時(shí)長縮短30%,。 在教育領(lǐng)域,人工智能在“改卷子”方面的能力就超乎了人們的想象,。 在江蘇省的高考智能閱卷驗(yàn)證中,,兩個(gè)不同的人工智能語文作文閱卷分差小于7分,一致率達(dá)92.82%,,比兩位老師的閱卷評分的一致率高出5%以上,。 在湖南省研究生考試的智能閱卷驗(yàn)證中,兩個(gè)不同的人工智能分別對英語作文進(jìn)行閱卷評分,,分差小于6分的一致率竟高達(dá)99.83%,,比兩位老師的閱卷評分一致率高出了4%以上。 胡郁表示,,教育部考試中心正聯(lián)合科大訊飛建設(shè)人工智能聯(lián)合實(shí)驗(yàn)室,,在教育領(lǐng)域醞釀著更多“黑科技”的誕生,。 共建AI未來科大訊飛與華為公司始終保持著緊密合作,雙方充分依托各自行業(yè)領(lǐng)域的長期積淀優(yōu)勢,,在電信平臺,、智能終端等領(lǐng)域建立了戰(zhàn)略合作關(guān)系,攜手推動語音及人工智能技術(shù)的深入應(yīng)用,。 雙方合作在2010年建立了世界上第一個(gè)中文語音的開放云平臺,。云計(jì)算能力開放以后,眾多公司和開發(fā)者可以面向最終用戶的各種需求,,開發(fā)各種各樣的產(chǎn)品,,這就形成了生態(tài)的建設(shè)。 2018年5月,,華為與科大訊飛簽署戰(zhàn)略合作協(xié)議,,未來雙方將在公有云服務(wù)、ICT基礎(chǔ)設(shè)施產(chǎn)品,、智能終端,、以及辦公I(xiàn)T四大領(lǐng)域開展深度戰(zhàn)略合作。 雙方還將面向未來開發(fā)創(chuàng)新AI語音應(yīng)用,,拓展全新行業(yè)市場,,做大規(guī)模共享收益,共同做強(qiáng)人工智能產(chǎn)業(yè)生態(tài),。 對于消費(fèi)者市場,,華為手機(jī)使用的技術(shù)中,有一部分是源于科大訊飛的智能語音技術(shù)加持,。華為手機(jī)還將科大訊飛的AI技術(shù)和能力內(nèi)化為華為手機(jī)能力的一部分,,為其帶來差異化的競爭優(yōu)勢。 雙方將基于科大訊飛的語音識別,、語音合成、訊飛聽見,、訊飛翻譯等語音AI技術(shù)和能力,,圍繞手機(jī)等智能終端產(chǎn)品以及終端云服務(wù)進(jìn)行合作。 對于2B市場,,華為在基礎(chǔ)設(shè)施,、內(nèi)部辦公產(chǎn)品等使用科大訊飛的技術(shù)與產(chǎn)品,雙方將基于訊飛引擎和華為云資源,,共同構(gòu)筑華為云EI平臺,。 面向未來+智能的時(shí)代,胡郁認(rèn)為將來的人工智能都要在云上實(shí)現(xiàn),。由于云計(jì)算的資源消耗比較大,,將來有可能會在端計(jì)算和邊緣計(jì)算上實(shí)現(xiàn)更好的人工智能,,也許很快成為技術(shù)上的突破口。人工智能的應(yīng)用也會更多地落地,,真正解決問題,。 我們有理由相信,未來華為和訊飛可以更好地依托自身優(yōu)勢,,結(jié)合產(chǎn)業(yè)發(fā)展,,共同推動人工智能生態(tài)體系的建設(shè),為未來的AI生活增光添彩,。 |
|