配圖來(lái)自Canva可畫(huà) 近兩年,,小雀斑,、柳夜熙,、AYAYI等大量網(wǎng)紅數(shù)字人的相繼出現(xiàn),,以及虛擬數(shù)字技術(shù)在《指環(huán)王》和《阿凡達(dá)》以及《刺殺小說(shuō)家》等電影中的廣泛應(yīng)用,還有北京冬奧會(huì)期間數(shù)字人在手語(yǔ)解說(shuō),、節(jié)目直播等眾多場(chǎng)合亮相,,使得公眾對(duì)數(shù)字人的認(rèn)知上升到了一個(gè)新的臺(tái)階。 作為數(shù)字經(jīng)濟(jì)的重要環(huán)節(jié),,數(shù)字人為數(shù)字經(jīng)濟(jì)的發(fā)展注入了新的動(dòng)能,。于是,各個(gè)行業(yè)企業(yè)便涌現(xiàn)出了多個(gè)玩家,,紛紛基于已有的相關(guān)技術(shù)和業(yè)務(wù)基礎(chǔ),,開(kāi)始進(jìn)軍數(shù)字人賽道,數(shù)字人行業(yè)也由此迎來(lái)了一波新的發(fā)展熱潮,。 數(shù)字人乘風(fēng)而起 隨著數(shù)字人在各行各業(yè)中的應(yīng)用越來(lái)越廣泛,,國(guó)內(nèi)數(shù)字人市場(chǎng)規(guī)模也在持續(xù)穩(wěn)步增長(zhǎng)。根據(jù)IDC在《中國(guó)AI數(shù)字人市場(chǎng)現(xiàn)狀與機(jī)會(huì)分析2022》報(bào)告中預(yù)計(jì),,到2023年中國(guó)AI數(shù)字人市場(chǎng)規(guī)模將達(dá)102.4億元,。而數(shù)字人市場(chǎng)之所以將呈現(xiàn)高速增長(zhǎng)的態(tài)勢(shì),則與三大利好不無(wú)關(guān)系,。 從政策層面來(lái)看,,國(guó)家政策的大力支持,預(yù)示著數(shù)字人的前景一片大好。近年來(lái),,國(guó)內(nèi)虛擬現(xiàn)實(shí)相關(guān)產(chǎn)業(yè)備受外界關(guān)注,,自2016年起,國(guó)家就發(fā)布了多項(xiàng)政策支持我國(guó)虛擬現(xiàn)實(shí)產(chǎn)業(yè)的發(fā)展,,并將虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)與云計(jì)算,、大數(shù)據(jù)、物聯(lián)網(wǎng),、工業(yè)互聯(lián)網(wǎng),、區(qū)塊鏈、人工智能一起列為了數(shù)字經(jīng)濟(jì)重點(diǎn)產(chǎn)業(yè),。而虛擬數(shù)字人作為虛擬現(xiàn)實(shí)產(chǎn)業(yè)重要的應(yīng)用之一,,自然也有望享受到政策利好所帶來(lái)的紅利釋放期。 從技術(shù)層面來(lái)看,,數(shù)字技術(shù)的融合發(fā)展,驅(qū)動(dòng)了數(shù)字人進(jìn)入發(fā)展快車(chē)道,。其實(shí)數(shù)字人出現(xiàn)的時(shí)間并不算晚,,只是受技術(shù)應(yīng)用水平的限制,早期的數(shù)字人制作周期長(zhǎng)且成本高,。而近幾年,,隨著CG、語(yǔ)音合成,、深度學(xué)習(xí)算法,、自然語(yǔ)言處理等技術(shù)的進(jìn)步,數(shù)字人各環(huán)節(jié)制作周期大大縮短,、制作成本明顯降低,,數(shù)字人制作也走向了智能化。堅(jiān)實(shí)的技術(shù)基礎(chǔ),,不僅創(chuàng)新了數(shù)字人行業(yè)的發(fā)展應(yīng)用,,更是加速了數(shù)字人場(chǎng)景化的應(yīng)用落地。 從環(huán)境層面來(lái)看,,AIGC技術(shù)的逐漸成熟,,助力了數(shù)字人行業(yè)規(guī)模的拓展。數(shù)字人雖然最初多應(yīng)用于影視,、游戲等行業(yè),,但隨后應(yīng)用場(chǎng)景將會(huì)不斷拓展。只不過(guò),,越復(fù)雜的環(huán)境對(duì)數(shù)字人的信息處理能力,、即時(shí)互動(dòng)能力,以及表達(dá)能力等都有著更高的要求。而在AIGC的賦能下,,數(shù)字人內(nèi)容生產(chǎn)流程將有望得到創(chuàng)新,,可助力數(shù)字人廣泛與各行業(yè)領(lǐng)域相結(jié)合,為數(shù)字人描繪出了極大的創(chuàng)作及交互想象空間,。 在政策,、技術(shù)、環(huán)境的多輪驅(qū)動(dòng)下,,數(shù)字人應(yīng)用場(chǎng)景將持續(xù)得到拓展與深化,。而隨著數(shù)字人行業(yè)進(jìn)入高速發(fā)展期,國(guó)內(nèi)也已出現(xiàn)了諸多相當(dāng)有競(jìng)爭(zhēng)力的玩家,,這其中,,以百度為代表的綜合類(lèi)互聯(lián)網(wǎng)技術(shù)廠商,以及以科大訊飛代表的專(zhuān)長(zhǎng)類(lèi)AI廠商的表現(xiàn)最為突出,,優(yōu)勢(shì)也最為明顯,。 百度“雙輪驅(qū)動(dòng)” 目前來(lái)看,數(shù)字人雖然已經(jīng)應(yīng)用于多個(gè)領(lǐng)域,,但當(dāng)前市場(chǎng)上大多的數(shù)字人產(chǎn)品精度依舊較低,,而百度不僅上線(xiàn)了具備較強(qiáng)的視覺(jué)感知和動(dòng)作控制能力,能夠通過(guò)手勢(shì),、語(yǔ)音等方式與用戶(hù)進(jìn)行互動(dòng)的虛擬數(shù)字人,,還搭建了百度智能云曦靈智能數(shù)字人平臺(tái),提供虛擬形象智能交互解決方案,,而這些產(chǎn)品的生成,,都源于百度為數(shù)字人相關(guān)開(kāi)發(fā)提供了絕佳的土壤。 一方面,,百度在AI技術(shù)上的領(lǐng)先優(yōu)勢(shì),,能夠高效率、高質(zhì)量地推動(dòng)其數(shù)字人技術(shù)的迭代升級(jí),。眾所周知,,數(shù)字人的發(fā)展離不開(kāi)計(jì)算機(jī)視覺(jué)、智能語(yǔ)音,、自然語(yǔ)言處理等AI技術(shù)的支持,,而作為國(guó)內(nèi)唯一一家既有視覺(jué)能力,又有語(yǔ)音,、語(yǔ)義相關(guān)包括計(jì)算機(jī)圖形學(xué)自動(dòng)生成全鏈路AI能力平臺(tái)型的公司,,百度已經(jīng)積累了大量全棧AI能力,而這無(wú)疑是其數(shù)字人成功落地的實(shí)力與底氣,。 另一方面,,百度標(biāo)準(zhǔn)化,、平臺(tái)化的優(yōu)勢(shì),可以有效降低運(yùn)營(yíng)門(mén)檻,,助其數(shù)字人實(shí)現(xiàn)廣泛應(yīng)用,。想要實(shí)現(xiàn)“人均一個(gè)”數(shù)字人,產(chǎn)品標(biāo)準(zhǔn)化,、平臺(tái)化必不可少,。得益于百度在視覺(jué)、NLP,、語(yǔ)音交互等底層全棧AI技術(shù)優(yōu)勢(shì)的長(zhǎng)期積累,,以及PLATO百億參數(shù)對(duì)話(huà)大模型,百度智能云已經(jīng)將這一能力平臺(tái)化,、標(biāo)準(zhǔn)化,,這不僅使其部署成本更低,周期更短,,還可以做到一次部署,、一次建設(shè),并在多個(gè)場(chǎng)景下形成虛擬數(shù)字人能力,,實(shí)現(xiàn)端到端軟硬一體的商業(yè)應(yīng)用,。 百度憑借無(wú)可比擬的AI能力,加之在標(biāo)準(zhǔn)化,、平臺(tái)化中服務(wù)穩(wěn)定、成本低廉等特點(diǎn),,在數(shù)字人領(lǐng)域先發(fā)制人,,在產(chǎn)品力、市場(chǎng)上走在了行業(yè)前列,。據(jù)了解,,百度智能數(shù)字人平臺(tái)是世界上首個(gè)在線(xiàn)語(yǔ)音交互注意力模型,實(shí)現(xiàn)與數(shù)字人自然暢通交流,,高準(zhǔn)確度的音畫(huà)同步,,逐字口型準(zhǔn)確率>98.5%。另外,,目前百度終端虛擬人產(chǎn)品,,也已經(jīng)以智能客服的形象,成功落地在了深圳,、重慶,、鄭州等多個(gè)城市的各大地鐵站,全天候?yàn)閬?lái)往的乘客提供最便利的智能咨詢(xún)服務(wù),。 科大訊飛“三線(xiàn)出擊” 數(shù)字人已經(jīng)成為多家廠商發(fā)力的重點(diǎn),,凡是進(jìn)入的玩家都在機(jī)器視覺(jué)、語(yǔ)音交互和自然語(yǔ)言處理等方面有著或多或少的技術(shù)積累,而盡管?chē)?guó)內(nèi)諸多互聯(lián)網(wǎng)大廠和科技巨頭都瞄準(zhǔn)了數(shù)字人賽道,,但作為亞太地區(qū)知名的智能語(yǔ)音和人工智能上市企業(yè),,科大訊飛同樣在推動(dòng)數(shù)字人產(chǎn)品和場(chǎng)景應(yīng)用落地上,建立起了自己的優(yōu)勢(shì),。 一是,,科大訊飛所具有的豐富的技能和問(wèn)答知識(shí)儲(chǔ)備,可以讓其數(shù)字人變得更加聰慧智能,。一直以來(lái),,科大訊飛都在致力于讓機(jī)器“能聽(tīng)會(huì)說(shuō),能理解會(huì)思考”,,其開(kāi)發(fā)的星火大模型不僅在開(kāi)放式知識(shí)問(wèn)答上取得了突破,,其多輪對(duì)話(huà)、邏輯和數(shù)學(xué)能力也有所升級(jí),。而科大訊飛語(yǔ)言理解,、知識(shí)問(wèn)答、邏輯推理等各項(xiàng)能力的持續(xù)提升,,能夠使其數(shù)字人準(zhǔn)確地理解用戶(hù)問(wèn)題,,并給出自然、準(zhǔn)確的回答,,為用戶(hù)帶來(lái)更為豐富的使用體驗(yàn),。 二是,科大訊飛在智能語(yǔ)音技術(shù)方面的深厚積淀,,可以為其數(shù)字人的落地提供全鏈路保障,。科大訊飛自成立以來(lái),就一直從事著智能語(yǔ)音,、自然語(yǔ)言理解,、計(jì)算機(jī)視覺(jué)等核心技術(shù)的研究,并且其在語(yǔ)音,、圖像,、自然語(yǔ)言理解、機(jī)器認(rèn)知推理能力,、多語(yǔ)種多模態(tài)人機(jī)交互等方面的技術(shù)和產(chǎn)業(yè)化應(yīng)用已具有業(yè)界領(lǐng)先水平,。得益于此,科大訊飛的數(shù)字人也就能得到語(yǔ)音識(shí)別,、語(yǔ)義理解,、語(yǔ)音合成、形象驅(qū)動(dòng),、視頻渲染服務(wù)的全鏈路保障,。 三是,,科大訊飛專(zhuān)屬的數(shù)字人定制能力,有助其在眾多廠商中形成差異化優(yōu)勢(shì),。科大訊飛可以根據(jù)客戶(hù)要求,,在客戶(hù)的不同業(yè)務(wù)場(chǎng)景下進(jìn)行AI虛擬人賦能,為客戶(hù)提供一站式,、定制化AI虛擬人服務(wù),。比如,在服務(wù)部署上,,可以靈活采用公有云或私有云的部署方案,,保障交互服務(wù)的安全穩(wěn)定;在形象聲音上,,可以根據(jù)客戶(hù)音色,、風(fēng)格的需求靈活定制專(zhuān)屬的個(gè)性化語(yǔ)音庫(kù);在虛擬人形象上,,可以支持2D真人形象,,從而為客戶(hù)定制專(zhuān)有IP形象。 仍需負(fù)重前行 在數(shù)字時(shí)代,,數(shù)字人已經(jīng)開(kāi)始在各個(gè)企業(yè)中扮演關(guān)鍵角色,。然而對(duì)于數(shù)字人企業(yè)而言,打通產(chǎn)業(yè)鏈各環(huán)節(jié),、修煉技術(shù)“內(nèi)功”,,才是打造競(jìng)爭(zhēng)優(yōu)勢(shì)、強(qiáng)化競(jìng)爭(zhēng)壁壘的關(guān)鍵,。因此,,即便是國(guó)內(nèi)數(shù)字人發(fā)展較為成熟的公司,已經(jīng)在客戶(hù)積累,、技術(shù)實(shí)力、銷(xiāo)售渠道,、資金供給等方面具備了一定積累,,但由于數(shù)字人行業(yè)天花板依舊較高,想要維持長(zhǎng)期和衍生發(fā)展并不容易,。 一方面,,國(guó)內(nèi)數(shù)字人尚處于起步階段,距離商業(yè)化規(guī)模推廣仍有一定距離,。盡管?chē)?guó)內(nèi)諸多企業(yè)的數(shù)字人已經(jīng)實(shí)現(xiàn)了場(chǎng)景化應(yīng)用,,但就整體而言,我國(guó)數(shù)字人行業(yè)發(fā)展仍處于起步階段,,不僅尚未跑出一個(gè)覆蓋全產(chǎn)業(yè)鏈的數(shù)字人企業(yè),,大多數(shù)企業(yè)在數(shù)字人情緒感知,、語(yǔ)義理解、情感連接等方面仍有所欠缺,。另外,,國(guó)內(nèi)各家數(shù)字人在細(xì)分市場(chǎng)上的產(chǎn)品也都還仍處于試驗(yàn)可行性的階段,大規(guī)模商業(yè)化暫時(shí)還難以實(shí)現(xiàn),。 另一方面,,海外巨頭的數(shù)字人優(yōu)勢(shì)明顯,國(guó)內(nèi)企業(yè)想要追趕還需更加努力,。國(guó)內(nèi)領(lǐng)先企業(yè)的數(shù)字人產(chǎn)品雖然已經(jīng)頗具特色,,但國(guó)內(nèi)企業(yè)更側(cè)重AI技術(shù)的開(kāi)發(fā)與內(nèi)容應(yīng)用,因此數(shù)字人產(chǎn)品大多探索的是其在社交活動(dòng),、新聞媒體,、文旅等領(lǐng)域的應(yīng)用。而海外巨頭多聚焦于數(shù)字人的基礎(chǔ)建設(shè),,技術(shù)優(yōu)勢(shì)較為明顯,。比如英偉達(dá)、Unity等均基于自身技術(shù)優(yōu)勢(shì)向下游生產(chǎn)技術(shù)服務(wù)平臺(tái)延伸,,相較于國(guó)內(nèi),,其技術(shù)壁壘就更為深厚。 目前來(lái)看,,國(guó)內(nèi)以百度,、科大訊飛為代表的科技企業(yè)在數(shù)字人上的探索雖然還有一定難度,但值得注意的是,,在各個(gè)大廠的不斷發(fā)力,,以及人工智能技術(shù)的大力加持下,數(shù)字人的制作運(yùn)營(yíng)效率有望得到持續(xù)優(yōu)化,,其應(yīng)用價(jià)值也將得到不斷釋放,。而隨著百度、科大訊飛不遺余力地加速數(shù)字人的進(jìn)程,,其數(shù)字人的未來(lái)也將會(huì)非常值得期待,。 |
|
來(lái)自: 劉曠V > 《待分類(lèi)》