編者按:6月15日,黑馬AIGC主題系列直播第二季第六期,,倒映有聲聯(lián)合創(chuàng)始人何培成圍繞《基于神經(jīng)渲染技術(shù)的AI數(shù)字人如何商業(yè)變現(xiàn)》主題進(jìn)行了深度論述,,就基于數(shù)字人驅(qū)動(dòng)引擎技術(shù)的AIGC場(chǎng)景和應(yīng)用等問(wèn)題進(jìn)行探討。 以下為本次直播實(shí)錄整理: 介紹一下AIGC的背景,。1956年就有了最早的AI作曲,;2007年,紐約大學(xué)AI研究員訓(xùn)練專(zhuān)寫(xiě)小說(shuō)的神經(jīng)網(wǎng)絡(luò),,形成6000萬(wàn)字純AI小說(shuō),;2017年對(duì)抗式網(wǎng)絡(luò)生成;2021年生成式AIGC正式發(fā)布,。 可以看出發(fā)展速度越來(lái)越快,,現(xiàn)在幾乎是以月、周,、天的頻率快速迭代,。 PGC是以單人或多人專(zhuān)業(yè)體驗(yàn)來(lái)做,主要特征是專(zhuān)業(yè)團(tuán)隊(duì)制作,、門(mén)檻較高,、周期較長(zhǎng)、品質(zhì)較高,、缺乏用戶參與,;UGC是規(guī)模化雙向體驗(yàn),,主要特征是提供開(kāi)放工具,、用戶可部分參與內(nèi)容創(chuàng)作、質(zhì)量方差大,,像短視頻,、游戲等都是代表,。目前還沒(méi)到全棧AIGC的階段,還是AI協(xié)助UGC生產(chǎn),,這個(gè)階段是輔助創(chuàng)作者生產(chǎn),,特征是降低了生產(chǎn)門(mén)檻、提升創(chuàng)作效率,、實(shí)現(xiàn)全民開(kāi)發(fā),,視頻、音頻,、數(shù)字人等都是典型AI協(xié)作,。 全棧AIGC勢(shì)不可擋,只是沒(méi)有那么快,。它的賽道和市場(chǎng)非常大,,應(yīng)用場(chǎng)景也快速變化。主要有幾點(diǎn),,第一內(nèi)容消費(fèi)需求增加,;第二消費(fèi)緯度越來(lái)越豐富;第三創(chuàng)作者經(jīng)濟(jì)實(shí)現(xiàn)井噴,;第四元宇宙的自增長(zhǎng)性非常強(qiáng),,對(duì)新的內(nèi)容生產(chǎn)方式提出要求,推動(dòng)AIGC順勢(shì)發(fā)展,。 2023年,,將有20%的內(nèi)容被生成式AI所創(chuàng)建,至2025年,,預(yù)計(jì)生成式AI產(chǎn)生的數(shù)據(jù)將占所有數(shù)據(jù)的10%,。數(shù)字化身作為元宇宙入口,將成為虛擬世界發(fā)展的最先落地點(diǎn),。2025年,虛擬數(shù)字人及相關(guān)產(chǎn)業(yè)將達(dá)到2700億級(jí),。到2030年中國(guó)AIGC市場(chǎng)規(guī)模預(yù)計(jì)可達(dá)到170億人民幣,。 數(shù)字虛擬人的行業(yè)發(fā)展會(huì)滲透各行各業(yè),無(wú)論金融,、通信,、政務(wù)、醫(yī)療教育等行業(yè),,都有機(jī)會(huì)實(shí)現(xiàn)數(shù)字人交互,。我們目前合作了幾家游戲廠商,做游戲NPC交互,、資訊播報(bào)等,,可以實(shí)現(xiàn)虛擬明星在這個(gè)場(chǎng)景當(dāng)中的變現(xiàn),。 政策方面,,國(guó)家在推動(dòng)數(shù)字人產(chǎn)業(yè)與數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃,。從最早21年12月份,國(guó)務(wù)院發(fā)布的《十四五數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃》里面提到的,,國(guó)家在大力支持人工智能的算法框架等基礎(chǔ)技術(shù)的自主創(chuàng)新推廣應(yīng)用,,包括國(guó)信合作、鼓勵(lì)優(yōu)先采用安全可信的軟件等等,。隨著賽道發(fā)展越來(lái)越成熟,,應(yīng)用越來(lái)越廣闊,國(guó)家在大力推動(dòng)這些政策,,輔助行業(yè)快速發(fā)展,。還有相關(guān)政策,包括指導(dǎo)用戶科學(xué)認(rèn)證,、理性使用深層次的人工智能方式,、內(nèi)容版權(quán)、數(shù)據(jù)版權(quán)等等,,以及數(shù)字人是否損害他人形象,、名譽(yù)、聲音,、肖像權(quán)等等,,都是非常重要的環(huán)節(jié)。 在這個(gè)賽道,,各個(gè)行業(yè)怎么應(yīng)用,? 第一,融媒體在AI替代方案存在巨大空間,,包括芒果TV的智能虛擬人,、快手AI輔助創(chuàng)作等,可以實(shí)現(xiàn)數(shù)字人24小時(shí)直播,。它的邏輯是第一抓取模型,;第二快速清洗,,例如每日經(jīng)濟(jì)新聞形成8~10秒甚至10~20秒甚至30秒內(nèi)的快速資訊,用數(shù)字人去生成出,,從內(nèi)容到清洗到編輯,,再到審核和播出,形成完整的AIGC閉環(huán),。央媒,、央廣云是我們典型的客戶,大力推進(jìn)融媒體智能化建設(shè),,讓用戶第一時(shí)間獲取信息,。 第二個(gè)是AI播報(bào)和AI主播應(yīng)用逐漸滲透,將實(shí)現(xiàn)人工成本進(jìn)一步降低,。預(yù)計(jì)到2025年,,融媒體的智能化將突破30億元規(guī)模。 第三,,游戲和營(yíng)銷(xiāo)場(chǎng)景可以成為AI驅(qū)動(dòng)的切入點(diǎn),,例如游戲廠商可以配合自研的AI生成語(yǔ)音,隨著AI配音的生動(dòng)化情緒化,,以文本驅(qū)動(dòng)的音畫(huà)視頻內(nèi)容逐漸拓寬場(chǎng)景,;在游戲和影視作為配音的高要求領(lǐng)域,目前已經(jīng)成為AIGC落地的一大場(chǎng)景,。 第四,,隨著技術(shù)進(jìn)步,企業(yè)通過(guò)與虛擬IP和自制虛擬形象兩大路徑,,實(shí)現(xiàn)虛擬場(chǎng)景的營(yíng)銷(xiāo),,帶動(dòng)品牌和企業(yè)完成數(shù)字化轉(zhuǎn)型。 在應(yīng)用層面,,AIGC作為高效低成本的解決方案,,將逐步替代傳統(tǒng)路徑。例如從人力打磨3D模型到AI自動(dòng)建模,,制作周期可以從幾個(gè)月壓縮到小時(shí)為單位?,F(xiàn)在有很多創(chuàng)業(yè)公司,借助AI生成的所需的建模綁定,,到訓(xùn)練模型,再到內(nèi)容制作,,再到渲染能力大大縮短,。 倒映有聲是國(guó)家認(rèn)定的高新技術(shù)企業(yè),最早提出首創(chuàng)無(wú)人驅(qū)動(dòng)數(shù)字分身整套技術(shù),,一直聚焦在AI驅(qū)動(dòng),。除了做數(shù)字人之外,,這幾年也將部分?jǐn)?shù)字人公司技術(shù)公司借給第三方公司,讓他們?nèi)プ鰬?yīng)用場(chǎng)景開(kāi)發(fā),。 在自研神經(jīng)渲染引擎方面,,我們的團(tuán)隊(duì)主要來(lái)自于百度最早的技術(shù)研究院,有百度地圖,、小米,、喜馬拉雅等都做了底層聲音技術(shù)。ETTS(有感情的語(yǔ)音合成)是我們最早提出的,,區(qū)別于市面上機(jī)械式的聲音,。 我們?cè)趪?guó)內(nèi)的情感聲音語(yǔ)料庫(kù)是最全的,一站式引擎包括整個(gè)語(yǔ)音信息可以直接編輯音視頻的內(nèi)容,。整個(gè)制作成本非常低,,可以實(shí)現(xiàn)從TTSA(基于文本實(shí)時(shí)生成語(yǔ)音和視頻)到ETTS(有感情的語(yǔ)音合成)到NLU (自然語(yǔ)言理解)的多層旋轉(zhuǎn),是一體化的驅(qū)動(dòng),。 倒映有聲的客戶大多是Target B端客戶和行業(yè)合作方等,,尤其政府類(lèi)客戶會(huì)支持私有化部署,B端客戶一般是按量計(jì)費(fèi)或者按年月整包支持私有云和公有云,。針對(duì)沒(méi)有集成能力的客戶,,會(huì)提供可視化數(shù)字分身定制,只需要提供10分鐘數(shù)據(jù)就可以完成聲音和形象的定制,。對(duì)于優(yōu)秀的主播或個(gè)人博主,,也會(huì)幫他打造數(shù)字分身入駐我們平臺(tái),給第三方的客戶去提供服務(wù),。 我們的三架馬車(chē),,第一是核心技術(shù)引擎,第二是我們的應(yīng)用,,第三和IP相結(jié)合,。舉個(gè)例子,根據(jù)世衛(wèi)組織2019研發(fā)部的近視報(bào)告,,中國(guó)青少年近視發(fā)病率高達(dá)67%,,40歲以上人群的干眼癥發(fā)病率超過(guò)30%,眼部疾病成為威脅我國(guó)居民身體健康的重要問(wèn)題之一,。處于醫(yī)療健康領(lǐng)域的陶勇醫(yī)生是我們的客戶,,他是北京朝陽(yáng)醫(yī)院的眼科醫(yī)生教授,自己也在做眼科公益基金?,F(xiàn)在他在騰訊的微信視頻號(hào)上播放量非常大,,單條視頻都是數(shù)字分身來(lái)做的。他的團(tuán)隊(duì)有十幾個(gè)人,快速借助數(shù)字分身來(lái)生產(chǎn)內(nèi)容,。 倒映有聲幫助魔鬼貓打造“魔鬼貓和創(chuàng)始人”AI+IP的分身數(shù)字人,打通品牌方+魔鬼貓+倒映有聲合作,,引入多方流量支持,。用這種技術(shù)復(fù)活傳IP,做新的商業(yè)化變現(xiàn),。 處于這樣的時(shí)代,,創(chuàng)業(yè)者應(yīng)該保持好奇,、擁抱變化、參與應(yīng)用,。比如我會(huì)經(jīng)常思考,,不同行業(yè)跟數(shù)字人以及AIGC這些生產(chǎn)力工具有沒(méi)有關(guān)系,怎么去應(yīng)用它,?能否為自身的商業(yè)帶來(lái)變化,,能否提升效率、降低成本,?未來(lái)不論是元宇宙或虛擬世界,,未來(lái)每個(gè)組織、甚至每個(gè)個(gè)體,都將會(huì)擁有自己的數(shù)字人或者數(shù)字分身,。AI的革命已經(jīng)到來(lái),我認(rèn)為它帶來(lái)更多的是變化與機(jī)會(huì),,科技的進(jìn)步只會(huì)讓人類(lèi)生活更美好,。 創(chuàng)業(yè)黑馬:作為從業(yè)者,企業(yè)的哪些優(yōu)勢(shì)會(huì)成為壁壘,? 何培成:個(gè)人認(rèn)為這個(gè)時(shí)代創(chuàng)業(yè)技術(shù)是非常重要的,,但技術(shù)只是其中一環(huán),比如數(shù)字人做得好,,那運(yùn)營(yíng)能力怎么樣,,應(yīng)用是不是足夠好,能否為生產(chǎn)帶來(lái)效率,,是否給用戶帶來(lái)價(jià)值等等,,這些都很重要。 何培成:不管什么行業(yè),,做自己的數(shù)字分身,一定為品牌帶來(lái)正向價(jià)值?,F(xiàn)在數(shù)字人的成本非常低,,為什么不做?就算沒(méi)有任何商業(yè)價(jià)值,,也可以為品牌做背書(shū),。退一步講,假如把我30歲時(shí)候容貌的數(shù)字人做下來(lái),,未來(lái)我60歲的時(shí)候,,還可以和30歲的自己交互,也很有趣,。 新華社發(fā)布了錢(qián)學(xué)森教授的數(shù)字人影像,,前輩的數(shù)字人是寶貴的資產(chǎn),與商業(yè)無(wú)關(guān),,這個(gè)社會(huì)價(jià)值很大,,所以每個(gè)個(gè)體都會(huì)擁有自己的數(shù)字人。這種服務(wù)對(duì)于TO C端的價(jià)值采購(gòu)動(dòng)力是,,想把個(gè)人或家人形象保存下來(lái),。成本主要是在算力上,但這幾年明顯感覺(jué)成本降低,未來(lái)做完美的數(shù)字人成本更低了,,免費(fèi)都有可能,。 創(chuàng)業(yè)黑馬:您在與客戶的接觸過(guò)程中,是否看到需求的明顯變化,?這種需求投射到其他行業(yè)創(chuàng)業(yè)者身上,,有什么建議? 何培成:剛開(kāi)始做政府客戶,,是他們主動(dòng)找過(guò)來(lái)的,。有兩個(gè)點(diǎn),第一提升效率,,第二降低成本,。后來(lái)開(kāi)始有更多B端企業(yè)甚至個(gè)人創(chuàng)業(yè)者,沒(méi)有那么強(qiáng)的表演能力,,讓數(shù)字人做標(biāo)準(zhǔn)的輸出,,對(duì)粉絲來(lái)說(shuō)也是極強(qiáng)的人設(shè)。政府的客戶需求強(qiáng),,是因?yàn)橐獢?shù)字化轉(zhuǎn)型,,各行各業(yè)都一樣,這種趨勢(shì)勢(shì)不可擋,。 創(chuàng)業(yè)黑馬:能否舉一個(gè)AI數(shù)字化創(chuàng)造商業(yè)價(jià)值的案例,? 何培成:每日經(jīng)濟(jì)新聞視頻號(hào),非常典型的從報(bào)紙到新媒體的轉(zhuǎn)型,,他的視頻號(hào)是24小時(shí)循環(huán)播放,。在后臺(tái)抓取全球全網(wǎng)財(cái)經(jīng)新聞,抓完清洗,、生成文字,、后臺(tái)審核。特別重要的文稿,,人工會(huì)走一遍,,它畢竟是官媒。投射到其他行業(yè),,有很大的借鑒作用,。各種垂直領(lǐng)域里,一些知識(shí)需要做商品的轉(zhuǎn)化,。 創(chuàng)業(yè)黑馬:數(shù)字人領(lǐng)域的技術(shù)壁壘高嗎,? 何培成:如果說(shuō)做60分的數(shù)字人,技術(shù)壁壘沒(méi)有那么強(qiáng),。但是把60分提到80分,,投入的精力是完全不一樣的,。有幾個(gè)點(diǎn),第一數(shù)據(jù),,是有版權(quán),、合法、大量的數(shù)據(jù),,這個(gè)壁壘挺高的,,得注意數(shù)據(jù)的購(gòu)買(mǎi)來(lái)源;第二技術(shù)能力,,怎么把引擎做成模型?模型層有很強(qiáng)的技技術(shù)壁壘,,正常的技術(shù)容易被超越,、被替代,所以要付出的成本會(huì)更多,。 *本號(hào)系數(shù)智云科旗下人工智能領(lǐng)域垂直號(hào),。黑智,人工智能領(lǐng)域產(chǎn)業(yè)服務(wù)平臺(tái),,專(zhuān)注AI行業(yè)報(bào)道,,探討AI商業(yè)價(jià)值。
|
|
來(lái)自: 天承辦公室 > 《009人機(jī)融合》