春節(jié)期間橫空出世的Sora,,引爆了人們關(guān)于AGI(通用型人工智能)的大討論,。跟一年前出道即破圈的ChatGPT不同,人們對(duì)Sora的態(tài)度除了盛贊,,似乎還有恐懼,。Sora強(qiáng)大的視頻生成能力表明,相比文生文而言,,文生視頻具備更廣闊的的應(yīng)用場(chǎng)景,,將給視頻產(chǎn)業(yè)鏈帶來變革。 Sora推出后的第一個(gè)工作日,,VC界空前熱情,。一位投資領(lǐng)域的博主稱,“一天內(nèi)已經(jīng)有三個(gè)項(xiàng)目方找過來說要做中國(guó)版Sora,,但聽起來,,心態(tài)都是看看能不能騙點(diǎn)錢”。今天加入戰(zhàn)隊(duì),,提出要做“中國(guó)版Sora”顯然不靠譜,,真正可以吃到“Sora紅利”的或許是視頻產(chǎn)業(yè)鏈上下游,以及早已出發(fā)的視頻大模型玩家,。 Sora浪潮澎湃,,視頻大模型百花齊放在AGI視頻生成領(lǐng)域,,Sora并非孤軍奮戰(zhàn)。1 月 2 日,,以 文生圖工具聞名的 Midjourney 宣布在未來幾個(gè)月加快訓(xùn)練文生視頻模型,;1 月 23 日,谷歌推出了文生視頻模型 Lumiere,;Runway 的文生視頻模型 Gen-2 在 2023 年年末完成了一 次重要更新,,大幅度提升視頻生成質(zhì)量。 2024年,,視頻大模型賽道無疑會(huì)更加熱鬧,,2023年ChatGPT掀起“的百模大戰(zhàn)”主戰(zhàn)場(chǎng)或?qū)淼揭曨l生成領(lǐng)域。在美國(guó)視頻大模型風(fēng)起云涌時(shí),,中國(guó)似乎也并未缺席,。 技術(shù)的顛覆從不遵循論資排輩的邏輯,“顛覆者”隨時(shí)可能出現(xiàn),。 其中一個(gè)視頻AIGC的重磅玩家是新壹科技,前身是曾打造秒拍,、小咖秀和一直播的國(guó)民級(jí)短視頻直播應(yīng)用的一下科技,。2023年7月,新壹科技推出了國(guó)內(nèi)首款聚焦視頻領(lǐng)域的大模型,,公開信息顯示,,其基于視頻大模型的平臺(tái)及服務(wù),已在保險(xiǎn)金融,、數(shù)字政務(wù),、傳媒營(yíng)銷等多個(gè)垂直場(chǎng)景實(shí)現(xiàn)商業(yè)化落地,服務(wù)B端和C端用戶,。 值得關(guān)注的是其旗下定位于智能內(nèi)容輔助創(chuàng)作平臺(tái)的一幀秒創(chuàng),,致力于為用戶提供全流程AI生成視頻服務(wù),通過對(duì)文案素材,、AI語(yǔ)音,、字幕等進(jìn)行智能分析解構(gòu),助力創(chuàng)作者快速成片,,零門檻產(chǎn)出視頻,,目前已擁有超300萬用戶,每天產(chǎn)出數(shù)十萬分鐘AI視頻,。 隨著Runway,、Sora在內(nèi)的產(chǎn)品給AI生成視頻素材帶來質(zhì)和量的提升,這類定位于整合前沿AIGC技術(shù),,提供“傻瓜式”解決方案的平臺(tái),,或許更符合國(guó)情選擇,。 Sora并非鯊魚,而是海洋,,Sora掀起的AGI浪潮,,也將催生大量的巨頭公司、創(chuàng)新應(yīng)用以及產(chǎn)業(yè)變革,。 據(jù)不完全統(tǒng)計(jì)顯示,, 2023 年全球誕生的視頻模型已達(dá)數(shù)十個(gè),平均視頻生成能力為3-4 秒,。Sora問世后,,AI生成單個(gè)視頻的最長(zhǎng)時(shí)長(zhǎng)可達(dá)一分鐘。 “從公開演示Demo來看,,Sora的整體生成質(zhì)量高度逼真,,物理運(yùn)動(dòng)軌跡也已十分自然,整體效果超出了市場(chǎng)同類產(chǎn)品,。不過現(xiàn)在視頻AI生成仍是素材級(jí)別,,不能生成完整作品。而通常情況下,,一個(gè)完整的視頻作品需要幾個(gè)~幾十個(gè)素材構(gòu)成,;借助一幀秒創(chuàng),用戶可通過已有素材,、AI素材的組合完成作品級(jí)的視頻呈現(xiàn),,某種程度上,素材生成技術(shù)的進(jìn)步對(duì)行業(yè)是極大的利好,,Sora生成的素材同樣可以為秒創(chuàng)所用,。”新壹科技CEO雷濤的展望十分樂觀,。 Sora拓寬道路,,哪些視頻業(yè)態(tài)率先受益?最先受益于Sora浪潮的無疑會(huì)是移動(dòng)視頻領(lǐng)域,。Sora前的Runway等視頻大模型只能生成幾秒的視頻,, Sora最多可連續(xù)生成 60 秒高清視頻,這正是互聯(lián)網(wǎng)短視頻的主流時(shí)長(zhǎng),。 隨著Sora徹底開放,,用戶短視頻創(chuàng)作成本更低、門檻更低,、效率更高,,短視頻將進(jìn)一步迎來質(zhì)和量的井噴潮。作為短視頻商業(yè)化兩架馬車的廣告與短劇,,均將受益于Sora,,自動(dòng)生成視頻與程序化AI廣告結(jié)合,,將進(jìn)一步提高營(yíng)銷效率,AIGC短視頻質(zhì)量提升也會(huì)對(duì)短劇產(chǎn)生積極影響,。 影視傳媒行業(yè)同樣會(huì)迎來“Sora紅利”,。雖然Sora當(dāng)前只能生成“素材”級(jí)短視頻,但假以時(shí)日,,隨著生成內(nèi)容時(shí)長(zhǎng)與水準(zhǔn)不斷提升,,“丟給Sora一部小說就能輸出電視劇/電影”也可能并非癡人說夢(mèng);如果搭載ChatGPT寫的小說,,Sora或許能成就新一代智能“夢(mèng)工廠”,。 Sora還將在很多行業(yè)扮演魔術(shù)師的角色。 在廣告營(yíng)銷行業(yè),,TVC,、宣傳片制作成本高、流程長(zhǎng),,基于Sora的生成能力,,廣告營(yíng)銷視頻的制作效率將大幅提高,成本將大幅降低,,特別是一些低創(chuàng)造性,、重復(fù)性較高的營(yíng)銷視頻。 在新聞傳媒行業(yè),,Sora更是降本增效的利器,甚至能在許多領(lǐng)域直接輸出可發(fā)布的視頻,,比如科技類媒體的科普視頻,、生活類媒體的小貼士視頻、商業(yè)類媒體的解讀類視頻……“剪刀手”類搬運(yùn)剪輯,、素材整合與資料歸納類視頻基本都將由Sora主宰,。 截至目前,芒果超媒已表態(tài)將探索文生視頻等AI技術(shù)在傳媒領(lǐng)域的落地,。包括人民日?qǐng)?bào),、新浪財(cái)經(jīng)等媒體也已與新壹科技開展合作,通過視頻生成平臺(tái)服務(wù)為新聞采集,、制作,、傳播高效賦能。 在游戲行業(yè),,Sora可與游戲場(chǎng)景高度適配生成更個(gè)性化的地圖,、畫面甚至角色,《蛋仔派對(duì)》爆紅離不開UGC地圖模式,,利用AIGC增加可玩性已是游戲產(chǎn)業(yè)的大勢(shì)所趨,。 在教育行業(yè)Sora可被用于創(chuàng)建生動(dòng)有趣的教育視頻,,強(qiáng)化互動(dòng)提升效率。 在醫(yī)療行業(yè)Sora可智能生成視頻來實(shí)現(xiàn)醫(yī)患溝通,,比如向醫(yī)美患者傳遞術(shù)后效果,。 在健身行業(yè)Sora可智能生成自然視頻應(yīng)用到跑步機(jī)等設(shè)備提升用戶體驗(yàn)。 …… 當(dāng)前,,互聯(lián)網(wǎng)大約有80%的流量是視頻貢獻(xiàn)的,,但只有20%的內(nèi)容是視頻化的。Sora爆發(fā)后,,隨著更多視頻大模型以及視頻大模型驅(qū)動(dòng)的工具應(yīng)用出現(xiàn),,視頻內(nèi)容將出現(xiàn)井噴潮,互聯(lián)網(wǎng)也將進(jìn)一步被視頻化,。 與其做中國(guó)版Sora,,不如發(fā)揮落地優(yōu)勢(shì)對(duì)于中國(guó)視頻大模型玩家來說,最現(xiàn)實(shí)的機(jī)會(huì)或許不是打造“中國(guó)版Sora”,,而是如何有效整合尖端技術(shù),,孵化出中國(guó)式爆款應(yīng)用。 跟一般技術(shù)不同,,大模型的強(qiáng)弱很大程度取決于“出發(fā)時(shí)間”,。大模型一直在被填喂海量數(shù)據(jù)訓(xùn)練,且在這一過程消耗不菲的算力與能源,,進(jìn)而具備更強(qiáng)的智能水平,,后來者很難單純地靠大手筆投資“大力出奇跡”填平時(shí)間差。 在Sora橫空出世時(shí),,中國(guó)視頻大模型的佼佼者,,一定是早已蓄勢(shì)多年的玩家。 在國(guó)內(nèi)推出首個(gè)視頻大模型的新壹科技也并非天降黑馬,。一下科技旗下的秒拍與一直播當(dāng)年曾分別是滲透率第一的國(guó)民級(jí)短視頻與直播產(chǎn)品,。在更早前,韓坤創(chuàng)辦的酷六網(wǎng)也是國(guó)內(nèi)首家在納斯達(dá)克上市的視頻網(wǎng)站,。這些年來,,韓坤和他的團(tuán)隊(duì)一直在視頻賽道耕耘潛伏,2018年就開始探索AI技術(shù)與視頻的結(jié)合,。 在一下科技與抖音,、快手的競(jìng)爭(zhēng)中落敗后接受現(xiàn)實(shí),其很早就All In AIGC視頻業(yè)務(wù),,著手推進(jìn)視頻大模型釋放AIGC視頻生產(chǎn)力,。基于早期海量音視頻數(shù)據(jù)和視頻業(yè)務(wù)經(jīng)驗(yàn)的積累,,以及AI視頻的多年探索,,新壹科技成了視頻大模型賽道一個(gè)不容忽視的玩家,。 在ChatGPT面世后,中國(guó)市場(chǎng)一夜之間出現(xiàn)了許多“類ChatGPT”應(yīng)用,,百模大戰(zhàn)如火如荼,,不過視頻大模型研發(fā)顯然更具門檻: 數(shù)據(jù)質(zhì)量和場(chǎng)景落地都是關(guān)鍵元素。 數(shù)據(jù)的量與質(zhì)直接左右著視頻大模型的效果,。Sora的核心基石是“理解真實(shí)世界”,,要做到這一點(diǎn)必須要對(duì)大量的視覺內(nèi)容進(jìn)行學(xué)習(xí)。Sora對(duì)比其早前的PixelDance,、Stable Video Diffusion等雛形期的視頻大模型有顯著提升,,數(shù)據(jù)量不容忽視;國(guó)內(nèi),,新壹科技的視頻大模型表現(xiàn)相對(duì)成熟,,也離不開秒拍、小咖秀,、一直播等業(yè)務(wù)多年來積攢的視頻內(nèi)容底子,。 場(chǎng)景落地或許中國(guó)視頻大模型廠商的機(jī)遇突破口。一直以來,,本土科技企業(yè)都很接地氣,,善于洞察用戶需求進(jìn)行產(chǎn)品落地,在互聯(lián)網(wǎng)應(yīng)用層出現(xiàn)小程序,、移動(dòng)支付,、共享單車、共享充電寶,、短視頻,、直播帶貨等創(chuàng)新應(yīng)用,都足以說明這一點(diǎn),。 正如新壹科技CEO雷濤公開采訪時(shí)所言,,Sora的誕生無疑會(huì)改變AI視頻生成市場(chǎng)格局,?!熬蛧?guó)內(nèi)而言,要看哪些企業(yè)能結(jié)合,、利用新技術(shù),,完善符合國(guó)情的產(chǎn)品,比如提供定制化的視頻生成服務(wù),、跨業(yè)態(tài)合作等,。像企業(yè)營(yíng)銷視頻、企業(yè)宣傳片,、教育培訓(xùn),、微短劇,,甚至個(gè)人娛樂領(lǐng)域,用戶都可以根據(jù)自身需求,,通過文本描述進(jìn)行視頻內(nèi)容個(gè)人定制,。” 或許,,在Sora的素材級(jí)視頻生成大模型外,,行業(yè)還需要一個(gè)強(qiáng)大的視頻內(nèi)容輔助創(chuàng)作工具,將優(yōu)質(zhì)的AI素材和現(xiàn)實(shí)素材進(jìn)行整合,,為創(chuàng)作者提供整體解決方案,,這可能是類似新壹科技團(tuán)隊(duì)努力的方向。 另一個(gè)角度,,Sora模型底層設(shè)計(jì)是英文邏輯,,這意味著在其他語(yǔ)種上存在較多本地化機(jī)會(huì)?;叵氪饲?,英文版文生圖工具在面對(duì)“胸有成竹”“汗牛充棟”“熊熊烈火”等成語(yǔ)時(shí)全都鬧了笑話,視頻生成同樣面臨這樣的挑戰(zhàn),。 再比如英文語(yǔ)境邏輯訓(xùn)練下,,大模型往往默認(rèn)男人、女人,、小孩都是白人,,生成內(nèi)容很少會(huì)有黃種人。類似這樣的差異意味著視頻大模型需要被“漢化”,,中國(guó)大模型開發(fā)者更理解本土文化,,大模型生成的內(nèi)容也更能滿足本土用戶需求。 整體而言,,相較于打造“中國(guó)版Sora”,,將Sora背后的AGI能力完美延伸,打造to C/to B的創(chuàng)新應(yīng)用,,或?qū)⑹侵袊?guó)科技公司更現(xiàn)實(shí)的機(jī)會(huì),。 看得更遠(yuǎn)一些,視頻產(chǎn)業(yè)只是Sora改變的冰山一角,。Sora背后的AGI技術(shù)以及“理解與模擬現(xiàn)實(shí)世界”的能力,,可能催生AI手機(jī)、AI汽車,、AI XR,、AI機(jī)器人等新興產(chǎn)業(yè),在重構(gòu)科技產(chǎn)業(yè)秩序的進(jìn)程中,賦予人類全新的力量,,而這顯然是比“Sora是否取代影像工作者”更值得關(guān)注的事情,。 |
|