視頻正在取代圖片、文字和音頻等傳統(tǒng)內(nèi)容格式,,迅速成為最主流的內(nèi)容載體,。 阻擋視頻應(yīng)用創(chuàng)新的從來都不是需求,而是技術(shù),。好在隨著云計(jì)算,、人工智能、5G等新興技術(shù)的蓬勃發(fā)展,,技術(shù)的鴻溝被填平,,屬于視頻的大時(shí)代也將呼嘯而來。而作為視頻業(yè)務(wù)快速發(fā)展的技術(shù)底座,,智能視頻云的發(fā)展成熟解決了視頻產(chǎn)業(yè)發(fā)展的后顧之憂,,同樣視頻業(yè)務(wù)的多樣化發(fā)展,也倒逼智能視頻云技術(shù)更快的走向迭代,。5月13日,,百度智能云“云智技術(shù)論壇-智能視頻專場”發(fā)布了智能視頻云3.0全景圖?;谠圃軜?gòu),,融合百度前沿的視頻云技術(shù)和AI能力架構(gòu)矩陣,從云智技術(shù)一體化,、產(chǎn)品平臺(tái)化,、應(yīng)用場景化三個(gè)層面全面賦能視頻創(chuàng)作、生產(chǎn),、應(yīng)用等全流程,。視頻產(chǎn)業(yè)化背后是視頻云的機(jī)遇百度集團(tuán)副總裁侯震宇表示,消費(fèi)互聯(lián)網(wǎng)內(nèi)容視頻化加速發(fā)展的同時(shí),,許多行業(yè)的業(yè)務(wù)也正在不斷被視頻化,,變化趨勢背后的驅(qū)動(dòng)力是AI與云計(jì)算的發(fā)展,使得智能視頻體驗(yàn)進(jìn)入內(nèi)容高清化,、體驗(yàn)沉浸化,、分析智能化的新階段。確如此言,,新興技術(shù)的發(fā)展,,給視頻行業(yè)帶來了新的機(jī)遇,同時(shí)也給視頻云技術(shù)提出了更高的要求,。第一個(gè)驅(qū)動(dòng)視頻行業(yè)發(fā)展的關(guān)鍵詞是5G,。預(yù)計(jì)中國5G用戶至2025年將達(dá)到8.16億人,彼時(shí)將是視頻行業(yè)規(guī)模的一個(gè)可以預(yù)見的高峰。由于5G“高并發(fā)和低延時(shí)”將促進(jìn)互動(dòng)式視頻的發(fā)展,;“高帶寬”則將衍生出高清/VR等“大視頻”,,視頻會(huì)從高清走向超高清,VR將從當(dāng)前的2K走向8K時(shí)代,;視頻內(nèi)容會(huì)更加多元化,,UGC/PGC等內(nèi)容制作模式更加繁榮。第二個(gè)驅(qū)動(dòng)因素則是視頻云技術(shù)的發(fā)展,。云作為一個(gè)底座,,所有的數(shù)據(jù)交互都會(huì)在云端發(fā)生,而人工智能技術(shù)帶來的洞察,,可以更有效地匹配用戶和他們最感興趣的內(nèi)容,,更好地理解用戶和打造高度個(gè)性化的用戶體驗(yàn)。第三個(gè)驅(qū)動(dòng)因素是視頻與產(chǎn)業(yè)生態(tài)的結(jié)合,。2020年的新冠疫情,,催生大量在線的業(yè)務(wù)場景,大量的AI與視頻結(jié)合的行業(yè)應(yīng)用被廣泛推廣,,如智慧城市,、在線教育、遠(yuǎn)程醫(yī)療等一大批視頻應(yīng)用的場景被打開,,視頻產(chǎn)業(yè)化的趨勢也隨之而來,。“各行業(yè)為了積極應(yīng)對(duì)業(yè)務(wù)視頻化趨勢,需要開始統(tǒng)一規(guī)劃云智一體的視頻平臺(tái),。百度在視頻領(lǐng)域有長期豐富的業(yè)務(wù)實(shí)踐,,并據(jù)此構(gòu)建了云智一體的領(lǐng)先技術(shù)能力,希望為各行業(yè)的智能視頻發(fā)展提供強(qiáng)大助力,?!焙钫鹩钫f。為此,,百度智能云發(fā)布智能視頻云3.0全景圖,,將“云智一體”的獨(dú)特優(yōu)勢與視頻技術(shù)全面融合,形成云智一體化,、平臺(tái)化,、全場景化,為行業(yè)提供前沿的視頻云技術(shù),、全面的AI視頻能力矩陣、實(shí)用的視頻創(chuàng)作分發(fā)平臺(tái)和視聯(lián)網(wǎng)感知平臺(tái),,以及覆蓋全場景的智能視頻技術(shù)方案,。這些不同維度的驅(qū)動(dòng)因素的交織,無限放大了視頻云的未來發(fā)展空間,,當(dāng)然也對(duì)視頻云的發(fā)展提出了新的要求,。百度智能云在2020年推出了智能視頻云2.0,,對(duì)視頻云進(jìn)行架構(gòu)升級(jí)、交互升級(jí),、智能升級(jí)的三大升級(jí),。到2020年底,百度智能云又推出了智能視頻云3.0,。如此快速的迭代背后,,到底意味著什么?百度智能云智能視頻云總經(jīng)理林連江表示:智能視頻云1.0只是做到了讓視頻云觸達(dá)用戶,,是一個(gè)開端,;智能視頻云2.0做到了豐富能力組件,是技術(shù)積累升級(jí)的過程,;而智能視頻云3.0則是一個(gè)完整的模式升級(jí),,通過云智一體的平臺(tái)真正深入到場景。在智能視頻云3.0全景圖的總體綱領(lǐng)之下,必須需要一系列的技術(shù)能力,,去突破不同場景的痛點(diǎn),。在基礎(chǔ)能力上,視頻分發(fā)基礎(chǔ)設(shè)施CDN方面,,百度智能云有1000+大節(jié)點(diǎn)何100T+帶寬儲(chǔ)備,。全球智能調(diào)度系統(tǒng),加上高效,,低時(shí)延的系統(tǒng),,可以滿足不同場景對(duì)視頻的體驗(yàn)。同時(shí)它還是一個(gè)可編程系統(tǒng),,面對(duì)業(yè)務(wù)多樣化可以實(shí)現(xiàn)敏捷開發(fā),。而作為視頻云的關(guān)鍵技術(shù),百度自研的智能編碼BD265,,相比開源編解碼技術(shù),,同畫質(zhì)請(qǐng)下降低碼率30%+,編碼速度提升2倍以上,。通過BD265結(jié)合百度AI技術(shù)可以更好的適應(yīng)視頻的實(shí)際的場景,。從產(chǎn)品維度上百度還有“智感超清”,大幅提升畫質(zhì),,加速超高清發(fā)展,。據(jù)介紹,“智感超清”產(chǎn)品可智能化實(shí)現(xiàn)視頻畫質(zhì)增強(qiáng)、視頻分辨率上采樣等功能,,在同樣碼率下大大提升視頻畫質(zhì)及用戶觀看視頻體驗(yàn),。廣泛應(yīng)用于視頻直播、短視頻,、小視頻,、長視頻、廣播電視等領(lǐng)域及場景,。再有實(shí)時(shí)音視頻通訊技術(shù),,依靠核心自研的多個(gè)算法,實(shí)現(xiàn)通訊順暢的超低延時(shí)互動(dòng)體驗(yàn),。以及面向不同業(yè)務(wù)場景提供All in one的智能視頻SDK矩陣能力,,涵蓋視頻特效、短視頻,、互動(dòng)直播,、播放器、增強(qiáng)超分等,。而AI能力使得智能視頻從“刀耕火種”走向“精耕細(xì)作”,,百度視覺技術(shù)部總監(jiān)丁二銳表示,在視頻內(nèi)容理解分析上,,可通過圖像,、聲音、場景,、人物,、文本描述等信息,對(duì)進(jìn)行視頻智能分析,、內(nèi)容智能審核,、智能檢索?;诎俣茸匝袠I(yè)界最大包含了5500億海量知識(shí)的多元異構(gòu)知識(shí)圖譜,,增強(qiáng)視頻深度理解,提升視頻編目效率,,支持視頻分析,、審核、檢索等方面得到廣泛應(yīng)用,。在視頻智能生產(chǎn)上,,通過圖文資訊、數(shù)據(jù),、圖集等多種內(nèi)容載體向短視頻進(jìn)行轉(zhuǎn)換,,并基于知識(shí)圖譜對(duì)結(jié)構(gòu)化數(shù)據(jù),、事件脈絡(luò)進(jìn)行增強(qiáng)理解,,實(shí)現(xiàn)創(chuàng)新的視頻生成,。在視頻交互與生成方面,全新構(gòu)建了交互與生成AI能力矩陣,,其中基于元學(xué)習(xí)-遷移學(xué)習(xí)的視頻生成技術(shù)可根據(jù)需求快速定制不同風(fēng)格的高質(zhì)量視頻,。尤其是,百度智能視頻云結(jié)合虛擬數(shù)字人形象生成與語音合成,、唇動(dòng)等技術(shù),,可低成本制作形象豐富靈動(dòng)、線上線下多端覆蓋的的數(shù)字人,,不僅交互自然,、聲音動(dòng)聽,還能夠適配多種業(yè)務(wù)場景需求,,如百度智能云的數(shù)字人虛擬主播“小C”,,在今年兩會(huì)直播節(jié)目擔(dān)任主持人時(shí)擁有出色的表現(xiàn)。在戰(zhàn)略方向上,,百度智能視頻云瞄準(zhǔn)了泛媒體,、泛互聯(lián)網(wǎng)和泛產(chǎn)業(yè)三大核心場景。在泛媒體場景,,信息傳播將呈現(xiàn)多樣化,、實(shí)時(shí)化,、互動(dòng)化等新的趨勢,。傳統(tǒng)專業(yè)媒體在泛媒體場景下逐漸走向智媒體轉(zhuǎn)型。而百度智能視頻技術(shù)通過媒體大腦平臺(tái),,賦能產(chǎn)業(yè)三大升級(jí),,打造智媒產(chǎn)業(yè)互聯(lián)網(wǎng)生態(tài)圈。央視網(wǎng)與百度智能視頻云合作,,打造了五智人工智能編輯部,,并針對(duì)央視網(wǎng)的大量視頻內(nèi)容,通過海量存儲(chǔ)做了超過兩百萬小時(shí)的視頻處理,,并在此基礎(chǔ)上打造了測采編發(fā)的人工智能編輯部實(shí)體業(yè)務(wù)和線上流程的全流程邏輯,。典型的創(chuàng)新應(yīng)用有“幫你找”,,觀眾可以在央視網(wǎng)網(wǎng)站上找到相關(guān)的視頻類的內(nèi)容,,也幫助采編人員,,利用知識(shí)圖譜,,找到相關(guān)素材。在泛互聯(lián)網(wǎng)場景,,內(nèi)容和用戶是互聯(lián)網(wǎng)企業(yè)增長的核心要素。所以百度智能視頻云基于百度AI和云平臺(tái),,賦能視頻企業(yè)內(nèi)容-流量-營銷-變現(xiàn)的全業(yè)務(wù)周期,,為其提供全面的技術(shù)能力,,并依托云智一體平臺(tái),提供了四個(gè)解決方案,,幫助視頻企業(yè)優(yōu)化體驗(yàn),提高效率,。如智能小視頻解決方案,,可以幫助企業(yè)加速上線視頻業(yè)務(wù),僅需1天時(shí)間,,就可以上線短視頻的業(yè)務(wù),。例如通過百度智能視頻云PaaS能力與云犀直播SaaS應(yīng)用的的結(jié)合,杭州星犀科技解決了零售品牌自播執(zhí)行門檻高,、門店直播運(yùn)營力缺乏的關(guān)鍵問題。在泛產(chǎn)業(yè)場景,,我們看到智慧城市,、智慧交通,、農(nóng)林水利,、安全生產(chǎn)等一系列場景中,,都需要視頻通過對(duì)物理世界的刻畫,,去解決具體的場景問題,。百度智能視頻云以云邊端一體為基礎(chǔ)架構(gòu),平臺(tái)+數(shù)據(jù)主導(dǎo),,解決業(yè)務(wù)對(duì)接系統(tǒng)和數(shù)據(jù)平臺(tái)化的需求。例如智能視頻云3.0中的視聯(lián)網(wǎng)感知平臺(tái)聚焦產(chǎn)業(yè)級(jí)視頻通過信息獲取對(duì)多種業(yè)務(wù)進(jìn)行決策的特性,通過智能端多場景覆蓋下的200+種應(yīng)用場景,、一站式、低數(shù)據(jù),、快速定制能力的EasyDL算子生產(chǎn)技術(shù),與云邊端深度融合,。典型的案例如宜昌市點(diǎn)軍區(qū),在百度智能視頻云的參與和助力下,,在公共衛(wèi)生、鄉(xiāng)村振興,、基層醫(yī)療、環(huán)境保護(hù)等方面為民生帶來更多便捷、智能的服務(wù),,讓百姓有安全感,、獲得感,、幸福感。但我們也知道,,泛產(chǎn)業(yè)的市場太大了,,單憑百度智能云很難做好服務(wù)的覆蓋,。所以,,連林江說,,“泛產(chǎn)業(yè)的場景,,我們還是發(fā)揮平臺(tái)能力,跟更多的合作伙伴共同去做,,百度本身有AI平臺(tái)賦能性的定位,,把資源賦能給伙伴,共同去做大市場,?!?/span>從泛媒體、泛互聯(lián)網(wǎng)和泛產(chǎn)業(yè)的三大場景聚焦,,到云邊端一體化的基礎(chǔ)架構(gòu),,自上而下,這就形成了百度智能視頻云3.0全景圖,。“云智一體”對(duì)于視頻領(lǐng)域來說非常必要和重要,。因?yàn)橐曨l具有“重”數(shù)據(jù)的特點(diǎn),在海量數(shù)據(jù)的情況下,,一方面需要強(qiáng)大的智能化分析與處理能力,,另一方面對(duì)采集、存儲(chǔ),、傳輸和分發(fā)提出了極高的需求,。基于此,,百度智能云“云智一體”的全場景視頻技術(shù)中“云”的部分以云,、邊、端一體的基礎(chǔ)架構(gòu)了先進(jìn)的云計(jì)算能力,“智”則以業(yè)界領(lǐng)先且全面的AI能力實(shí)現(xiàn)了對(duì)視頻語音,、圖像,、文字等多種信息的多模態(tài)智能分析、理解,、生成等處理,。“云”成為“智”強(qiáng)有力的輸出載體,,二者結(jié)合一體,,是行業(yè)業(yè)務(wù)在各種場景下實(shí)現(xiàn)視頻高清化、沉浸化,、智能化的最佳選擇,。與此同時(shí),智能視頻云3.0也采取了生態(tài)開放的模式,,百度智能云已攜手伙伴,,推出了十幾種場景化的解決方案,幫助客戶更快的落地和交付,。不難總結(jié),,“云智一體“的智能視頻云3.0,首先在云端可以滿足企業(yè)用戶對(duì)云能力的所有需求,,智能視頻云通過AI算法將視頻的生成,、處理、分析,,以及理解的效果,,融入場景,解決好實(shí)際的應(yīng)用痛點(diǎn),。隨著5G的深入,,視頻云理念和技術(shù)的不斷完善,視頻云決勝的關(guān)鍵必然會(huì)落在場景中,,智能視頻云3.0不僅能將核心的AI通用能力和場景能力植入到全流程的視頻產(chǎn)品組件中,在面向客戶的實(shí)際應(yīng)用問題時(shí),,智能視頻云3.0還能將平臺(tái)化解決方案與領(lǐng)域特定的模型訓(xùn)練能力相結(jié)合,,解決應(yīng)用領(lǐng)域性的問題,從而實(shí)現(xiàn)場景能力的自我生長,。
|