前言最近ChatGPT,,想必大家已經(jīng)是耳熟能詳了,一度認(rèn)為ChatGPT的到來是人工智能的奇點到來,,那么到底ChatGPT是什么,?為什么ChatGPT為代表的人工智能技術(shù)不僅受到平民用戶的喜愛,還受到資本市場追捧呢,? 上篇文章《ChatGPT研究(二)——AI平民化的里程碑》中從技術(shù)角度,,解讀ChatGPT的AI發(fā)展和應(yīng)用,本篇文章將會更多的從商業(yè)場景使用中來介紹ChatGPT的應(yīng)用,。 AIGC多模態(tài)交互功能持續(xù)演化,,奠定多場景商用基礎(chǔ)AIGC:利用人工智能產(chǎn)生內(nèi)容,提升生產(chǎn)力曲線
ChatGPT已成為AIGC功能矩陣中的重要板塊
?? 隨著深度學(xué)習(xí)技術(shù)的快速突破以及數(shù)字內(nèi)容的海量增長,,AIGC領(lǐng)域相關(guān)技術(shù)打破了預(yù)定義規(guī)則的局限性,,使得快速便捷且智慧地輸出多模態(tài)的數(shù)字內(nèi)容成為可能。 ?? 在技術(shù)創(chuàng)新以及多模態(tài)模型的持續(xù)突破下,,AIGC根據(jù)功能和對象的不同,,按順序可包括「三種主要實用功能: 數(shù)字內(nèi)容孿生,數(shù)字內(nèi)容的智能編輯,、數(shù)字內(nèi)容的智能創(chuàng)作」,。 這三種功能相互嵌套與結(jié)合,可以讓AIGC產(chǎn)品具備超越人類的創(chuàng)作潛力,。「而ChatGPT正是AIGC的數(shù)字內(nèi)容編輯這一大功能領(lǐng)域中的重要組成部分」,。 AIGC相關(guān)技術(shù)包含了三大前沿能力
孿生能力包括智能增強與轉(zhuǎn)譯技術(shù),其中增強技術(shù)彌補內(nèi)容數(shù)字化過程中的信息損失,,轉(zhuǎn)譯技術(shù)在理解基礎(chǔ)上對內(nèi)容進(jìn)行多種形式的呈現(xiàn)
編輯能力包括智能語義理解與屬性控制,,語義理解幫助實現(xiàn)數(shù)字內(nèi)容各屬性的分離解耦,屬性控制則在理解基礎(chǔ)上對屬性進(jìn)行精確修改,、編輯與二次 生成,,最終反饋于現(xiàn)實世界,形成孿生-反饋閉環(huán)
創(chuàng)作能力可分為基于模仿的創(chuàng)作與基于概念的創(chuàng)作,,前者基于對某一類作品數(shù)據(jù)分布進(jìn)行創(chuàng)作,,而后者從海量數(shù)據(jù)中學(xué)習(xí)抽象概念,并基于概念創(chuàng)作出現(xiàn)實世界不存在的內(nèi)容 AIGC行業(yè)發(fā)展經(jīng)歷了三個主要時期AIGC發(fā)展經(jīng)歷了早期萌芽,、沉淀積累和2014年之后的快速發(fā)展階段 從分析式AI到生成式AI逐步演化,,生成式AI賦予AIGC創(chuàng)新力
分析式AI其學(xué)習(xí)的知識局限于數(shù)據(jù)本身,;生成式AI在總結(jié)歸納數(shù)據(jù)知識的基礎(chǔ)上可生成數(shù)據(jù)中不存在的樣本 最新生成式AI技術(shù)如GAN,,Diffusion等,催生多款A(yù)IGC產(chǎn)品如:OpenAI系列,、DALL·E2(Diffusion),,Starry A.I.(基于GAN)等 AIGC:學(xué)習(xí)范式更新奠定基礎(chǔ),,模型結(jié)構(gòu)升級助力騰飛
AIGC產(chǎn)業(yè)鏈涵蓋了從硬件到多類終端應(yīng)用的廣泛領(lǐng)域
計算硬件層結(jié)合云計算平臺為AIGC提供機器學(xué)習(xí)訓(xùn)練與推理算力,,其 中GPU與TPU為硬件核心,,主要參與廠商包括英偉達(dá)(GPU)與谷歌 (TPU); 云平臺參與廠商則包含AWS,,GCP,,Azure以及 Coreweave;計算硬件層中云計算平臺廠商分布穩(wěn)定,競爭出現(xiàn)于模型 層面與應(yīng)用層面 模型層面,,閉源基礎(chǔ)模型提供商如OpenAI通過API向用戶提供服務(wù),, 而開源基礎(chǔ)模型則通過在托管平臺如Hugging Face、Replica公開模 型權(quán)重,。 模型訓(xùn)練其高計算力需求推動了模型層廠商與云計算廠商建 立合作關(guān)系(如 OpenAI+Azure,,GCP+DeepMind。模型層面閉源 模型較為普遍,,各廠商依靠模型建立技術(shù)壁壘,。 在應(yīng)用層面,MidJourney,,Runway等自主研發(fā),、持有模型;而 Jasper,Github Copilot則通過調(diào)用閉源模型商提供的API或采用托管 平臺共享的模型,。 AIGC產(chǎn)業(yè)鏈上下游玩家百家齊放
AIGC廠商之間的競爭在于模型層面競爭
文本生成產(chǎn)品多依賴GPT系列模型,自己訓(xùn)練的模型在圖像/視頻模態(tài)產(chǎn)品中較為普遍(圖像/視頻模態(tài)產(chǎn)品通常擁有自己訓(xùn)練的模型,,而不是如文本模態(tài)調(diào)用OpenAI提供的模型服務(wù))
AIGC取長補短,有望成為主流內(nèi)容生產(chǎn)模式
AIGC生成技術(shù)可按模態(tài)進(jìn)行分類
AIGC不同模態(tài)對應(yīng)著各種生成技術(shù)及應(yīng)用場景
AIGC文本生成技術(shù)場景可分為交互式和非交互式
AIGC文本生成技術(shù)商業(yè)化落地有望優(yōu)勢先發(fā)
AIGC圖像生成技術(shù)隨著模型結(jié)構(gòu)的優(yōu)化而明顯提升
“圖像編輯” 難度低于“圖像生成” 與“2D-3D” 轉(zhuǎn)換,,目前已存在多款產(chǎn)品支持“圖像編輯” ,而對于“圖像生成”任務(wù),,由于圖片相 較包含更多元素,,其生成效果仍存在不穩(wěn)定性,對于要求較高的功能類圖像生成仍需要技術(shù)上的提升 AIGC音頻生成技術(shù)正朝更富情感等人類特征演化
音樂生成任務(wù)中仍需解決音樂數(shù)據(jù)難以標(biāo)注的問題,,數(shù)據(jù)標(biāo)注其顆粒度大小影響音樂生成任務(wù)的可控性。若可控性得以解決,,則可指定風(fēng)格,、 情緒等因素的音樂生成任務(wù)有希望在影視、游戲等場景下的到大量應(yīng)用,。 視頻生成 為AIGC應(yīng)用生態(tài)中的高潛力場景
視頻生成過程包括三個階段:數(shù)據(jù)的提取,、訓(xùn)練和轉(zhuǎn)換,當(dāng)前技術(shù)正在著重提升視頻修改精準(zhǔn)度和實時性兩個維度,。鑒于視頻本身的文本,、圖像和音頻的綜合屬性, 視頻生成也是跨模態(tài)生成領(lǐng)域的重要應(yīng)用場景,。 跨模態(tài)生成技術(shù)是真正實現(xiàn)認(rèn)知和決策智能的轉(zhuǎn)折點
大型預(yù)訓(xùn)練模型的發(fā)展使得跨模態(tài)逐步成熟,,“文本-圖像” 生成正在快速落地,,“文字-視頻”的實驗效果也已較為理想(視頻時長、 清 晰程度,、 邏輯等還有較大提升空間),。 AIGC改變數(shù)字內(nèi)容生產(chǎn)模式
AIGC滲透傳媒領(lǐng)域各個環(huán)節(jié)
AIGC化2D為3D,拓展電商展示維度
AIGC打破傳統(tǒng)娛樂體驗邊界
AIGC拓寬影視行業(yè)創(chuàng)意邊際
AIGC促進(jìn)各行業(yè)轉(zhuǎn)型升級AIGC技術(shù)在各行業(yè)數(shù)字內(nèi)容相關(guān)領(lǐng)域均有發(fā)揮空間 最后歡迎大家點贊、收藏,、評論,,轉(zhuǎn)發(fā)! 歡迎大家關(guān)注我的微信公眾號,!隨機分享無用的計算機知識,,
|
|