20多年前,,我逃課去看《黑客帝國》。 墨菲斯說:歡迎來到真實世界,。 一下子夢醒了,,回到教室的時候,老師在講國有企業(yè)改制過程中的頂層設(shè)計問題,。 你看到的,就是真實嗎,? 時光荏苒,,終于忘記了很多人,終于忘記了很多事,。 一覺醒來,,AI圈里沸騰了,大家發(fā)現(xiàn)現(xiàn)實不存在了,。 OpenAI發(fā)布視頻大模型的預(yù)告,,能夠生成60秒完整視頻。 這個大模型叫Sora,。 作為一個AI工具的重度使用者,,平均每天使用生成式AI和AI繪畫工具超過2小時。 對Sora最感興趣的一點,,是它生成的畫面不崩,、不閃。 事實上,,現(xiàn)階段開源AI繪畫工具也能生成視頻,,但大多數(shù)在4秒之內(nèi),,而且最大的缺點是臉崩和閃爍。 臉崩的原因是很多大模型很難處理大幅畫面的時候的面部細(xì)節(jié),,閃爍的原因是現(xiàn)階段大模型都是逐幀生成畫面,,然后拼成視頻,每一幀的畫面細(xì)節(jié)有變化的時候就會閃爍,。 從這一點上來說,,在Sora面前,目前所有的視頻大模型都得跪下,。 有分析人士認(rèn)為,,Sora使用了游戲引擎。我也認(rèn)同這一觀點,,使用游戲引擎能夠巧妙的繞開逐幀生成畫面再拼接的弊端,。 英偉達高級科學(xué)家Jim Fan對Sora發(fā)表了一些自己的觀點: Sora是一個數(shù)據(jù)驅(qū)動的物理引擎。它是對許多世界的模擬,,無論是真實的,,還是虛構(gòu)的。該模擬器通過去噪和梯度學(xué)習(xí)方式,,學(xué)習(xí)了復(fù)雜的渲染,、「直觀的」物理、長期推理和語義理解,。 如果Sora使用虛幻引擎5接受過大量合成數(shù)據(jù)的訓(xùn)練,,我不會感到驚訝的。必須如此,! 在ChatGPT3.5推出之前,,ChatGPT發(fā)布了幾個版本,雖然表現(xiàn)驚艷,,但能力有限,,也是不溫不火。3.5一炮走紅后,,再接再厲推出了付費的4.0版本,。 不管多么驚人,ChatGPT至少是有“前奏”的,,它的基本原理和運行邏輯,,以及進展,對AI感興趣的人,,都是有了解的,。 Sora的出現(xiàn)有點措手不及,就在昨天的時候,大家還在為AI視頻去閃問題絞盡腦汁,,畢竟大家都看過基于現(xiàn)有技術(shù)水平的論文,,知道瓶頸在哪里,知道上限在哪里,。Sora就像跳出了人類科技,,突然到來的天頂星科技。 但是,! 如果使用了游戲引擎(比如虛幻5)的話,,這一切又都可以理解了。只能說之前的AI視頻走的是AI繪畫的老路,,想當(dāng)然的認(rèn)為 視頻=繪畫逐幀疊加,,Sora巧妙的換了個路線,依然是ChatGPT的邏輯,,用數(shù)據(jù)去驅(qū)動游戲引擎,,再由游戲引擎生成畫面。 這樣的技術(shù)并沒有超越現(xiàn)有科技水平,,只是骨骼驚奇,,之前確實沒有人想象到。 ChatGPT 先把接收到的文字轉(zhuǎn)化成代碼,,再用代碼驅(qū)動游戲引擎生成畫面,。 隨著Sora的成功,后續(xù)會有越來越多的AI大模型接入游戲引擎,,會對已有繪畫大模型造成降維打擊,! 至于視頻行業(yè)、傳統(tǒng)影視業(yè),,更是影響深遠,。 今年春晚任素汐那首歌《枕著光的她》,有一段陶瓷小人跳舞的鏡頭,,是用AI畫的。 而且是用Stable Diffusion + ControlNet + AnimateDiff + LCM + IPAdapter,,基于SD1.5,。 幸虧今年春節(jié)來的早! 要是晚幾天,,隨著生成式AI和游戲引擎技術(shù)的迅速迭代成長,,甚至連任素汐本人都可以用AI畫出來了! 不過,,按照OpenAI的尿性,,大概率是不開源的,但在路線圖既定的情況下,其他AI公司迅速跟上并不算難,。 壓力最大的可能是Midjourney,,當(dāng)生成式AI+游戲引擎成為標(biāo)配,Midjourney轉(zhuǎn)型難度加大,。 可以說,,不做AI大模型的電影公司,都得死,。 我是一位75歲以上的老人,!本站主要是些學(xué)習(xí)體驗與分享(其中會引用一些作品的原話并結(jié)合我的一生體會與經(jīng)驗加工整理而成!在此一并感謝,!如有不妥之處敬請與我聯(lián)系,我會妥善處理,,謝謝!)我寫的主要是中老年人各方面應(yīng)注意的事兒,!退休后我希望通過這個平臺廣交朋友,,互助交流,共筑美好生活,! |
|