人工智能[1506]歡迎來到AI的真實世界

趙站長的博客 2024-02-17 發(fā)布于北京

展開全文

20多年前,，我逃課去看《黑客帝國》。

墨菲斯說：歡迎來到真實世界,。

一下子夢醒了,，回到教室的時候，老師在講國有企業(yè)改制過程中的頂層設(shè)計問題,。

你看到的，就是真實嗎,？

時光荏苒,，終于忘記了很多人，終于忘記了很多事,。

一覺醒來,，AI圈里沸騰了，大家發(fā)現(xiàn)現(xiàn)實不存在了,。

OpenAI發(fā)布視頻大模型的預(yù)告,，能夠生成60秒完整視頻。

這個大模型叫Sora,。

作為一個AI工具的重度使用者,，平均每天使用生成式AI和AI繪畫工具超過2小時。

對Sora最感興趣的一點,，是它生成的畫面不崩,、不閃。

事實上,，現(xiàn)階段開源AI繪畫工具也能生成視頻,，但大多數(shù)在4秒之內(nèi),，而且最大的缺點是臉崩和閃爍。

臉崩的原因是很多大模型很難處理大幅畫面的時候的面部細(xì)節(jié),，閃爍的原因是現(xiàn)階段大模型都是逐幀生成畫面,，然后拼成視頻，每一幀的畫面細(xì)節(jié)有變化的時候就會閃爍,。

從這一點上來說,，在Sora面前，目前所有的視頻大模型都得跪下,。

有分析人士認(rèn)為,，Sora使用了游戲引擎。我也認(rèn)同這一觀點,，使用游戲引擎能夠巧妙的繞開逐幀生成畫面再拼接的弊端,。

英偉達高級科學(xué)家Jim Fan對Sora發(fā)表了一些自己的觀點：

Sora是一個數(shù)據(jù)驅(qū)動的物理引擎。它是對許多世界的模擬,，無論是真實的,，還是虛構(gòu)的。該模擬器通過去噪和梯度學(xué)習(xí)方式,，學(xué)習(xí)了復(fù)雜的渲染,、「直觀的」物理、長期推理和語義理解,。

如果Sora使用虛幻引擎5接受過大量合成數(shù)據(jù)的訓(xùn)練,，我不會感到驚訝的。必須如此,！

在ChatGPT3.5推出之前,，ChatGPT發(fā)布了幾個版本，雖然表現(xiàn)驚艷,，但能力有限,，也是不溫不火。3.5一炮走紅后,，再接再厲推出了付費的4.0版本,。

不管多么驚人，ChatGPT至少是有“前奏”的,，它的基本原理和運行邏輯,，以及進展，對AI感興趣的人,，都是有了解的,。

Sora的出現(xiàn)有點措手不及，就在昨天的時候，大家還在為AI視頻去閃問題絞盡腦汁,，畢竟大家都看過基于現(xiàn)有技術(shù)水平的論文,，知道瓶頸在哪里，知道上限在哪里,。Sora就像跳出了人類科技,，突然到來的天頂星科技。

但是,！

如果使用了游戲引擎（比如虛幻5）的話,，這一切又都可以理解了。只能說之前的AI視頻走的是AI繪畫的老路,，想當(dāng)然的認(rèn)為視頻=繪畫逐幀疊加,，Sora巧妙的換了個路線，依然是ChatGPT的邏輯,，用數(shù)據(jù)去驅(qū)動游戲引擎,，再由游戲引擎生成畫面。

這樣的技術(shù)并沒有超越現(xiàn)有科技水平,，只是骨骼驚奇,，之前確實沒有人想象到。

ChatGPT 先把接收到的文字轉(zhuǎn)化成代碼,，再用代碼驅(qū)動游戲引擎生成畫面,。

隨著Sora的成功，后續(xù)會有越來越多的AI大模型接入游戲引擎,，會對已有繪畫大模型造成降維打擊,！

至于視頻行業(yè)、傳統(tǒng)影視業(yè),，更是影響深遠,。

今年春晚任素汐那首歌《枕著光的她》，有一段陶瓷小人跳舞的鏡頭,，是用AI畫的。

而且是用Stable Diffusion + ControlNet + AnimateDiff + LCM + IPAdapter,，基于SD1.5,。

幸虧今年春節(jié)來的早！

要是晚幾天,，隨著生成式AI和游戲引擎技術(shù)的迅速迭代成長,，甚至連任素汐本人都可以用AI畫出來了！

不過,，按照OpenAI的尿性,，大概率是不開源的，但在路線圖既定的情況下，其他AI公司迅速跟上并不算難,。

壓力最大的可能是Midjourney,，當(dāng)生成式AI+游戲引擎成為標(biāo)配，Midjourney轉(zhuǎn)型難度加大,。

可以說,，不做AI大模型的電影公司，都得死,。

我是一位75歲以上的老人,！本站主要是些學(xué)習(xí)體驗與分享(其中會引用一些作品的原話并結(jié)合我的一生體會與經(jīng)驗加工整理而成！在此一并感謝,！如有不妥之處敬請與我聯(lián)系,我會妥善處理,，謝謝！)我寫的主要是中老年人各方面應(yīng)注意的事兒,！退休后我希望通過這個平臺廣交朋友,，互助交流，共筑美好生活,！

本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點,。請注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息，謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,，請點擊一鍵舉報。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻花（0） +1

來自：趙站長的博客 > 《人工智能大數(shù)據(jù)云計算物聯(lián)網(wǎng)》

舉報/認(rèn)領(lǐng)