如果我們問AI這樣一個簡潔的問題——
你覺得AI會如何回答,? 在揭曉AI的驚艷回答之前,我們先來看微博上一個網(wǎng)友對DeepSeek輸出結(jié)果的一條評論—— 沒錯,,這個問題看似簡單,但是要輸出一個讓人驚嘆的答案并不容易,。 它需要考慮玄武門之變的歷史背景,、要考慮李世民愧疚、掙扎,、野心,、抱負(fù)等可能的復(fù)雜心理,要考慮行文的語氣和身份的合一,,要考慮“深夜”,、“獨(dú)白”等問題設(shè)定。 我們看最近震驚AI圈的DeepSeek R1模型是如何思考的,,以下是它在給出一個驚艷回答之前同樣驚艷的思考過程——
經(jīng)過以上細(xì)膩、嚴(yán)謹(jǐn),、自洽,、深刻的思考,DeepSeek在思考8秒之后輸出了以下結(jié)果——
感覺如何,? 我將以上的回復(fù)截圖發(fā)到了微博上,這條微博被轉(zhuǎn)了接近2000次,,微博CEO@來去之間,、@谷大白話、@林熊貓等博主都用轉(zhuǎn)發(fā)表達(dá)了對這個輸出的認(rèn)可,。 我們看最近震驚AI圈的DeepSeek R1模型是如何思考的,以下是它在給出一個驚艷回答之前同樣驚艷的思考過程——無數(shù)網(wǎng)友感嘆那句——“后世若嫌這墨色太腥,,便讓他們?nèi)プx我用二十年光陰漂白的青史,。” 驚為天人,,難以置信,。 如果我們無法理解上述的輸出有多好,那么咱們一起來看一看GPT4o,、Claude,、豆包、Kimi的答案,。 GPT4o 輸出結(jié)果 Claude Sonnet3.5 輸出結(jié)果 “豆包”輸出結(jié)果 “Kimi探索版”輸出結(jié)果 沒有對比就沒有傷害,可以看到,,DeepSeek的思考與表達(dá)的確碾壓了上述所有模型,。 它的思考過程細(xì)膩、自洽,、深刻,、全面,輸出結(jié)果在語氣,、結(jié)構(gòu),、邏輯上天衣無縫,,讓人服氣。 很顯然,,它的回答是極其優(yōu)秀的,,深入研究,會發(fā)現(xiàn)它牛逼在下面幾個方面—— 第一,,它首先在語氣上還原了一個帝王的語氣,。 而上面其他模型輸出盡管表達(dá)了意思,但語氣完全不對,。 李世民作為千古一君,,絕不可能用上面四家輸出結(jié)果那樣傻的語氣說話,而DeepSeek也并沒有用力過猛,,用相對古典的文字但并沒有直接用文言文,,體貼地兼顧了可讀性。 第二,,它對歷史細(xì)節(jié)異常熟悉,。 我猜測這大概率和它支持“深度探索”和“聯(lián)網(wǎng)搜索”同時開啟有關(guān)。 “太極宮”,、“甘露殿”,、“掖庭局”、“觀音婢”,、“宮門魚符”完全還原了唐初的歷史稱謂,。 我特意查了一下,“觀音婢”是李世民的長孫皇后的乳名,,“掖庭局”是內(nèi)廷用于史官和其他人員的一個專屬機(jī)構(gòu),。 “魏徵”我以為是想寫“魏征”寫錯了,后來發(fā)現(xiàn)“征”是“徵”的簡體字,,可以說這個AI非常講究了,。 第三,和其他AI泛泛而談的各種大詞不同,,Deepseek的輸出極其具體而充滿驚人的細(xì)節(jié),。 “狼毫蘸墨時發(fā)現(xiàn)指尖殘留著未洗凈的血痂”,,“史官們此刻定在掖庭局爭吵,。該用”誅”還是”戮”,”迫”還是”承”,?!爸皇沁@次,他不敢觸碰我甲胄上元吉的掌印” 這些讓畫面躍然紙上的句子,,每一句都沒有寫“愧疚與野心,,掙扎與抱負(fù)”,,但每一句都寫的是“愧疚與野心,掙扎與抱負(fù)”,,其中行文的隱喻拿捏非常到位,,很高級。 第四,,Deepseek這個輸出結(jié)果另一個神來之筆,,就是在獨(dú)白文本中“自作主張”地加入了括號中的場景描述。 這一操作,,一下就讓整個輸出的畫面感撲面而來,,讀者仿如親歷,而這完全沒有在提示詞中提出,。
這些句子的確很難相信是AI寫的,。 而(“忽然扔筆,抓起銅鏡”)這句也隱喻了魏征的名言“以銅為鏡,,可以正衣襟,;以史為鏡,可以知興衰,;以人為鏡,,可以知得失”。 你說這AI成精了,,我都信,。 第五,最重要的,,DeepSeek預(yù)判了用戶的需求,。 再回顧一下我輸入的提示詞—— 我的輸入已經(jīng)非常簡潔了,不能再壓縮了,,并且沒有任何形容詞,,沒有任何傾向性。 但神奇的是,,它顯然知道我要什么,,比如這當(dāng)然不是一個要求精確的數(shù)理題,它自然想到要給輸出加上文學(xué)性,,這種預(yù)判在很大程度上表現(xiàn)出了“高級的智能”,。 當(dāng)然,一個值得商榷的點(diǎn)是,根據(jù)史實(shí),,魏征是在玄武門之變之后才見到李世民的,,因此是不可能當(dāng)天在朱雀大街空手奪刀的,但以魏征的性格,,這似乎又是合乎情理,。 但anyway,瑕不掩瑜,。 在微博的所有評論中,,有一條讓我印象深刻,一位微博網(wǎng)友質(zhì)疑DeepSeek的這段輸出是不是隱藏了提示詞,,懷疑我前面加了一大段復(fù)雜的提示詞,,而展示給大家的這句只是一句觸發(fā)詞。 這句評論之所以單獨(dú)拿出來說,,是因?yàn)槟芟氲健半[藏提示詞”的用戶,,其實(shí)已經(jīng)是AI的高級用戶了,而這樣的用戶也不相信這是AI直接寫出來的,,這從一個側(cè)面說明了DeepSeek強(qiáng)大的實(shí)力,。 而正是這種強(qiáng)大的實(shí)力讓衛(wèi)夕從春節(jié)假期模式切換出來,連夜碼了這篇7000字長文,。 我上傳一個錄屏,,證明一下我木有隱藏提示詞—— 僅僅只是展示這樣一個驚艷的Case,顯然不是衛(wèi)夕的風(fēng)格,,事實(shí)上,,以小窺大,這個小的Case引發(fā)了我諸多思考,,以下是我的十點(diǎn)思考—— 1. DeepSeek“開源+新訓(xùn)練方法+低成本+高性能”大概率讓國內(nèi)競爭對手很難心態(tài)平和地過年了,。 去年讓AI圈沒辦法好好過年的是OpenAI的Sora,而今年則是來自國內(nèi)的DeepSeek,。 從Meta員工在Reddit上說DeepSeek引起Meta AI部門恐慌的帖子看,,美國AI巨頭大概率度過了一個彷徨的一月,而國內(nèi)的AI產(chǎn)業(yè)界,,無論是大廠還是創(chuàng)業(yè)公司,,所受到的沖擊,毫無疑問不會比硅谷的AI公司小,。 我其實(shí)十分好奇,,張一鳴、馬化騰,、楊植麟,、王小川、李開復(fù)們,,這些同樣壓重注的局中人,,面對DeepSeek的沖擊,此刻正在做什么,、想什么,? 于是我在Deepseek里問了這樣一個問題——
Deepseek縝密地分析了一通,,山姆奧特曼是這樣講話結(jié)尾的—— 2. 所有的提示詞都值得用DeepSeek R1重新試一次,; 這個重新試一次,,并不是只將原來的提示詞原封不動地丟給DeepSeek R1,而是要針對這個智能程度更高的模型重新調(diào)整提示詞,。 舉個例子,,原本是一個本科的實(shí)習(xí)生來實(shí)習(xí),現(xiàn)在變成一個博士生來實(shí)習(xí),,那作為帶他的Leader,,同樣布置一個任務(wù),你跟他說的話肯定要進(jìn)行相應(yīng)的調(diào)整,。 DeepSeek R1的訓(xùn)練流程中引入了冷啟動數(shù)據(jù)和格式獎勵機(jī)制,,強(qiáng)制規(guī)范輸出結(jié)構(gòu)(如使用think和answer標(biāo)簽),其實(shí)R1的思考過程即標(biāo)簽內(nèi)的內(nèi)容其實(shí)對調(diào)整提示詞有著非常巨大的啟示作用,。 此外,,多項(xiàng)測試表明,R1對提示詞形式敏感,,零樣本設(shè)置效果更佳,,而少樣本提示可能因“過度思考”降低效率,這提示用戶需重新設(shè)計(jì)提示結(jié)構(gòu)(如明確步驟劃分,、減少冗余示例) 3. Deepseek R1的思考過程價值被低估,。 和在其他模型中加入思維鏈提示詞“請一步一步思考”不同,Deepseek R1是真思考,,不是其他模型由于能力有限的“表演思考”,。 過往模型的“思維鏈”(Chain-of-Thought, CoT)能力依賴于模型的規(guī)模和數(shù)據(jù)覆蓋度,其在實(shí)際體驗(yàn)中往往生成看似合理的步驟,,但實(shí)際上缺乏對中間邏輯的嚴(yán)格驗(yàn)證,。 盡管Deepseek R1的think標(biāo)簽也是模型強(qiáng)制輸出的結(jié)果,但由于模型能力上限的提升,其呈現(xiàn)的思考過程細(xì)膩,、自洽,、深刻、全面,。 我的個人體驗(yàn)是,,在很多時候我閱讀Deepseek R1的思考過程的收獲比閱讀更有收獲,更能體會到模型能力的邊界,。 4. DeepSeek一個容易被忽視的貢獻(xiàn)是,,它第一次大幅降低了國內(nèi)用戶接觸高階AI的門檻。 事實(shí)上,,ChatGPT,、Claude、Gemini的高階模型在文本創(chuàng)作,、代碼生成等多個領(lǐng)域上已經(jīng)到了非常高的水準(zhǔn),。 我曾經(jīng)在我的另一個小號中寫過一篇長文描述展示過這種水準(zhǔn),但由于眾所周知的原因,,國內(nèi)的絕大多數(shù)用戶的其實(shí)是用不上的,。 這樣其實(shí)導(dǎo)致了一個認(rèn)知差,對于大部分普通人而言,,他們印象中的AI還是那個只會說“首先,、其次、總而言之”這類AI味撲面而來的平庸AI,。 而DeepSeek R1是國內(nèi)普通用戶第一次不用XX就可以免費(fèi)無限量使用的唯一C端高階產(chǎn)品,。 這也是為什么上面這個Case發(fā)在微博非常多網(wǎng)友發(fā)出“哇!”,、“我擦,!”、“太牛逼了”,、“成精了”的感嘆,。 事實(shí)上,同樣的內(nèi)容,,很多用過Claude Sonnet3.5的即刻網(wǎng)友就表現(xiàn)的相對淡定,。 5. 如果非要說一個DeepSeek的缺點(diǎn),那就是有時候會“用力過猛” 所謂用力過猛,,是指有時候當(dāng)你輸入一些提示詞的時候,,它會為了達(dá)到你提示詞的效果而控制不好火候。 我舉個一個例子,,我在給我閨女生成適合她閱讀故事的時候,,提示詞的要求中加了“用詞豐富”這個詞,,結(jié)果DeepSeek生成了下面的文字—— 很顯然,,DeepSeek的輸出用詞過于豐富了,,并不適合小朋友閱讀。 當(dāng)然,,這種問題也容易解決,去掉這個“用詞豐富”這個詞或者關(guān)閉“深度思考”標(biāo)簽就完了,,這其實(shí)就是“殺雞用牛刀”所產(chǎn)生的“幸福的煩惱”,。 此外,從我的個人體驗(yàn)看,,DeepSeek的聯(lián)網(wǎng)搜索貌似優(yōu)先搜索的是國內(nèi)網(wǎng)頁,,哪怕我指定它搜索英文網(wǎng)站和英文內(nèi)容,它還是會混進(jìn)去不少國內(nèi)網(wǎng)頁的結(jié)果,,不知道這是否和那個眾所周知的原因有關(guān),。 6. “美國限制反促國產(chǎn)AI崛起”是無稽之談 有一種論調(diào),說DeepSeek的證明“美國限制反促國產(chǎn)AI崛起”,,我看微博上居然還有人創(chuàng)建了這個話題,,在我看來這,這純屬無稽之談,。 DeepSeek的突破無疑讓人印象深刻,,但如果將其歸因于美國的芯片封鎖的結(jié)果就純屬表面歸因了。 DeepSeek本身在封鎖前就囤積了大量的英偉達(dá)芯片,,而芯片數(shù)量的優(yōu)勢在某種意義上恰恰使DeepSeek能實(shí)行烏托邦般的技術(shù)探索:“無層級,、無審批、資源調(diào)用無上限”(梁文鋒采訪語),。 事實(shí)上,,根據(jù)中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟數(shù)據(jù),2024年中國AI服務(wù)器市場英偉達(dá)份額仍達(dá)85%,。 另外一個未經(jīng)驗(yàn)證的數(shù)據(jù)是,,僅Meta一家所擁有的英偉達(dá)高端芯片的數(shù)量,就超過了國內(nèi)所有頭部大廠之和,。 僅憑DeepSeek一家的創(chuàng)新,,依然無法改變中美絕對算力存在巨大差距的事實(shí),顯然不能因?yàn)镈eepSeek的目前在開源模型上的領(lǐng)先就認(rèn)為硅谷AI大廠們遇到了“資源詛咒”,,這顯然是不客觀的,。 7. AI的“消費(fèi)型內(nèi)容時代”已經(jīng)來了! 什么意思,?以DeepSeek R1為代表的高階AI,,在內(nèi)容創(chuàng)作層面已經(jīng)接近通過“藝術(shù)家圖靈測試”,。 即人們已經(jīng)區(qū)分不了這些文字到底是AI生成的還是藝術(shù)家創(chuàng)作的,這就是標(biāo)志著“消費(fèi)型內(nèi)容時代”到來,。 “AI消費(fèi)型內(nèi)容時代”意味著很多,,意味著文藝逐漸進(jìn)入“亂紀(jì)元”的新階段,意味著舊的創(chuàng)意體系和生產(chǎn)結(jié)構(gòu)會逐步瓦解,,意味著內(nèi)容領(lǐng)域依賴人“原創(chuàng)+優(yōu)質(zhì)+高頻”的不可能三角開始松動,,意味著復(fù)合科技和人文的“π”型人才可能比單一的“T”型人才擁有更多的結(jié)構(gòu)性優(yōu)勢,意味著很多很多….. 但無論如何,,人和人的創(chuàng)意,,依然是一切內(nèi)容生產(chǎn)的起點(diǎn)。 記住,,AI不會沒有起點(diǎn)地自動工作,,而人的創(chuàng)意指令永遠(yuǎn)是AI創(chuàng)造的起點(diǎn),事實(shí)上,,這篇文章的誕生也源于一個有意思的問題,。 8. 面對DeepSeek R1這種開掛的高階AI,普通人的策略還是兩個字——多用 很顯然,,我們之前對常規(guī)AI所積累的具體技巧,,在面對R1的高階AI大概率會失效,但如何清晰表達(dá),、如何按貝葉斯公式迭代的總原則是不變的,。 這就像是做菜,放鹽嘗一口,,放多了再加水,,試多了自然知道火候。 我看過太多例子,,一個新工具出來,,隨便試一次,發(fā)現(xiàn)結(jié)果不符合預(yù)期,,然后就得出一個結(jié)論——“也就那樣”,,從此再也不碰了。 事實(shí)上,,面對DeepSeek R1這的模型,,輸出效果不好,大概率是我們的問題,,而不是它的問題,。 我媳婦兒之前用Midjourney畫圖死活搞不出復(fù)古膠片感,后來硬是試出“1990年柯達(dá)褪色+漏光”這種奇葩關(guān)鍵詞,,Midjourney立馬給跪,。 說白了,,再牛逼的模型本質(zhì)上就跟你家狗子一樣,處久了就能聽懂你的各種指令,,但首先你得天天帶它遛彎,。 9. 從DeepSeek發(fā)布節(jié)奏看,它沒有發(fā)布的東西可能更值得期待 很少有人注意到DeepSeek的發(fā)布節(jié)奏,,12月26日發(fā)布V3,,1月20日發(fā)布R1,二者相隔的時間僅僅24天,。 我不知道這個公司的發(fā)布節(jié)奏是如何的決策的,,但可以肯定,它顯然沒有有OpenAI每次發(fā)布會精準(zhǔn)阻擊Google所表現(xiàn)出的雞賊,,更沒有山姆奧特曼每次為了融資在Twitter含糊其辭的放風(fēng),,有的只有優(yōu)雅的論文和爽快上架的開掛模型,。 而一個合理的猜測是,,DeepSeek因?yàn)橛凶銐虻募夹g(shù)儲備從而可以無視常規(guī)的發(fā)布節(jié)奏。 從這個意義上,,DeepSeek那個平均年齡25歲,、人數(shù)僅100+的年輕團(tuán)隊(duì)在2025年還會給產(chǎn)業(yè)界帶來哪些新的東西,由衷值得期待,。 10. 梁文鋒大概率被低估 當(dāng)Marc Andreessen,、Satya Nadella、Yann LeCun等硅谷頂級大佬將DeepSeek視為”東方神秘力量”時,,實(shí)質(zhì)是承認(rèn)中國團(tuán)隊(duì)開始參與定義技術(shù)演進(jìn)方向,,而非單純應(yīng)用落地。 梁文鋒的獨(dú)特性,,在于其同時具備量化投資的系統(tǒng)思維,、本土的務(wù)實(shí)精神以及硅谷式技術(shù)理想主義,而DeepSeek的MLA架構(gòu)和MoE稀疏結(jié)構(gòu),,標(biāo)志著大模型領(lǐng)域首次由國內(nèi)團(tuán)隊(duì)完成底層注意力機(jī)制革新,。 品玩的駱軼航老師在一篇長文中認(rèn)為將DeepSeek比喻成“AI界的拼多多”是有失偏頗的,我認(rèn)為這個說法是有洞見的,,DeepSeek和梁文鋒顯然無法簡單標(biāo)簽化,。 即刻網(wǎng)友@Chris-Su說,梁文鋒是極少數(shù)還沒被'廣泛解讀和學(xué)習(xí)’的頂級CEO,,的確,,這幾天硅谷媒體在逐句翻譯和研究梁文鋒的兩篇采訪稿,而美國電視臺CNBC做了一個長達(dá)40分鐘的專題片來專門討論DeepSeek,。 據(jù)我所知,,這在國內(nèi)技術(shù)發(fā)展史上是從來沒有過的事,。 從這個意義上,已經(jīng)是爽文男主角的梁文鋒大概率還是被低估了,。 結(jié)語 我用2023年DeepSeek成立發(fā)布做大模型公告時,,引用法國新浪潮導(dǎo)演特呂弗的一句話結(jié)束今天的文章——
|
|