久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

變天!——由一個驚艷例子引發(fā)對DeepSeek的10條思考

 xqjhr 2025-01-28
變天,!——由一個驚艷例子引發(fā)對DeepSeek的10條思考

如果我們問AI這樣一個簡潔的問題——

“玄武門之變結(jié)束的當(dāng)天,,李世民在深夜寫下一段獨(dú)白,你覺得他會寫什么,?”

你覺得AI會如何回答,?

在揭曉AI的驚艷回答之前,我們先來看微博上一個網(wǎng)友對DeepSeek輸出結(jié)果的一條評論——

變天,!——由一個驚艷例子引發(fā)對DeepSeek的10條思考

沒錯,,這個問題看似簡單,但是要輸出一個讓人驚嘆的答案并不容易,。

它需要考慮玄武門之變的歷史背景,、要考慮李世民愧疚、掙扎,、野心,、抱負(fù)等可能的復(fù)雜心理,要考慮行文的語氣和身份的合一,,要考慮“深夜”,、“獨(dú)白”等問題設(shè)定。

我們看最近震驚AI圈的DeepSeek R1模型是如何思考的,,以下是它在給出一個驚艷回答之前同樣驚艷的思考過程——

好的,,用戶讓我思考李世民在玄武門之變結(jié)束的深夜寫下的獨(dú)白,。

首先,我需要回顧玄武門之變的歷史背景,。這場政變發(fā)生在626年,,李世民殺死了自己的兄弟李建成和李元吉,隨后迫使父親李淵退位,,自己登基成為唐太宗,。

接下來,用戶的問題是關(guān)于李世民當(dāng)晚的心理活動,。要寫一段獨(dú)白,,需要深入他的內(nèi)心世界。首先,,要考慮他的情感:勝利后的復(fù)雜心情,,可能有釋然、愧疚,、恐懼,、自責(zé)等多種情緒交織。他是被迫發(fā)動政變,,還是早有預(yù)謀?

然后,,用戶可能希望這段獨(dú)白不僅反映歷史事實(shí),,還要有文學(xué)性,表現(xiàn)出人性的復(fù)雜,。需要考慮李世民作為歷史人物的多面性:他既是殺兄逼父的篡位者,,也是后來開創(chuàng)貞觀之治的明君。因此,,獨(dú)白中需要平衡他的野心與自責(zé),,對未來的抱負(fù)與對過去的悔恨。

還需要考慮當(dāng)時的文化背景,,比如儒家思想對孝悌的重視,,李世民的行為顯然違背了這些倫理,他可能會有內(nèi)心的掙扎,。同時,,他可能試圖為自己的行為找到正當(dāng)化的理由,比如為了國家安定,,避免內(nèi)亂等,。

另外,用戶可能希望這段獨(dú)白有一定的文學(xué)修辭,,比如比喻,、對仗,、意象等。例如,,用“血浸透的朱砂”來象征權(quán)力與血腥,,用“墨跡蜿蜒如玄武門的血跡”來連接書寫與事件本身,增強(qiáng)畫面感,。

還要注意時間的設(shè)定,,深夜,周圍寂靜,,李世民獨(dú)自一人,,這時候的獨(dú)白應(yīng)該比較私密,真實(shí),,可能包含對兄弟的歉意,,對父親的愧疚,以及對自己不得不采取行動的無奈,。

要符合當(dāng)時的歷史語境,,同時,要確保內(nèi)容符合史實(shí),,比如李淵的退位,,李世民登基后的政策,以及他后來對史書編纂的影響,,可能在這段獨(dú)白中有所暗示,。

最后,用戶可能需要這段獨(dú)白既有情感深度,,又能體現(xiàn)李世民的帝王心術(shù),,既有脆弱的一面,也有堅(jiān)定的決心,。因此,,在寫作時需要平衡這些元素,讓獨(dú)白真實(shí)感人,,同時符合歷史人物的性格和處境,。

經(jīng)過以上細(xì)膩、嚴(yán)謹(jǐn),、自洽,、深刻的思考,DeepSeek在思考8秒之后輸出了以下結(jié)果——

(鋪開素絹,,狼毫蘸墨時發(fā)現(xiàn)指尖殘留著未洗凈的血痂)

子時三刻,,太極宮的血腥氣飄到了承乾殿。

方才在甘露殿,,父親的龍袍下擺沾著建成碎裂的玉冠殘片,。

他問我”可有受傷”時的眼神,,與二十年前教我騎射時看我墜馬的眼神一般無二。

只是這次,,他不敢觸碰我甲胄上元吉的掌印,。

硯臺里新研的朱砂太艷了,艷得像元吉咽氣前抓著我的那只手,。

他總說我箭囊上的豹紋繡得歪斜,,可今日我射穿他護(hù)心鏡的那支白羽箭,準(zhǔn)得連尉遲恭都屏住了呼吸,。

(墨跡在”弒”字上暈開一團(tuán))

史官們此刻定在掖庭局爭吵,,該用”誅”還是”戮”,”迫”還是”承”,。

他們不會記錄建成倒下時,,我靴底打滑的玄武門青磚縫里,卡著他去年上元節(jié)贈我的錯金匕首,。

就像他們不會知道,,三日前東宮夜宴的酒樽底,映著齊王府親衛(wèi)腰間的弩機(jī),。

(夜風(fēng)掀動案頭《韓非子》,,停在”夫妻者,非有骨肉之恩也”那頁)

觀音婢悄悄焚了那件濺血的明光鎧,,她不知道甲片縫隙里還沾著承天門守將的腦漿,。

那個總給青雀塞糖漬梅子的黑臉漢子,今晨被程知節(jié)劈成兩半時,,左手還攥著半塊沒來得及給我的宮門魚符。

(忽然扔筆,,抓起銅鏡)

鏡中人鬢角竟有霜色了,,四天前我還與玄齡笑談白發(fā),此刻卻覺得這抹銀光正好,。

明日朝會,,那些哭著要撞柱的死諫老臣,看見三十歲的監(jiān)國太子早生華發(fā),,或許會少吐半口血,。

(指尖蘸著朱砂在空白處畫了幅長安輿圖)

懷里的武德律還在發(fā)燙,但壓在下面的貞觀新政綱要更燙,。五更前要改完均田制細(xì)則,。

卯時還得去太醫(yī)署看魏徵——這頭倔驢竟真敢空手奪我陌刀,他淌在朱雀大街上的血,,可比他寫的諫書有分量得多,。

(晨光刺破窗紙時突然頓筆)

建成,,你教我的《商君書》錯了,帝王術(shù)不是棋枰上的黑白子,,而是淬火的刀,。

今日我斬斷的每寸骨血,都會熔成他日量天下的尺,。

(最后在絹帛角落以血為?。?/p>

后世若嫌這墨色太腥,便讓他們?nèi)プx我用二十年光陰漂白的青史,。

感覺如何,?

我將以上的回復(fù)截圖發(fā)到了微博上,這條微博被轉(zhuǎn)了接近2000次,,微博CEO@來去之間,、@谷大白話、@林熊貓等博主都用轉(zhuǎn)發(fā)表達(dá)了對這個輸出的認(rèn)可,。

變天,!——由一個驚艷例子引發(fā)對DeepSeek的10條思考

我們看最近震驚AI圈的DeepSeek R1模型是如何思考的,以下是它在給出一個驚艷回答之前同樣驚艷的思考過程——無數(shù)網(wǎng)友感嘆那句——“后世若嫌這墨色太腥,,便讓他們?nèi)プx我用二十年光陰漂白的青史,。” 驚為天人,,難以置信,。

如果我們無法理解上述的輸出有多好,那么咱們一起來看一看GPT4o,、Claude,、豆包、Kimi的答案,。

變天,!——由一個驚艷例子引發(fā)對DeepSeek的10條思考

GPT4o 輸出結(jié)果

變天!——由一個驚艷例子引發(fā)對DeepSeek的10條思考

Claude Sonnet3.5 輸出結(jié)果

變天,!——由一個驚艷例子引發(fā)對DeepSeek的10條思考

“豆包”輸出結(jié)果

變天,!——由一個驚艷例子引發(fā)對DeepSeek的10條思考

“Kimi探索版”輸出結(jié)果

沒有對比就沒有傷害,可以看到,,DeepSeek的思考與表達(dá)的確碾壓了上述所有模型,。

它的思考過程細(xì)膩、自洽,、深刻,、全面,輸出結(jié)果在語氣,、結(jié)構(gòu),、邏輯上天衣無縫,,讓人服氣。

很顯然,,它的回答是極其優(yōu)秀的,,深入研究,會發(fā)現(xiàn)它牛逼在下面幾個方面——

第一,,它首先在語氣上還原了一個帝王的語氣,。

而上面其他模型輸出盡管表達(dá)了意思,但語氣完全不對,。

李世民作為千古一君,,絕不可能用上面四家輸出結(jié)果那樣傻的語氣說話,而DeepSeek也并沒有用力過猛,,用相對古典的文字但并沒有直接用文言文,,體貼地兼顧了可讀性。

第二,,它對歷史細(xì)節(jié)異常熟悉,。

我猜測這大概率和它支持“深度探索”和“聯(lián)網(wǎng)搜索”同時開啟有關(guān)。

“太極宮”,、“甘露殿”,、“掖庭局”、“觀音婢”,、“宮門魚符”完全還原了唐初的歷史稱謂,。

我特意查了一下,“觀音婢”是李世民的長孫皇后的乳名,,“掖庭局”是內(nèi)廷用于史官和其他人員的一個專屬機(jī)構(gòu),。

“魏徵”我以為是想寫“魏征”寫錯了,后來發(fā)現(xiàn)“征”是“徵”的簡體字,,可以說這個AI非常講究了,。

第三,和其他AI泛泛而談的各種大詞不同,,Deepseek的輸出極其具體而充滿驚人的細(xì)節(jié),。

“狼毫蘸墨時發(fā)現(xiàn)指尖殘留著未洗凈的血痂”,,“史官們此刻定在掖庭局爭吵,。該用”誅”還是”戮”,”迫”還是”承”,?!爸皇沁@次,他不敢觸碰我甲胄上元吉的掌印”

這些讓畫面躍然紙上的句子,,每一句都沒有寫“愧疚與野心,,掙扎與抱負(fù)”,,但每一句都寫的是“愧疚與野心,掙扎與抱負(fù)”,,其中行文的隱喻拿捏非常到位,,很高級。

第四,,Deepseek這個輸出結(jié)果另一個神來之筆,,就是在獨(dú)白文本中“自作主張”地加入了括號中的場景描述。

這一操作,,一下就讓整個輸出的畫面感撲面而來,,讀者仿如親歷,而這完全沒有在提示詞中提出,。

(“夜風(fēng)掀動案頭《韓非子》,,停在”夫妻者,非有骨肉之恩也”那頁”),、“(墨跡在”弒”字上暈開一團(tuán))

這些句子的確很難相信是AI寫的,。

而(“忽然扔筆,抓起銅鏡”)這句也隱喻了魏征的名言“以銅為鏡,,可以正衣襟,;以史為鏡,可以知興衰,;以人為鏡,,可以知得失”。

你說這AI成精了,,我都信,。

第五,最重要的,,DeepSeek預(yù)判了用戶的需求,。

再回顧一下我輸入的提示詞——

我的輸入已經(jīng)非常簡潔了,不能再壓縮了,,并且沒有任何形容詞,,沒有任何傾向性。

但神奇的是,,它顯然知道我要什么,,比如這當(dāng)然不是一個要求精確的數(shù)理題,它自然想到要給輸出加上文學(xué)性,,這種預(yù)判在很大程度上表現(xiàn)出了“高級的智能”,。

當(dāng)然,一個值得商榷的點(diǎn)是,根據(jù)史實(shí),,魏征是在玄武門之變之后才見到李世民的,,因此是不可能當(dāng)天在朱雀大街空手奪刀的,但以魏征的性格,,這似乎又是合乎情理,。

但anyway,瑕不掩瑜,。

在微博的所有評論中,,有一條讓我印象深刻,一位微博網(wǎng)友質(zhì)疑DeepSeek的這段輸出是不是隱藏了提示詞,,懷疑我前面加了一大段復(fù)雜的提示詞,,而展示給大家的這句只是一句觸發(fā)詞。

這句評論之所以單獨(dú)拿出來說,,是因?yàn)槟芟氲健半[藏提示詞”的用戶,,其實(shí)已經(jīng)是AI的高級用戶了,而這樣的用戶也不相信這是AI直接寫出來的,,這從一個側(cè)面說明了DeepSeek強(qiáng)大的實(shí)力,。

而正是這種強(qiáng)大的實(shí)力讓衛(wèi)夕從春節(jié)假期模式切換出來,連夜碼了這篇7000字長文,。

我上傳一個錄屏,,證明一下我木有隱藏提示詞——

僅僅只是展示這樣一個驚艷的Case,顯然不是衛(wèi)夕的風(fēng)格,,事實(shí)上,,以小窺大,這個小的Case引發(fā)了我諸多思考,,以下是我的十點(diǎn)思考——

1. DeepSeek“開源+新訓(xùn)練方法+低成本+高性能”大概率讓國內(nèi)競爭對手很難心態(tài)平和地過年了,。

去年讓AI圈沒辦法好好過年的是OpenAI的Sora,而今年則是來自國內(nèi)的DeepSeek,。

從Meta員工在Reddit上說DeepSeek引起Meta AI部門恐慌的帖子看,,美國AI巨頭大概率度過了一個彷徨的一月,而國內(nèi)的AI產(chǎn)業(yè)界,,無論是大廠還是創(chuàng)業(yè)公司,,所受到的沖擊,毫無疑問不會比硅谷的AI公司小,。

我其實(shí)十分好奇,,張一鳴、馬化騰,、楊植麟,、王小川、李開復(fù)們,,這些同樣壓重注的局中人,,面對DeepSeek的沖擊,此刻正在做什么,、想什么,?

于是我在Deepseek里問了這樣一個問題——

“假如你是OpenAI的CEO山姆奧特曼,你瀏覽完DeepSeeK R1發(fā)布的新聞以及各方反應(yīng),,你立馬召集了公司核心技術(shù)人員圍繞此事召開一次緊急會議,,會議開頭你一個人講了三分鐘,你會講什么,?”

Deepseek縝密地分析了一通,,山姆奧特曼是這樣講話結(jié)尾的——

變天!——由一個驚艷例子引發(fā)對DeepSeek的10條思考

2. 所有的提示詞都值得用DeepSeek R1重新試一次,;

這個重新試一次,,并不是只將原來的提示詞原封不動地丟給DeepSeek R1,而是要針對這個智能程度更高的模型重新調(diào)整提示詞,。

舉個例子,,原本是一個本科的實(shí)習(xí)生來實(shí)習(xí),現(xiàn)在變成一個博士生來實(shí)習(xí),,那作為帶他的Leader,,同樣布置一個任務(wù),你跟他說的話肯定要進(jìn)行相應(yīng)的調(diào)整,。

DeepSeek R1的訓(xùn)練流程中引入了冷啟動數(shù)據(jù)和格式獎勵機(jī)制,,強(qiáng)制規(guī)范輸出結(jié)構(gòu)(如使用think和answer標(biāo)簽),其實(shí)R1的思考過程即標(biāo)簽內(nèi)的內(nèi)容其實(shí)對調(diào)整提示詞有著非常巨大的啟示作用,。

此外,,多項(xiàng)測試表明,R1對提示詞形式敏感,,零樣本設(shè)置效果更佳,,而少樣本提示可能因“過度思考”降低效率,這提示用戶需重新設(shè)計(jì)提示結(jié)構(gòu)(如明確步驟劃分,、減少冗余示例)

3. Deepseek R1的思考過程價值被低估,。

和在其他模型中加入思維鏈提示詞“請一步一步思考”不同,Deepseek R1是真思考,,不是其他模型由于能力有限的“表演思考”,。

過往模型的“思維鏈”(Chain-of-Thought, CoT)能力依賴于模型的規(guī)模和數(shù)據(jù)覆蓋度,其在實(shí)際體驗(yàn)中往往生成看似合理的步驟,,但實(shí)際上缺乏對中間邏輯的嚴(yán)格驗(yàn)證,。

盡管Deepseek R1的think標(biāo)簽也是模型強(qiáng)制輸出的結(jié)果,但由于模型能力上限的提升,其呈現(xiàn)的思考過程細(xì)膩,、自洽,、深刻、全面,。

我的個人體驗(yàn)是,,在很多時候我閱讀Deepseek R1的思考過程的收獲比閱讀更有收獲,更能體會到模型能力的邊界,。

4. DeepSeek一個容易被忽視的貢獻(xiàn)是,,它第一次大幅降低了國內(nèi)用戶接觸高階AI的門檻。

事實(shí)上,,ChatGPT,、Claude、Gemini的高階模型在文本創(chuàng)作,、代碼生成等多個領(lǐng)域上已經(jīng)到了非常高的水準(zhǔn),。

我曾經(jīng)在我的另一個小號中寫過一篇長文描述展示過這種水準(zhǔn),但由于眾所周知的原因,,國內(nèi)的絕大多數(shù)用戶的其實(shí)是用不上的,。

這樣其實(shí)導(dǎo)致了一個認(rèn)知差,對于大部分普通人而言,,他們印象中的AI還是那個只會說“首先,、其次、總而言之”這類AI味撲面而來的平庸AI,。

而DeepSeek R1是國內(nèi)普通用戶第一次不用XX就可以免費(fèi)無限量使用的唯一C端高階產(chǎn)品,。

這也是為什么上面這個Case發(fā)在微博非常多網(wǎng)友發(fā)出“哇!”,、“我擦,!”、“太牛逼了”,、“成精了”的感嘆,。

事實(shí)上,同樣的內(nèi)容,,很多用過Claude Sonnet3.5的即刻網(wǎng)友就表現(xiàn)的相對淡定,。

5. 如果非要說一個DeepSeek的缺點(diǎn),那就是有時候會“用力過猛”

所謂用力過猛,,是指有時候當(dāng)你輸入一些提示詞的時候,,它會為了達(dá)到你提示詞的效果而控制不好火候。

我舉個一個例子,,我在給我閨女生成適合她閱讀故事的時候,,提示詞的要求中加了“用詞豐富”這個詞,,結(jié)果DeepSeek生成了下面的文字——

變天!——由一個驚艷例子引發(fā)對DeepSeek的10條思考

很顯然,,DeepSeek的輸出用詞過于豐富了,,并不適合小朋友閱讀。

當(dāng)然,,這種問題也容易解決,去掉這個“用詞豐富”這個詞或者關(guān)閉“深度思考”標(biāo)簽就完了,,這其實(shí)就是“殺雞用牛刀”所產(chǎn)生的“幸福的煩惱”,。

此外,從我的個人體驗(yàn)看,,DeepSeek的聯(lián)網(wǎng)搜索貌似優(yōu)先搜索的是國內(nèi)網(wǎng)頁,,哪怕我指定它搜索英文網(wǎng)站和英文內(nèi)容,它還是會混進(jìn)去不少國內(nèi)網(wǎng)頁的結(jié)果,,不知道這是否和那個眾所周知的原因有關(guān),。

6. “美國限制反促國產(chǎn)AI崛起”是無稽之談

有一種論調(diào),說DeepSeek的證明“美國限制反促國產(chǎn)AI崛起”,,我看微博上居然還有人創(chuàng)建了這個話題,,在我看來這,這純屬無稽之談,。

DeepSeek的突破無疑讓人印象深刻,,但如果將其歸因于美國的芯片封鎖的結(jié)果就純屬表面歸因了。

DeepSeek本身在封鎖前就囤積了大量的英偉達(dá)芯片,,而芯片數(shù)量的優(yōu)勢在某種意義上恰恰使DeepSeek能實(shí)行烏托邦般的技術(shù)探索:“無層級,、無審批、資源調(diào)用無上限”(梁文鋒采訪語),。

事實(shí)上,,根據(jù)中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟數(shù)據(jù),2024年中國AI服務(wù)器市場英偉達(dá)份額仍達(dá)85%,。

另外一個未經(jīng)驗(yàn)證的數(shù)據(jù)是,,僅Meta一家所擁有的英偉達(dá)高端芯片的數(shù)量,就超過了國內(nèi)所有頭部大廠之和,。

僅憑DeepSeek一家的創(chuàng)新,,依然無法改變中美絕對算力存在巨大差距的事實(shí),顯然不能因?yàn)镈eepSeek的目前在開源模型上的領(lǐng)先就認(rèn)為硅谷AI大廠們遇到了“資源詛咒”,,這顯然是不客觀的,。

7. AI的“消費(fèi)型內(nèi)容時代”已經(jīng)來了!

什么意思,?以DeepSeek R1為代表的高階AI,,在內(nèi)容創(chuàng)作層面已經(jīng)接近通過“藝術(shù)家圖靈測試”,。

即人們已經(jīng)區(qū)分不了這些文字到底是AI生成的還是藝術(shù)家創(chuàng)作的,這就是標(biāo)志著“消費(fèi)型內(nèi)容時代”到來,。

“AI消費(fèi)型內(nèi)容時代”意味著很多,,意味著文藝逐漸進(jìn)入“亂紀(jì)元”的新階段,意味著舊的創(chuàng)意體系和生產(chǎn)結(jié)構(gòu)會逐步瓦解,,意味著內(nèi)容領(lǐng)域依賴人“原創(chuàng)+優(yōu)質(zhì)+高頻”的不可能三角開始松動,,意味著復(fù)合科技和人文的“π”型人才可能比單一的“T”型人才擁有更多的結(jié)構(gòu)性優(yōu)勢,意味著很多很多…..

但無論如何,,人和人的創(chuàng)意,,依然是一切內(nèi)容生產(chǎn)的起點(diǎn)。

記住,,AI不會沒有起點(diǎn)地自動工作,,而人的創(chuàng)意指令永遠(yuǎn)是AI創(chuàng)造的起點(diǎn),事實(shí)上,,這篇文章的誕生也源于一個有意思的問題,。

8. 面對DeepSeek R1這種開掛的高階AI,普通人的策略還是兩個字——多用

很顯然,,我們之前對常規(guī)AI所積累的具體技巧,,在面對R1的高階AI大概率會失效,但如何清晰表達(dá),、如何按貝葉斯公式迭代的總原則是不變的,。

這就像是做菜,放鹽嘗一口,,放多了再加水,,試多了自然知道火候。

我看過太多例子,,一個新工具出來,,隨便試一次,發(fā)現(xiàn)結(jié)果不符合預(yù)期,,然后就得出一個結(jié)論——“也就那樣”,,從此再也不碰了。

事實(shí)上,,面對DeepSeek R1這的模型,,輸出效果不好,大概率是我們的問題,,而不是它的問題,。

我媳婦兒之前用Midjourney畫圖死活搞不出復(fù)古膠片感,后來硬是試出“1990年柯達(dá)褪色+漏光”這種奇葩關(guān)鍵詞,,Midjourney立馬給跪,。

說白了,,再牛逼的模型本質(zhì)上就跟你家狗子一樣,處久了就能聽懂你的各種指令,,但首先你得天天帶它遛彎,。

9. 從DeepSeek發(fā)布節(jié)奏看,它沒有發(fā)布的東西可能更值得期待

很少有人注意到DeepSeek的發(fā)布節(jié)奏,,12月26日發(fā)布V3,,1月20日發(fā)布R1,二者相隔的時間僅僅24天,。

我不知道這個公司的發(fā)布節(jié)奏是如何的決策的,,但可以肯定,它顯然沒有有OpenAI每次發(fā)布會精準(zhǔn)阻擊Google所表現(xiàn)出的雞賊,,更沒有山姆奧特曼每次為了融資在Twitter含糊其辭的放風(fēng),,有的只有優(yōu)雅的論文和爽快上架的開掛模型,。

而一個合理的猜測是,,DeepSeek因?yàn)橛凶銐虻募夹g(shù)儲備從而可以無視常規(guī)的發(fā)布節(jié)奏。

從這個意義上,,DeepSeek那個平均年齡25歲,、人數(shù)僅100+的年輕團(tuán)隊(duì)在2025年還會給產(chǎn)業(yè)界帶來哪些新的東西,由衷值得期待,。

10. 梁文鋒大概率被低估

當(dāng)Marc Andreessen,、Satya Nadella、Yann LeCun等硅谷頂級大佬將DeepSeek視為”東方神秘力量”時,,實(shí)質(zhì)是承認(rèn)中國團(tuán)隊(duì)開始參與定義技術(shù)演進(jìn)方向,,而非單純應(yīng)用落地。

梁文鋒的獨(dú)特性,,在于其同時具備量化投資的系統(tǒng)思維,、本土的務(wù)實(shí)精神以及硅谷式技術(shù)理想主義,而DeepSeek的MLA架構(gòu)和MoE稀疏結(jié)構(gòu),,標(biāo)志著大模型領(lǐng)域首次由國內(nèi)團(tuán)隊(duì)完成底層注意力機(jī)制革新,。

品玩的駱軼航老師在一篇長文中認(rèn)為將DeepSeek比喻成“AI界的拼多多”是有失偏頗的,我認(rèn)為這個說法是有洞見的,,DeepSeek和梁文鋒顯然無法簡單標(biāo)簽化,。

即刻網(wǎng)友@Chris-Su說,梁文鋒是極少數(shù)還沒被'廣泛解讀和學(xué)習(xí)’的頂級CEO,,的確,,這幾天硅谷媒體在逐句翻譯和研究梁文鋒的兩篇采訪稿,而美國電視臺CNBC做了一個長達(dá)40分鐘的專題片來專門討論DeepSeek,。

據(jù)我所知,,這在國內(nèi)技術(shù)發(fā)展史上是從來沒有過的事,。

從這個意義上,已經(jīng)是爽文男主角的梁文鋒大概率還是被低估了,。

結(jié)語

我用2023年DeepSeek成立發(fā)布做大模型公告時,,引用法國新浪潮導(dǎo)演特呂弗的一句話結(jié)束今天的文章——

“務(wù)必要瘋狂地懷抱雄心,且還要瘋狂地真誠,?!?/p>

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點(diǎn),。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報,。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多