久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

杭州通

 龍?jiān)陲wop4opwes 2025-01-30

金鱗耀歲 共啟新程

梁文鋒在總理座談會(huì)上發(fā)言 新聞聯(lián)播截圖

昨天傍晚DeepSeek最新發(fā)布的乙巳新年春節(jié)AI賀詞

一場(chǎng)名為DeepSeek(深度求索)的風(fēng)暴,正在席卷全球,。

昨天,,中美兩國(guó)的蘋(píng)果應(yīng)用商店同時(shí)被一條“鯨魚(yú)”攻占。作為一款來(lái)自中國(guó)的AI應(yīng)用,,DeepSeek完成了對(duì)chatGPT的超越,。

在資本市場(chǎng),這條鯨魚(yú)也正在掀起滔天巨浪,。

大洋彼岸,,龍年最后一個(gè)交易日,A股AI算力指數(shù)大跌3.94%,,寒武紀(jì)股價(jià)跌幅一度超10%,。截至昨晚11:00,英偉達(dá),、博通等算力相關(guān)公司的股價(jià)跌幅均超過(guò)11%,。

自2023年底chatGPT橫空出世,全球科技界的夜空被人工智能點(diǎn)亮以來(lái),,從未像現(xiàn)在這般聚集起一股“算力懷疑論”的厚重陰霾,。

徹底釋放它的,就是一個(gè)月來(lái)官宣兩個(gè)開(kāi)源大模型,,被稱(chēng)為“來(lái)自東方神秘力量”的DeepSeek,。他們的總部位于杭州,是“杭州四小龍”的代表,,創(chuàng)始人梁文鋒畢業(yè)于浙大,,前不久剛被國(guó)務(wù)院總理李強(qiáng)接見(jiàn)。

中國(guó)的大模型已經(jīng)追上美國(guó)了,?

故事還得追溯到一個(gè)月前,,1月23日,中國(guó)大模型創(chuàng)業(yè)團(tuán)隊(duì)DeepSeek官宣了新一代開(kāi)源大模型DeepSeek-V3,,部分性能與GPT-4o和Claude Sonnet 3.5等頂尖模型相近,。

一個(gè)月后,DeepSeek-R1開(kāi)源模型面世,,在數(shù)學(xué),、代碼、自然語(yǔ)言推理等任務(wù)上,,性能比肩OpenAI o1正式版,。

整件事最為傳奇的地方在于,,DeepSeek-V3的訓(xùn)練成本不到競(jìng)爭(zhēng)對(duì)手的十分之一。Deepseek-R1的訓(xùn)練成本雖然沒(méi)有公布,,但它的收費(fèi)卻只有OpenAI o1的三十分之一,。

簡(jiǎn)單說(shuō),現(xiàn)階段DeepSeek就是全球大模型“性?xún)r(jià)比”的代名詞,。這就不難理解,,全球的科技愛(ài)好者這兩天都在下載體驗(yàn)DeepSeek。在國(guó)外,,已經(jīng)出現(xiàn)“使用DeepSeek構(gòu)建一切”“Goodbye chatGPT”這樣的話題,。

昨天,同在杭州,,《黑神話:悟空》出品人,、游戲科學(xué)創(chuàng)始人馮驥總結(jié)了DeepSeek六大特點(diǎn):強(qiáng)大、便宜,、開(kāi)源,、免費(fèi)、聯(lián)網(wǎng),、本土,。他還說(shuō):DeepSeek,可能是個(gè)國(guó)運(yùn)級(jí)別的科技成果,。

聽(tīng)上去有點(diǎn)夸張,,但類(lèi)似的討論已經(jīng)在美國(guó)持續(xù)了一周時(shí)間。在參與媒體訪談時(shí),,谷歌前CEO埃里克·施密特改變了美國(guó)在AI方面保持了兩到三年領(lǐng)先優(yōu)勢(shì)的看法。他表示,,過(guò)去6個(gè)月,,中國(guó)以一種非同尋常的方式迎頭趕上,其中一個(gè)項(xiàng)目就是DeepSeek,。

他們不是在復(fù)制,,是在創(chuàng)新

當(dāng)然,更多的是來(lái)自同行滿滿的敬意,。英偉達(dá)高級(jí)研究科學(xué)家Jim Fan評(píng)價(jià)R1:“我們生活在這樣一個(gè)時(shí)間線上,,一家非美國(guó)公司正在維持OpenAI的原始使命——真正開(kāi)放、前沿的研究,,賦予所有人力量,。這看似不合邏輯,但最有趣的結(jié)果往往最容易發(fā)生,?!?/p>

這個(gè)不合邏輯在哪,?在美國(guó)AI初創(chuàng)公司Perplexity首席執(zhí)行官Aravind Srinivas看來(lái),DeepSeek的開(kāi)發(fā)顯然也受制于高端芯片等硬件,,但“需求是發(fā)明之母”,,DeepSeek用變通的方式構(gòu)建了高效的解決方案。

他說(shuō)自己非常驚訝,,“通常的認(rèn)知是中國(guó)人擅長(zhǎng)復(fù)制,。如果我們停止發(fā)表研究論文,停止描述我們的基礎(chǔ)設(shè)施架構(gòu)細(xì)節(jié),,停止開(kāi)源,,他們將無(wú)法趕上……這并不是說(shuō)他們?cè)趶?fù)制,而是在創(chuàng)新,?!?/p>

那么,DeepSeek究竟用了什么魔法呢,?

比如,,他們對(duì)通用的模型推理步驟進(jìn)行了調(diào)整。以往模型在提升推理能力時(shí)通常依賴(lài)于“監(jiān)督微調(diào)”這個(gè)環(huán)節(jié),。這個(gè)環(huán)節(jié)可以簡(jiǎn)單類(lèi)比為人類(lèi)的填鴨式教育,,就是讓大模型反復(fù)做題,學(xué)習(xí)人類(lèi)的推理方式,。

而DeepSeek-R1在訓(xùn)練過(guò)程中直接跳過(guò)了這個(gè)環(huán)節(jié),,進(jìn)入了“強(qiáng)化學(xué)習(xí)”階段,探索大模型在沒(méi)有任何監(jiān)督數(shù)據(jù)的情況下,,通過(guò)純強(qiáng)化學(xué)習(xí)進(jìn)行自我進(jìn)化,。他們要求大模型必須要把思考過(guò)程寫(xiě)出來(lái),通過(guò)“獎(jiǎng)勵(lì)”引導(dǎo)這個(gè)“學(xué)生”找到最佳方案,。

經(jīng)歷了無(wú)數(shù)次訓(xùn)練后,,大模型這個(gè)學(xué)生迎來(lái)了“Aha moment”(頓悟時(shí)刻)。

這個(gè)“頓悟”外加其他工程上的優(yōu)化,,DeepSeek證明了瘋狂堆積算力,、數(shù)據(jù)的“大力出奇跡”不是通往AGI的唯一路徑。

當(dāng)優(yōu)雅的算法能夠降低對(duì)算力的依賴(lài),,目前全球的算力是否存在過(guò)剩,,未來(lái)市場(chǎng)對(duì)算力的需求是否需要修正?這是近期動(dòng)搖全球資本市場(chǎng)對(duì)科技企業(yè)的估值,,出現(xiàn)動(dòng)蕩的根本,。

最早的AI嘗試用在了炒股上

在官方公眾號(hào)上,DeepSeek對(duì)自己的介紹是,,投身于探索AGI的本質(zhì),,不做中庸的事,,帶著好奇心,用最長(zhǎng)期的眼光去回答最大的問(wèn)題,。

在這次一鳴驚人前,,很多人在國(guó)產(chǎn)的大模型江湖沒(méi)聽(tīng)說(shuō)過(guò)DeepSeek的名號(hào)。一定程度上緣于他們至今沒(méi)有融過(guò)資,,更別說(shuō)接到任何一個(gè)巨頭的“橄欖枝”,。但這并不妨礙他們可能是“國(guó)內(nèi)擁有最多高性能GPU的公司”。

這個(gè)底子,,是他們做量化投資打下的,。在轟炸AI圈之前,DeepSeek及背后的幻方量化是金融江湖成名已久的高手,。

低調(diào)的創(chuàng)始人梁文鋒是80后,,出生在廣東的一個(gè)五線城市,父親是一名小學(xué)老師,。他畢業(yè)于浙江大學(xué),,主修軟件工程,人工智能方向,。有同事評(píng)價(jià)梁文鋒:完全不像一個(gè)老板,,而更像一個(gè)極客。因?yàn)樽鳛槔习?,他本人每天都在?xiě)代碼,、跑代碼,學(xué)習(xí)能力驚人,。

2016年,,幻方量化首次上線運(yùn)行AI策略。2018年,,確立了要成為一家AI科技公司,。2023年7月,梁文鋒在杭州創(chuàng)立深度求索DeepSeek,。

在團(tuán)隊(duì)配置上,DeepSeek只有139名研發(fā)人員,,差不多是OpenAI的五分之一,。其中,算法,、推理框架,、多模態(tài)等研發(fā)工程師以及深度學(xué)習(xí)方面的研究人員共有約70人。

梁文鋒曾透露,,DeepSeek并沒(méi)有什么高深莫測(cè)的奇才,,都是一些Top高校的應(yīng)屆畢業(yè)生,,沒(méi)畢業(yè)的博四、博五實(shí)習(xí)生,,還有一些畢業(yè)才幾年的年輕人,,“V2模型沒(méi)有海外回來(lái)的人,都是本土的,。前50名頂尖人才可能不在中國(guó),,但也許我們能自己打造這樣的人”。

無(wú)論是在技術(shù)還是人才上,,梁文鋒似乎堅(jiān)定地看好中國(guó)走出自己的模式,,從而扮演科技變革引領(lǐng)者的角色。

今年1月20日,,也就是DeepSeek-R1發(fā)布的當(dāng)天,,他參加了總理座談會(huì)。會(huì)上李強(qiáng)總理強(qiáng)調(diào),,“要以科技創(chuàng)新推動(dòng)新舊動(dòng)能轉(zhuǎn)換,,集中力量突破關(guān)鍵核心技術(shù)和前沿技術(shù),加快推進(jìn)科技成果產(chǎn)業(yè)化,,努力培育更多經(jīng)濟(jì)新增長(zhǎng)點(diǎn)”,。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶(hù)發(fā)布,,不代表本站觀點(diǎn),。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào),。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶(hù) 評(píng)論公約

    類(lèi)似文章 更多