核心觀點:大語言模型發(fā)展進入深度推理階段,,通用人工智能愈行愈近,,AI應(yīng)用進入爆發(fā)前夜。站在當(dāng)前這一重要的歷史節(jié)點,,我們從技術(shù),、應(yīng)用、能源三個維度展望了人工智能的未來發(fā)展,,其中技術(shù)是源動力,,應(yīng)用是牽引力,能源是支撐力,。對未來的展望中,,我們提出推理計算、合成數(shù)據(jù),、縮放法則,、超級智能體、具身智能,、 Al4Science,、端側(cè)創(chuàng)新、自動駕駛,、人工智能,、能源需求十個方面的發(fā)展趨勢。 趨勢一 推理計算提升大模型準(zhǔn)確率,,強化學(xué)習(xí)激發(fā)模型推理能力 OPenAl發(fā)布新的具有深度思考能力的a1推理模型,,推理側(cè)縮放法則同樣存在,大模型算力需求逐步遷移至推理側(cè),。ol模型在復(fù)雜問題上花更多時間進行思考而非直接回應(yīng),,具有改善和調(diào)整策略的能力。在科學(xué),、代碼和數(shù)學(xué)等復(fù)雜問題上表現(xiàn)出色,。思維鏈和思維樹通過中間推理步驟幫助大模型實現(xiàn)了復(fù)雜的推理能力,,大語言模型能夠自己對推理過程的中間思維進行評估,ol呈現(xiàn)出類人的邏輯思維潛力,。 強化學(xué)習(xí)激發(fā)模型推理能力,,復(fù)雜思維方式反思能力涌現(xiàn)。傳統(tǒng)大模型需要大量人工標(biāo)注的監(jiān)督數(shù)據(jù)進行訓(xùn)練,,DeepSeek-R1-Zero驗證了無需任何微調(diào)數(shù)據(jù),,僅通過強化學(xué)習(xí)即可實現(xiàn)推理能力的自主進化。而且這是沒有獎勵思維鏈長度的情況下實現(xiàn)的,,即目標(biāo)只是為了作對題目,,大模型就會自發(fā)進行更長地思考,并且最后回答效果更好,。在這個過程中,,自發(fā)涌現(xiàn)出“反思”、“多步驗證”等復(fù)雜推理行為,,出現(xiàn)問題后,,模型會自動糾正早期錯誤,這種“智能”的出現(xiàn),,為未來更有智慧的Agent出現(xiàn)鋪平道路,。 結(jié)合蒸餾技術(shù)實現(xiàn)能力的高效遷移。使用DeepSeek-R1作為教師模型生成800K數(shù)據(jù),,并對多個小型密集模型微調(diào),,小模型性能飛躍。以通叉干問的15億參數(shù)量大模型為例,,經(jīng)過DeepSeek蒸餾后,,數(shù)學(xué)題上超過GPT40-0513的水平,為小算力實現(xiàn)特定功能奠定了基礎(chǔ),。 趨勢二高質(zhì)量數(shù)據(jù)更為稀缺,,合成數(shù)據(jù)價值顯現(xiàn) 高質(zhì)量數(shù)據(jù)的稀缺性日益加劇。生成式AI模型的智能表現(xiàn)很大程度上依賴于數(shù)據(jù),,高質(zhì)量數(shù)據(jù)是構(gòu)建和訓(xùn)練復(fù)雜大模型的基礎(chǔ),,模型訓(xùn)練所需要的數(shù)據(jù)主要來源于互聯(lián)網(wǎng)上的文字和視頻,。目前大語言模型需要的數(shù)據(jù)資源規(guī)模目益擴充,,加速了數(shù)據(jù)資源耗盡的時間點到來,同時互聯(lián)網(wǎng)數(shù)據(jù)的創(chuàng)建者提升了數(shù)據(jù)抓取的限制,。讓搜尋數(shù)據(jù)變得越來越困難,。 合成數(shù)據(jù)是一種模仿真實世界數(shù)據(jù)的非人工創(chuàng)建的數(shù)據(jù),是由基于生成式AI技術(shù)的計算算法和模擬創(chuàng)建而成,。英偉達發(fā)布的開源模型Nemotron-4340B,,開發(fā)者可以使用它們生成用于訓(xùn)練大型語言模型的合成數(shù)據(jù),,以應(yīng)用于醫(yī)療、金融,、制造,、零售及其他各行各業(yè)的商業(yè)應(yīng)用,生成的合成數(shù)據(jù)在規(guī)模較小的大語言模型訓(xùn)練中將扮演重要的角色,。 合成數(shù)據(jù)與推理時計算的化學(xué)反應(yīng)在DeepSeck V3,、DeepSeek R1中開始顯現(xiàn)。以DeepSeek為例,,用DeepSeek RI模型蒸餾出來高質(zhì)量CoT數(shù)據(jù)去訓(xùn)練DeepSeek-V3,,其高質(zhì)量的合成數(shù)據(jù)對V3基礎(chǔ)模型訓(xùn)練有明顯提升。 趨勢三 縮放法則依然有效,,o3與GPT5循環(huán)驅(qū)動有望開啟 縮放法則(Scaling law)t人工智能領(lǐng)域的縮放法則在2020年被首次提出,,縮放法則在過去一段時間內(nèi)指引大語言模型取得巨大成功:隨著模型參數(shù)數(shù)量、訓(xùn)練數(shù)據(jù)量和計算量的增加,,模型的性能會以可靠且可預(yù)測的方式提高,。 發(fā)展趨勢:隨著大語言模型的模型尺度快速上升以及數(shù)據(jù)和算力的限制,盡管提升模型參數(shù)帶來性能上升的邊際收益正在逐步遞減,,提升模型參數(shù)規(guī)模,、擴大訓(xùn)練語料庫仍然是大語言模型提升性能的重要手段。在多模態(tài)數(shù)據(jù)中,、在模型推理過程中,、在生物數(shù)據(jù)中、在世界模型中,,縮放法則初步展露頭腳,,縮放法則將從文本為主的大語言模型訓(xùn)練遷移到更加廣闊的人工智能領(lǐng)域,指導(dǎo)人工智能模型在更多維度上的發(fā)展路徑,。 o3模型有望驅(qū)動模型和數(shù)據(jù)間的飛輪效應(yīng),。o3模型思維鏈過程數(shù)據(jù)是目前AI行業(yè)的稀缺資源,可以極大推動模型和數(shù)據(jù)的飛輪效應(yīng),,未來o3提升GPT-5,、GPT-5提升o4的循環(huán)有望開啟。 趨勢四 應(yīng)用的最佳形態(tài)一一超級智能體(AIAgent) AI Agent指接受周圍環(huán)境的信息,,做出規(guī)劃和決策,,并通過執(zhí)行器采取行動的人工智能體。Agent主要包括三個行動,,以LLM為大腦模塊的Agent展現(xiàn)出強大潛能,,大語言模型展現(xiàn)的推理能力和決策能力是AIAgent的靈魂。 AIAgent即將進入能力快速躍升階段。隨著LVM(純視覺大模型)和流式多模態(tài)模型的不斷成熟,,大語言模型的視近期大語言模型在推理側(cè)“慢思考”能力方面取得的突破,,意味著AIAgent已準(zhǔn)備好進入普及階段。 全球巨頭爭相布局端側(cè)AIAgent,。頭部的人工智能企業(yè)和互聯(lián)網(wǎng)公司均在端側(cè)AIAgent方面有所布局,,AIAgent展望后續(xù),Agent在C端有望成為AI時代的操作系統(tǒng),,大量營銷,、辦公等B端AI助手向Agent過渡。 趨勢五 具身智能不斷突破,,人形機器人進入量產(chǎn)元年 具身智能的核心能力:感知,、學(xué)習(xí)和與環(huán)境動態(tài)交互的能力。 Nvidia世界模型加速機器人訓(xùn)練,。物理AI模型開發(fā)成本很高并且需要大量真實數(shù)據(jù)和測試,,英偉達推出的Cosm 人形機器人進入量產(chǎn)元年,。特斯拉在2023年12月發(fā)布第二代原型機OptimusGen2,Optimus而僅僅依靠2D攝像其端到端神經(jīng)網(wǎng)絡(luò)經(jīng)過訓(xùn)練,,能夠?qū)μ厮估S的電池單元進行準(zhǔn)確分裝,,算法在機器人的FSD計算機上實時運 人形機器人相繼進入工廠實訓(xùn),加速智能制造落地進展,。預(yù)計2025年有上千臺機器人應(yīng)用于特斯拉工廠,,未來人、自動化設(shè)備等協(xié)同作業(yè),,實現(xiàn)柔性化生產(chǎn),。家庭場景是最具潛力的市場之一,未來目標(biāo)可以完成掃地,、擦伴老人等,。 趨勢六 AI4science : 黃金時代已經(jīng)到來 人工智能極大加速科學(xué)研究進度。人工智能應(yīng)用可見于所有STEM領(lǐng)域,,應(yīng)用在醫(yī)學(xué),、材料科學(xué)、機器人技術(shù),、 諾貝爾獎:2024年諾貝爾物理學(xué)獎給了美國科學(xué)家約翰·霍普菲爾德,、英國裔加拿大科學(xué)家杰弗里·辛頓,以 展望未來,,特定領(lǐng)域短期內(nèi)就能從AI中受益,,比如自主實驗室。同時,,AI智能能夠提升最先進技術(shù)水平,,比如的生物、化學(xué)或物理過程的長度和時間尺度相關(guān)的研究,。 趨勢七 端側(cè)創(chuàng)新將不斷涌現(xiàn),,AI塑造端側(cè)新分工新格局 隨著AI大模型逐步成熟,幾乎所有硬件產(chǎn)品都可以加入AI元素來提升表現(xiàn)能力,?!癆I+硬件”模式在辦公、娛樂,、教育未來有望在更多場景以更多品類形式進行應(yīng)用,。 2024CES展會的關(guān)注焦點是AIPC和AI手機,2025CES展會能看到端“百鏡大戰(zhàn)”的預(yù)演,,三星喊出“AIl for AI”的口號,,在手機、電視,、耳機,、戒指、手表等產(chǎn)品中均融入AI,。 硬件產(chǎn)品功能性較強的單品逐步擴散到全場景,、全品類、全價格段的多品類鋪量模式,。各品類SKU的需求量快速增加,,合的創(chuàng)新在不斷涌現(xiàn),有望催生新一輪產(chǎn)業(yè)鏈分工,,同時拉動上游SoC,、PCB、新型封裝,、存儲等產(chǎn)品,。 趨勢八 自動駕駛邁向端到端,Robota進入商業(yè)化落地階段 自動駕駛算法經(jīng)過多年不斷演進路線,目前進入端到端駕駛算法發(fā)展階段,。端到端自動駕駛算法采用感知決策一體化法模型,,直接輸入傳感器感知的信息,輸出控制結(jié)果,。自2023年以來智駕行業(yè)掀起的BEV,、端到端技術(shù)浪潮后,智絡(luò)融入感知,、規(guī)劃,、控制等環(huán)節(jié)。大語言模型和視覺語言模型(VLM)逐步與端到端融合,,進一步增強環(huán)境理解能型將端到端,、VLM兩個模型合二為一,多模態(tài)大模型將成為端到端自生的一種能力,。 智能駕駛商業(yè)化進程不斷加速,。國內(nèi)Robota相關(guān)政策不斷完善,,逐漸建立起Robota從準(zhǔn)許上路到全無人商業(yè)運營,,則在內(nèi)的政策體系。智能駕駛算法不斷向上迭代的同時,,配有高階智能駕駛產(chǎn)品的車型起售價在不斷下降,。 趨勢九“人工智能+”全面鋪開,企業(yè)數(shù)字化率先落地 “人工智能+”旨在將人工智能作為一種基礎(chǔ)性,、驅(qū)動性的技術(shù)力量,,與制造、醫(yī)療,、教育,、交通、農(nóng)業(yè)等多個領(lǐng)域進出新的產(chǎn)品,、服務(wù)和商業(yè)模式,,從而推動傳統(tǒng)行業(yè)的轉(zhuǎn)型升級和社會經(jīng)濟結(jié)構(gòu)的變革。 企業(yè)數(shù)字化率先落地,。對于提升效率,,人工智能通過自動化流程與智能預(yù)測,使企業(yè)能夠在短時間內(nèi)實現(xiàn)更高的生產(chǎn)通過數(shù)據(jù)驅(qū)動的決策支持系統(tǒng),,人工智能幫助管理者做出更加精準(zhǔn)基于數(shù)據(jù)分析的信息,,從而降低風(fēng)險,提高競爭 AI潛力巨大的領(lǐng)域,,通過個性化推薦,、24小時客服等方式,,極大地提升了客戶體驗與滿意度。 趨勢十 AI對能源需求大幅增長,,可持續(xù)發(fā)展日益緊迫 推理端算力需求大幅增長,。隨著基礎(chǔ)模型的日益成熟,推理側(cè)算力需求開始大幅增長,。以字節(jié)為例,日均tokens調(diào)用量從1200億增長到4萬億,,所需要的算力大幅增長,。 隨著人類進一步訓(xùn)練更大參數(shù)量的模型,以及越來越多的AI應(yīng)用開始部署,,基于云的人工智能系統(tǒng)需要消耗更多的能源,。英偉達單卡功耗從A100的400W到B200的1200W,功耗越來越高,,并且服務(wù)器也開始邁向機柜式方案設(shè)計,,對供電系統(tǒng)提出了更大的挑戰(zhàn)。同時,,為了更高效,、更穩(wěn)定、更環(huán)保,,全球新一輪AIDC開始啟動建設(shè),。 |
|