當(dāng)互聯(lián)網(wǎng)大廠還醉心于在AI的“百模大戰(zhàn)”中大顯身手時,,誰也沒有料到,他們竟然被一個“新人”抄了后路,。 Kimi的爆火,,來得太過突然,,也很意外,。 Kimi有多火?火到宕機成了近期常見的事,,以至于官方不得不出面道歉,。 說到AIGC,必聊Kimi,,成了網(wǎng)友們最近的日常,。很多人發(fā)現(xiàn),自己的朋友圈和微信群幾乎都在推薦Kimi,,“這幾天微博熱搜幾乎每天都能刷到Kimi”,、“如果還沒用過Kimi,那你就OUT了”…… “此前我一直用文心一言,,直到有一天,,朋友推薦了Kimi,我才知道,,什么是好用的國產(chǎn)大模型,。”80后李琳是文字工作者,,她對大模型的需求主要集中在資料的檢索和整理,,之前文心一言能夠基本滿足她的需求。 但Kimi給了李琳全新的體驗,,“僅從資料和素材的整理這一點來言,,Kimi體驗感明顯勝于文心一言。” 王明是一位資深A(yù)I從業(yè)人員,,他對此并不驚訝,,他見證了Kimi從內(nèi)測到爆火的過程,“很顯然,,'草根出身’的Kimi更懂得什么是用戶真正的需求,。” “Kimi仍有一些不足之處,但從目前的用戶體驗來看,,它已經(jīng)走在一些大廠大模型的前面,。”王明直言,,在目前在國產(chǎn)大模型中,,他更看好Kimi的未來。 資本市場也對Kimi表現(xiàn)出了滿腔熱情,。自3月中旬以來,,A股市場便催生了Kimi概念股,不少公司的股價受此影響,,接連大漲,。 萬興科技是接入Kimi的AIGC軟件企業(yè)之一,旗下視頻創(chuàng)意軟件萬興喵影接入Kimi,。在萬興科技AI創(chuàng)新中心總經(jīng)理齊鏜泉看來,,Kimi的出圈不僅反映了公眾對于新興技術(shù)的興趣和期待,也體現(xiàn)了資本市場對于AI技術(shù)的信心和追捧,,“這也是個積極的信號,,展示了AI應(yīng)用的潛力和商業(yè)價值?!?/p> “Kimi的出圈并非一蹴而就,,其背后是大量的研發(fā)投入和持續(xù)的技術(shù)創(chuàng)新。”齊鏜泉對《聽筒Tech》表示,。 不過,,Kimi未來能延續(xù)目前的火熱嗎?目前顯然還無法判定,。實際上,,隨著Kimi的爆火,有關(guān)其技術(shù)處理能力和商業(yè)化路徑的質(zhì)疑聲也不斷,。 齊鏜泉也提示了風(fēng)險,,“隨著AI技術(shù)的廣泛應(yīng)用,我們也應(yīng)該關(guān)注其可能帶來的數(shù)據(jù)安全和隱私保護等問題,,并積極尋求解決方案,?!?/p> Kimi到底表現(xiàn)如何?“用過一次Kimi后,,現(xiàn)在大部分時候都選擇使用它,。”不少人和李琳的做法一樣,,長期需要閱讀大量數(shù)據(jù)和報告的證券分析師張強最近也在使用Kimi,,在他看來,Kimi界面更友好,,在文生文的大模型中,,更貼近自己的需求。 張強已經(jīng)獲得Kimi的200萬字長文輸入內(nèi)測資格,,他經(jīng)常將一些上市公司的年報或者IPO文件全文輸入到Kimi,,他對《聽筒Tech》表示,Kimi能夠迅速將核心內(nèi)容提取出來,,包括上市公司的基本信息,、財務(wù)概覽、公司治理等核心內(nèi)容,,“相對而言,,其他國產(chǎn)大模型在歸納總結(jié)方面有所欠缺?!?/p> Kimi的用戶體驗到底如何,?《聽筒Tech》對Kimi、文心一言,、通義千問、豆包,,以及騰訊混元助手做了一系列小測試,。 首先測試的是這些大模型對資料的總結(jié)能力。 需要說明的是,,在幾家大模型的PC端版本中,,Kimi、通義千問,、豆包,、文心一言對文件上傳功能操作友好,而騰訊混元助手PC端對文檔的上傳界面不太友好,,《聽筒Tech》幾經(jīng)折騰,,都未能找到將文件上傳到對話中的辦法。 《聽筒Tech》隨意抽取了一份最新的《美團2023年財務(wù)報告》進行測試,,測試結(jié)果如下,。 從左至右分別為:Kimi(上),、豆包(下)通義千問(上)、文心一言(下)來源:《聽筒Tech》截圖 從測試結(jié)果來看,,正如張強所言,,Kimi對文檔的歸納總結(jié)功能明顯優(yōu)于其他幾家大模型。對這份財務(wù)報告,,Kimi的總結(jié)清晰且簡明扼要,,豆包和通義千問雖然也能總結(jié),但結(jié)果呈現(xiàn)并不理想,,而文心一言則需要進一步的指令,。 隨后測試的是用戶常用的資料檢索和整理功能,《聽筒Tech》對各大模型進行了“閱讀GTC大會黃仁勛的演講”的測試,,結(jié)果如下,。 從左至右分別為:Kimi(上)、豆包(下),,通義千問(上),、文心一言(中)、騰訊混元助手(下)來源:《聽筒Tech》截圖 從大模型的檢索結(jié)果來看,,Kimi準(zhǔn)確且精簡地對黃仁勛在2024年GTC大會上的演講內(nèi)容進行了總結(jié),。 除Kimi外,其他幾家大模型均無法檢索到黃仁勛在GTC大會上的演講內(nèi)容,,騰訊混元助手甚至無法生成任何答案,,需要進一步的指令。 創(chuàng)作能力是每個大模型都要具備的重要能力之一,,這能夠更好地理解和模擬人類的思維過程,,從而生成更具創(chuàng)意和價值的內(nèi)容。 視頻腳本的生成,,便是用戶常用的文學(xué)創(chuàng)作能力大模型功能之一,。為此,《聽筒Tech》測試了大模型的視頻腳本制作能力,。 本次測試的內(nèi)容是“以'運動改變生活’為主題生成視頻腳本”,。從生成的結(jié)果來看,Kimi,、文心一言,、通義千問、豆包均能生成符合基本要求的視頻腳本文案,。 從左至右依次為:Kimi(上),、文心一言(下)豆包(上)、騰訊混元助手(中),、通義千問(下)來源:《聽筒Tech》截圖 其中豆包生成的視頻腳本包含了時長,、地點等元素,,相對比較專業(yè)。Kimi與文心一言生成的腳本內(nèi)容更為連貫且有條理,。而騰訊混元助手甚至將上一個問題混淆到了腳本中,。 從測試結(jié)果來看,Kimi,、文心一言,、通義千問和豆包都具有較強的視頻腳本生成能力,可以為視頻制作提供很好的幫助,。相比之下,,騰訊混元助手對問題的理解顯然不夠。 從以上簡單的綜合測試結(jié)果來看,,實際上,,在文生文的基礎(chǔ)功能上,Kimi的處理結(jié)果更貼近基礎(chǔ)用戶的需求,。 對于像李琳以及張強這樣的基礎(chǔ)用戶而言,,Kimi目前的文生文基本功能已經(jīng)遠超其他國產(chǎn)大模型。 當(dāng)然,,他們也期待Kimi能夠解決更多問題,,李琳笑言,“我已經(jīng)期待它幫我做PPT了,?!?/p> 為什么出圈的是Kimi?Kimi到底是誰,? 公開報道顯示,,Kimi的母公司為北京月之暗面科技有限公司(以下簡稱“月之暗面”),創(chuàng)始人為楊植麟,。 企查查數(shù)據(jù)顯示,,月之暗面成立于2023年3月,同年10月推出全球首個支持輸入20萬漢字的智能助手產(chǎn)品Kimi,。 創(chuàng)立至今短短一年時間里,月之暗面已經(jīng)獲得紅杉中國,、真格基金,,以及阿里巴巴、小紅書,、美團等知名機構(gòu)和企業(yè)在內(nèi)的兩輪融資,,融資金額超12億美元,投后估值已約25億美元,。 今年年初,,Kimi的訪問量開始上漲,。據(jù)Similarweb和七麥數(shù)據(jù)的資料顯示,2024年2月18日至3月16日,,Kimi的日均瀏覽量將近20萬次,,Kimi在全平臺的累計下載量為50萬次。 尤其是最近兩周,,Kimi的訪問量更是爆增,。根據(jù)Similarweb數(shù)據(jù)顯示,近兩周Kimi的訪問量分別為152.0萬和225.0萬,,一度引發(fā)平臺訪問異常的情況,。 在眾多國產(chǎn)大模型中,為什么出圈的是Kimi,? 在王明看來,,一方面,與其創(chuàng)始人團隊的背景不無關(guān)系,。“從公開的資料來看,,月之暗面可以稱得上匯集了目前國內(nèi)大模型領(lǐng)域相對領(lǐng)先的人才的一個團隊?!?/p> 公開資料顯示,,楊植麟出生于1992年,被譽為最年輕的中國大模型創(chuàng)始人,。其本科畢業(yè)于清華大學(xué)計算機系,,師從清華教授、知名AI學(xué)者唐杰,。博士畢業(yè)于卡內(nèi)基梅隆大學(xué)計算機學(xué)院,,師從蘋果AI研究負責(zé)人Rualan Salakhutdinov 和谷歌首席科學(xué)家 William Cohen。 據(jù)公開報道,,楊植麟目前仍是清華大學(xué)交叉信息研究院(以下簡稱“交叉信息院”)的助理教授,。要知道,交叉信息院涵蓋大名鼎鼎的清華“姚班”,。楊植麟與圖靈獎得主楊樂昆(Yann LeCun)和約書亞·本吉奧(Yoshua Bengio)均有過科研合作,。 實際上,月之暗面是楊植麟第二次創(chuàng)業(yè),,在此之前,,他曾與別人共同創(chuàng)立了循環(huán)智能,也拿到了紅杉中國的投資,,并在2021年和華為云聯(lián)合推出了當(dāng)時全球最大的中文語言模型“盤古”,。 另據(jù)媒體報道,月之暗面的核心團隊成員在大模型方向有重要發(fā)明,,如RoPE相對位置編碼和group normalization,,這些技術(shù)是Meta LLaMa,、谷歌PALM等主流模型的重要組成部分。其另外兩位創(chuàng)始人周昕宇和吳育昕,,同樣是AIGC領(lǐng)域的領(lǐng)先技術(shù)人才,,有過1萬+的Google Scholar的引用。 一位在學(xué)術(shù)上與楊植麟有交集的AI領(lǐng)域研究學(xué)者Liam認為,,月之暗面的團隊可以稱得上目前國內(nèi)領(lǐng)先的AGI團隊之一,,他亦認同業(yè)界對楊植麟“堅定的AGI信徒和有技術(shù)號召力的創(chuàng)始人”的評價。 Liam對Kimi的出圈并不意外,,“實際上,,AI技術(shù)圈內(nèi)的人從去年幾家公司宣布做AGI的時候,就基本確定月之暗面和智譜是最有希望做成的,,也正因此,,頭部資本會在第一時間擠向這幾家公司?!?/p> 在Liam看來,,楊植麟是一位“為數(shù)不多的善于從第一性原理思考問題的學(xué)者”,“Kimi走的long-context的技術(shù)路徑與大廠不一樣,,或許也是源于其對第一性原理的思考,。” 另一方面,,“楊植麟對什么是用戶真正需要的大模型也有清醒的認知”,。Liam向《聽筒Tech》透露,在楊植麟看來,,一個好的產(chǎn)品,,應(yīng)該知道用戶想要什么,通過滿足用戶的需求來實現(xiàn)產(chǎn)品的優(yōu)化,,“這也是為什么月之暗面一開始推出的產(chǎn)品便是TO C,,而不是TO B的原因所在?!?/p> 在Liam看來,,“TO C的定位,能夠給Kimi帶來更多'訓(xùn)練’的機會,,更有利于產(chǎn)品的優(yōu)化和完善,。” 市場顯然也認可楊植麟對Kimi的這一定位,國信證券的分析報告指出,,Kimi日活用戶的顯著增長反映了Kimi在模型優(yōu)化、人才擴展和用戶吸引方面的成功策略,。 “Kimi的成功不僅依賴于其技術(shù)優(yōu)勢,,更在于其對用戶體驗的重視,,包括通過數(shù)據(jù)驅(qū)動的持續(xù)產(chǎn)品優(yōu)化、創(chuàng)新的分享機制以及對核心功能的精準(zhǔn)打磨,,這些因素共同提升了Kimi的市場競爭力,。” 中信建投也在其研報中表示,,“月之暗面打造高關(guān)注度應(yīng)用Kimi Chat,,一方面在于核心團隊技術(shù)背景深,另一方面在于產(chǎn)品面向C端免費開放,,注重產(chǎn)品運營,。” 在齊鏜泉看來,用戶需要的,,是一個能解決特定場景中80%問題的大模型,、一個結(jié)合了本土用戶使用習(xí)慣的本土化大模型、一個能夠與用戶進行交互和共創(chuàng)的大模型,。 “大模型始終會是’應(yīng)用為王',。大模型需要提供的并不是一個淺嘗輒止的工具,而是一套標(biāo)準(zhǔn)化的流程支持,,包括基礎(chǔ)大模型,、完整的工具鏈、豐富的應(yīng)用,,以及有專家支持的服務(wù),。” 這些,,或許就是Kimi率先出圈的原因,。 Kimi火速出圈還有一個原因,那就是前期異常低調(diào),,之前幾乎沒人聽過這家公司的名字,,這與大廠在AI方面的高調(diào)形成鮮明的對比。 如果說財大氣粗的大廠更要面子,,那么“草根出身”的Kimi則更注重里子,。 Kimi能火多久?爆火的Kimi能否如愿在大模型這一新戰(zhàn)場中脫穎而出,?目前來看,,尚無定論。 僅從Kimi引以為傲的長文本處理技術(shù)來看,,Kimi或?qū)⒚媾R巨大的壓力,。 一個不容忽視的事實是,Kimi大模型爆火后,大廠正在迅速跟進,。 3月22日,,阿里通義千問宣布免費開放1000萬字長文檔處理功能,成為全球文檔處理容量第一的AI應(yīng)用,。隨后,,360宣布智腦正式內(nèi)測500萬字長文本處理功能,該功能入駐360AI瀏覽器,。另據(jù)媒體報道,,百度也將免費開放200-500萬長文本功能。 在一位AI技術(shù)人員看來,,“長文本處理這項技術(shù)并不難,,只不過之前的大模型關(guān)注點不在這一方面。更重要的是,,長文本處理相對而言,,成本太高,甚至可以說是’虧本的生意',?!?/p> 該AI技術(shù)人員認為,“當(dāng)市場意識到這一技術(shù)能迅速打開市場,,勢必會加入這一戰(zhàn)場,,這無疑將對Kimi造成巨大的壓力 ?!?/p> 實際上,,一個簡單的測試便能看出,該AI技術(shù)人員的觀點存在一定的道理,。 因目前尚未獲得200萬字的內(nèi)測資格,,《聽筒Tech》對Kimi與通義千問分別提交了一份近35萬字的《茶百道聆訊后資料集》,發(fā)出相同的指令后,,kimi反饋“超出字數(shù)限制,,只閱讀了前31%”,而通義千問順利對全文進行了總結(jié),。 一定程度而言,,開放了1000萬字長文檔處理功能的通義千問,雖然總結(jié)的內(nèi)容不盡如意,,得到的直觀結(jié)果優(yōu)于Kimi,。 圖:目前Kimi(左)與通義千問(右)對長文檔的處理結(jié)果來源:《聽筒Tech》截圖 不過,Liam對以上AI技術(shù)人員的看法持不同觀點,,Liam表示,,“長文本處理這項技術(shù)并不難”這個說法存在誤解,,準(zhǔn)確地說應(yīng)該是“將文本變長確實不難”,但是“在變長的同時不丟掉有效信息,,保證模型對文本仍然有很深入的理解”存在很大技術(shù)難度,。 在Liam看來,“在文本變長甚至變到無限長的情況下,,保證計算量和計算成本可控”這件事,需要大量的基礎(chǔ)研究來支持,,大廠的人才密度不足以支撐這樣的研究,。 另一方面,從多次宕機的情況來看,,也意味著Kimi后臺需求解決的問題仍不少,。 上述AI技術(shù)人員表示,雖然月之暗面確實匯集了一些領(lǐng)先的技術(shù)人才,,但還需加強,,“我看媒體報道,目前Kimi團隊不足百人,,這對于一家處于上升期的大模型企業(yè)而言,,遠遠不夠?!?/p> 不過,,在Liam看來,人才密度是頂尖科技公司最關(guān)鍵的因素,,而不是人才數(shù)量,。 “這從OpenAI便能得出答案,ChatGPT發(fā)布時,,OpenAI也僅100余人,,都是領(lǐng)域內(nèi)最頂尖的科學(xué)家和工程師,當(dāng)然GPT爆火后,,OpenAI開始大力擴招,,人才密度有所下降,也因此引發(fā)了一些問題,?!?/p> 另外,Kimi要想持續(xù)發(fā)展,,就必須正視商業(yè)化這一難題,。 目前,月之暗面的具體商業(yè)化路徑仍未對外公開,。Kimi爆火時,,有媒體報道稱,月之暗面相關(guān)負責(zé)人提到,年內(nèi)將有商業(yè)化初步方案,。 有業(yè)內(nèi)人士稱,,Kimi的商業(yè)化可能類似于OpenAI,更傾向于一種通用性的商業(yè)化,,例如商業(yè)化的高端接入入口用以擴展客戶的應(yīng)用等,。 但這一模式能否落地,能否足以支撐Kimi的長遠發(fā)展,,尚未可知,。 在王明看來,如果目前Kimi的獲客成本真像媒體報道的“每天投入可能超過20萬元”,,那顯然不是一個小數(shù)目,,目前的商業(yè)模式也不足以支撐其未來的快速發(fā)展。 更重要的是,,Kimi爆火后,,進一步推動了“百模大戰(zhàn)”的升級,國內(nèi)外AI公司對其已形成圍獵之勢,。 且不說國外,,僅國內(nèi),騰訊,、阿里,、百度、科大訊飛,、商湯科技等巨頭和AI公司都紛紛推出了大模型,,同時,各行業(yè)也不斷涌現(xiàn)垂類大模型,。 公開數(shù)據(jù)顯示,,目前,國內(nèi)公布的大模型數(shù)量已超過200個,?!斑@些對Kimi而言,都是巨大的壓力,?!蓖趺髦毖浴?/p> 在此前接受媒體的采訪時,,楊植麟曾表示,,“AI不是我在接下來一兩年找到什么PMF(Product/Market Fit,產(chǎn)品/市場契合),,而是接下來十到二十年如何改變世界,?!?/p> 這或許不是楊植麟一個人的愿景,也是眾多國產(chǎn)大模型從業(yè)者所希冀的未來,。(文中李琳,、王明、張強,、Liam均為化名,。) 參考資料:
|
|
來自: mrjiangkai > 《我的圖書館》