作為月之暗面的創(chuàng)始人,,楊植麟常把他的AGI夢想形容為“登月計劃”,,長文本就是這個偉大計劃的第一步。但現(xiàn)在,隨著Kimi的爆火出圈,,賽道瞬間變得擁擠,,24小時內(nèi),阿里,、360,、百度緊急“出手”,紛紛入局長文本賽道,。 大廠的加入,,讓月之暗面充滿理想化色彩的“登月計劃”有了更接地氣、更市場化的一面——從千億參數(shù)到千萬長文本,,大模型好像又“卷”出了新高度,。而一同被“卷”起來的,還有大模型的商業(yè)化進(jìn)程,。 內(nèi)卷長文本 Kimi像條“鲇魚”,,用200萬字無損上下文激活了整個國產(chǎn)大模型市場。3月23日,,360智腦宣布正式內(nèi)測500萬字長文本處理功能,,該功能即將入駐360 AI瀏覽器,同時360 AI瀏覽器App也即將上線,。 3月22日晚上,,阿里通義千問宣布,向所有人免費(fèi)開放1000萬字的長文檔處理功能,,成為全球文檔處理容量第一的AI應(yīng)用,。與此同時,也有媒體從知情人士處獲悉,,百度文心一言下個月將進(jìn)行版本升級,,屆時也將開放長文本能力,文字范圍會在200萬—500萬,。 Kimi是月之暗面推出的一款智能助手,。3月18日,月之暗面宣布Kimi智能助手已支持200萬字超長無損上下文,,并于即日起開啟產(chǎn)品內(nèi)測,。去年10月剛發(fā)布時,Kimi可支持的無損上下文輸入長度為20萬字,。3月21日,,因過于火爆,Kimi一度“宕機(jī)”,。 天使投資人,、資深人工智能專家郭濤對北京商報記者分析稱,,200萬字的長文本處理能力是一個巨大的技術(shù)突破,這意味著AI模型可以理解和生成更復(fù)雜,、更豐富的內(nèi)容,,這對于許多應(yīng)用場景,,如自動寫作,、內(nèi)容生成、信息檢索等,,都具有重要的價值,。 這可能也是Kimi引爆市場的關(guān)鍵。 3月22日,,“Kimi概念”進(jìn)入持續(xù)火爆的第四天,,不過資本市場上已出現(xiàn)分化跡象,當(dāng)天收盤,,掌閱科技,、中廣天擇收獲三連板,因賽集團(tuán)股價則跌超4%,,電廣傳媒跌超3%,。 財經(jīng)評論員張雪峰對北京商報記者提到,這一突破意味著在自然語言處理領(lǐng)域,,特別是文本生成和理解方面,,Kimi取得了重大進(jìn)展,其主要技術(shù)突破包括長文本處理能力,、上下文理解和訓(xùn)練技術(shù)三個方面,。 以長文本處理能力為例,Kimi能夠處理長達(dá)200萬字的文本,,而且在處理過程中不會出現(xiàn)信息丟失或失真的情況,。這種能力在以往的自然語言處理模型中很難實(shí)現(xiàn),因為長文本的處理需要更大的內(nèi)存和更復(fù)雜的模型結(jié)構(gòu),。 AGI的初心 20萬到200萬的變化,,不止在于字?jǐn)?shù)的簡單累積,更在于“無損”和它們共同指向的AGI目標(biāo),。 楊植麟曾解釋稱,,通往AGI,無損的長上下文將會是一個很關(guān)鍵的基礎(chǔ)技術(shù),。從Word2vec到RNN,、LSTM,再到Transformer,,歷史上所有的模型架構(gòu)演進(jìn),,本質(zhì)上都是在提升有效的、無損的上下文長度。 “上下文長度可能存在摩爾定律,,但需要同時優(yōu)化長度和無損壓縮水平兩個指標(biāo),,才是有意義的規(guī)模化,?!睏钪谗胝f。 月之暗面曾介紹,,從20萬字到200萬字,,由于沒有采用常規(guī)的漸進(jìn)式提升路線,月之暗面團(tuán)隊遇到的技術(shù)難度也是指數(shù)級增加的,。 為了達(dá)到更好的長窗口無損壓縮性能,,月之暗面研發(fā)和技術(shù)團(tuán)隊從模型預(yù)訓(xùn)練到對齊、推理環(huán)節(jié)均進(jìn)行了原生的重新設(shè)計和開發(fā),,不走“滑動窗口”“降采樣”等技術(shù)捷徑,,攻克了很多底層技術(shù)難點(diǎn)。 但字?jǐn)?shù)累積的表象以及大廠相繼亮出同類型產(chǎn)品的情況,,也讓“吃瓜群眾”對于所謂的技術(shù)突破有些疑慮,。 在接受北京商報記者采訪時,伽利略資本合伙人鄭譞做了一個類比,,對象就是不久前火爆全球的文生視頻大模型Sora,。 鄭譞解釋稱,文生視頻可以看做是連續(xù)的文生圖,,從理論層面上,,可能并不是顛覆性的突破,但是做到穩(wěn)定生成長視頻確實(shí)有難度,,更多解決的是工程上的問題,。但也不能說工程上的創(chuàng)新就不是創(chuàng)新,月之暗面無損長文本可能也是這個道理,。 概括起來,,從底層技術(shù)上來看,Kimi可能確實(shí)沒有顛覆性的突破,,更像是一個突破性技術(shù)的前序技術(shù),。 “長文本技術(shù)上需要解決上下文理解、長期記憶,、復(fù)雜推理,、多任務(wù)適應(yīng)性以及計算效率等問題,學(xué)界其實(shí)早就有一些相應(yīng)的解決方案,,比如長文本處理,、注意力機(jī)制優(yōu)化等,,但是在復(fù)雜推理和計算效率上工程難度還是很大的,各大廠也都給出了自己的方案,,只不過之前大家并沒有將'長文本’當(dāng)成關(guān)鍵詞給予足夠的關(guān)注度,。”鄭譞稱,。 郭濤也提到,,從目前公開資料來看,Kimi的技術(shù)確實(shí)具有一定的競爭優(yōu)勢,,但還不具備技術(shù)壁壘,。長文本可能會成為大模型的下一個“卷”的領(lǐng)域,,因為這是一個具有廣泛應(yīng)用前景和商業(yè)價值的研究方向,。 不過在鄭譞看來,月之暗面與其他人工智能企業(yè)真正的不同點(diǎn),,并不在于技術(shù)乃至商業(yè)化路線的差異,,而在于“初心”的不同。 鄭譞將楊植麟形容為一個“富有理想主義的創(chuàng)始人”“他的目標(biāo)就是打造自己理想的AGI,,而不是從落地或者務(wù)實(shí)的視角去思考當(dāng)下的問題”,。 商業(yè)化“肉搏” 理想化的月之暗面,也不能完全“脫俗”,。Kimi爆火時,,有媒體報道稱,月之暗面相關(guān)負(fù)責(zé)人提到,,年內(nèi)將有商業(yè)化初步方案,。對于具體的商業(yè)化路徑以及大廠競相加入是否會對Kimi的商業(yè)化產(chǎn)生影響等問題,北京商報記者聯(lián)系了月之暗面,,但截至發(fā)稿未收到回復(fù),。 鄭譞猜測,相較于特定應(yīng)用,,Kimi的商業(yè)化可能類似于OpenAI,,更傾向于一種通用性的商業(yè)化,例如商業(yè)化的高端接入入口用以擴(kuò)展客戶的應(yīng)用等,。 目前已有多家企業(yè)確認(rèn)了與Kimi的合作,。例如3月24日,萬興科技對外透露,,公司旗下視頻創(chuàng)意軟件萬興喵影已率先接入Kimi,,其AI寫文案功能當(dāng)前已采用Kimi大模型服務(wù),萬興科技正加速旗下其他產(chǎn)品對Kimi的對接測試,。 而對于大廠紛紛加入長文本競爭的原因,,張雪峰認(rèn)為,,長文本處理能力是自然語言處理領(lǐng)域的一個重要方向,而且隨著信息量的增加,,對長文本處理能力的需求也越來越迫切,。 張雪峰進(jìn)一步補(bǔ)充稱,Kimi的技術(shù)突破表明長文本處理已經(jīng)成為可能,,因此大廠紛紛投入研發(fā)長文本處理技術(shù),,以保持競爭力和領(lǐng)先地位。另外,,長文本處理也是滿足用戶需求的重要途徑,,可以為用戶提供更全面、準(zhǔn)確的信息服務(wù),。 至于大廠的入局,,是否會給月之暗面商業(yè)化造成影響,鄭譞則給出了否定的回答,,原因在于“雖然都在講長文本,,但大家的側(cè)重點(diǎn)顯然是千差萬別的,而且各家所追求的愿景也有著天壤之別”,。 回歸“為什么是Kimi”的問題,,中信建投研報提到,月之暗面打造高關(guān)注度應(yīng)用Kimi Chat,,一方面在于核心團(tuán)隊技術(shù)背景深,,另一方面在于產(chǎn)品面向C端免費(fèi)開放,注重產(chǎn)品運(yùn)營,。 據(jù)悉,,月之暗面目前在招的31個崗位中,其中6個為市場,、運(yùn)營類崗位,,包括達(dá)人運(yùn)營、國內(nèi)廣告投放等,?!澳壳罢心几嗍袌觥⑦\(yùn)營類人才,,后續(xù)有望推動產(chǎn)品進(jìn)一步破圈,。”研報稱,。 (來源:北京商報 記者:楊月涵) |
|
來自: okxso > 《人工智能,無人駕駛》