大模型落地,，痛并堅持著

不二BPANDA 2023-08-18 發(fā)布于浙江

展開全文

當下國內(nèi)業(yè)界對大模型態(tài)度發(fā)生轉(zhuǎn)變，落地預期回歸理性,，左手閉源,，右手開源。兩手都要抓,，兩手都要硬,。

文｜趙艷秋周享玥

編｜牛慧

在經(jīng)歷數(shù)個月的探索后,，國內(nèi)首批大模型的行業(yè)落地進展浮出水面,，而這些代表性企業(yè)的動作引發(fā)業(yè)界關(guān)注。

大模型已給一些行業(yè)帶去質(zhì)變,，但也并不像當初憧憬的那樣豐富多彩,，而開源大模型給市場界格局帶來變數(shù)，產(chǎn)業(yè)界暗流涌動,。

浮出水面的行業(yè)實踐

8月15日,，在北京舉辦的百度WAVE SUMMIT 2023峰會期間，國家電網(wǎng)智研院知識計算技術(shù)主管張強分享了大模型在國網(wǎng)電力設備運檢上的落地探索,。

“整個電網(wǎng)的設備規(guī)模超過了4萬億,，而與設備相關(guān)的標準、產(chǎn)品資料,、故障案例等,，是國網(wǎng)公司重要的數(shù)據(jù)資產(chǎn)和生產(chǎn)要素?！睆垙娬f,。目前大模型實踐以設備為核心切入點。會后,，張強打開手機上的工作App為數(shù)智前線演示,，相關(guān)業(yè)務模塊已接入大模型，基層班組可獲得設備運檢中的相關(guān)判據(jù)和依據(jù)來源,。

國家電網(wǎng)介紹大模型落地實踐時,，觀眾爭相拍攝PPT內(nèi)容

區(qū)別于互聯(lián)網(wǎng)行業(yè),，工業(yè)的專業(yè)知識樣本稀缺，積累困難,，大模型的訓練過程,，也是對這些數(shù)字資產(chǎn)的系統(tǒng)化梳理和重構(gòu)過程，這期間有很多挑戰(zhàn)?，F(xiàn)在,，國網(wǎng)智研院的行業(yè)預訓練語言模型參數(shù)超過70億，正在進行150億參數(shù)的電力認知大模型全量精調(diào)訓練,。

一位物聯(lián)網(wǎng)技術(shù)專家告訴數(shù)智前線,，類似國網(wǎng)，他們落地中進度較好的也是面向內(nèi)部員工的文檔知識問答,。此前,，員工檢索企業(yè)內(nèi)部文獻文檔很費勁。原先知識圖譜技術(shù)手段,，成本高,，需要標注很多數(shù)據(jù)，訓練很多小模型,，而回答問題的覆蓋度還較低,。有了大模型，只要把文檔做簡單預處理,，“丟給”大模型,，大模型學習后就能直接回答問題，還能提供知識溯源出處,，回答的覆蓋度也較高,，“這是對原來知識管理賽道很大的顛覆”。

除了能源企業(yè),，在7月華為開發(fā)者大會HDC期間,，工商銀行人工智能和大數(shù)據(jù)實驗室副總經(jīng)理黃炳也介紹了大模型的初步實踐，例如輔助客服人員,，能將專業(yè)知識轉(zhuǎn)化為“大白話”的知識運營助手,，為投研團隊提供晨報的生成服務，以及工行辦公系統(tǒng)中的文案創(chuàng)作,、網(wǎng)訊編寫,、會議摘要等。有趣的是,，網(wǎng)訊編寫經(jīng)過模型訓練,，會有“工行文風”。

黃炳介紹,，這些場景都是人機協(xié)作,，對員工和管理層有感知,。比如,，投研團隊用的晨報生成服務,，過去雇傭?qū)嵙暽ㄙM1個小時，現(xiàn)在只需5分鐘,。

在能源,、金融之外，上市公司中康科技首席技術(shù)官唐珂軻在WAVE SUMMIT期間告訴數(shù)智前線,，基于通用大模型訓練的行業(yè)模型,，在三類醫(yī)藥相關(guān)場景中最先落地。

其中一類是與幾家連鎖藥店做的藥事服務,，可提升店員的專業(yè)度,；一類是輔助醫(yī)生的臨床科研，比如文獻整理和自動總結(jié),、醫(yī)療領(lǐng)域?qū)I(yè)的Meta分析,。“以前做一篇Meta分析至少3~6個月,，現(xiàn)在只需花10分鐘,。”唐珂軻說,，自己之前做過科研,，能感知到大模型對臨床科研效率上質(zhì)的改變。第三類是患者出院后的健康管理,，這部分此前基本是缺失的,。他們目前在廣東、湖南等地,，與不同醫(yī)院落地了針對不同腫瘤的模型,，支撐乳腺癌、肝癌,、肺癌等患者出院后的服務,，這是腫瘤患者非常需要的。

唐珂軻稱,，醫(yī)療數(shù)據(jù)相對的封閉性,，會給行業(yè)模型訓練帶來挑戰(zhàn)。但他看好大模型對行業(yè)的前景改變,?！叭ツ暝诖罱ɑ颊呋卦L系統(tǒng)時，技術(shù)實施復雜度“令人頭疼”,，但今年在大模型基礎(chǔ)上投喂幾千條數(shù)據(jù),，效果就不錯”,。

上海南洋萬邦智能物聯(lián)部經(jīng)理曾佑軒告訴數(shù)智前線，在落地實踐中,，大模型在AI助手,、知識管理兩大方向上落地較多。該公司是上海儀電下屬的數(shù)科公司,。談到大模型成本,，曾佑軒介紹，目前AI助手的費用已做到每月每人10元,。這并不像大家想象中那么高昂,。

大模型已在為企業(yè)降本增效。一位云計算資深人士告訴數(shù)智前線,，他了解原來某大型家具企業(yè),，外包客服要請數(shù)百人，現(xiàn)在已縮減到小幾十人,。“像這種項目,，企業(yè)幾十萬可以搞定，又能節(jié)約成本,，是比較好的落地,。”

“大家都冷靜理性了”

在大模型的落地實踐中,，行業(yè)對大模型有了更深入的認知,，很多企業(yè)調(diào)整了預期，“大家冷靜理性了,?！?/div>

“我們從今年初開始重點關(guān)注大模型，當時的想法是要把大模型更好地用起來,?！币晃荒茉创笃髽I(yè)人工智能專家近日告訴數(shù)智前線，“但在逐漸用的過程中,，我們發(fā)現(xiàn)不是那么理想,，也不會那么快?！?/div>

他們現(xiàn)在偏向于先支撐內(nèi)部人員,，因為“大模型的回答，尤其是事實類的還不是太好”,，直接開放給客戶還有一定風險,。而面向內(nèi)部，會經(jīng)過大家的過濾、判斷和把關(guān),。內(nèi)部人員再結(jié)合他們的理解,，對外來服務。“我們會灰度地去過渡,，逐步開放一些功能,。”

無獨有偶,，工行目前的應用也先從內(nèi)部開始,，優(yōu)先面向金融文本和金融圖像分析創(chuàng)作,，且“場景肯定有錯誤容忍度”,。

實際上，大模型的實際落地與當初的預期存在一定落差,?！按竽Ｐ湍芙鉀Q的問題，比一開始想象的要少很多,。”一位行業(yè)資深人士告訴數(shù)智前線,。

造成這個落差的原因有多方面。從場景上說,，ChatGPT剛出來時,，大家對大模型有很多憧憬，一位云計算人士舉例,，曾有企業(yè)找他咨詢,，AI能不能替代采購，因為采購環(huán)節(jié)最易滋生腐敗,，老板都想把這塊監(jiān)管或考慮用技術(shù)取代,。但采購不是一個簡單決策，需要綜合考量,。

“很多企業(yè)要么完全不知道怎么用,，要么就是天馬行空，但因為提出的場景復雜,、決策鏈太長,，實際做不到?！彼f,。而另一些人士認為，大家可能把大模型與通用人工智能混為一談,。

從技術(shù)角度看,，在醫(yī)療、教育等一些專業(yè)度、準確度要求高的客服場景,，大語言模型的幻覺是個問題,。當他們把行業(yè)數(shù)據(jù)注入到基礎(chǔ)大模型時，不管是微調(diào),，還是其他手段,，模型能吸納并能轉(zhuǎn)化成正確輸出的，大概有70%到80%,。這就要求不得不用更多辦法,，去處理那20%到30%的錯誤率。

“但目前沒有特別低成本和快速的辦法,。”上述人士反饋,，很多東西需要去做強化學習和復雜的人工標定，所花的成本可能是現(xiàn)在成本基礎(chǔ)再乘以10甚至更多,，這讓很多企業(yè)難以接受,。

針對上述兩個問題，聚焦領(lǐng)域大模型開發(fā)的中關(guān)村科金技術(shù)副總裁張杰告訴數(shù)智前線,，在場景選擇上,，他覺得接下來適合大模型進一步落地的較好賽道，是專業(yè)性較高,，且容錯性較高的場景,，如企業(yè)知識問答、營銷機器人,、坐席助手,。而通用性太高或容錯性又比較低的場景，如自動駕駛,，不是特別好的商業(yè)賽道,。

從技術(shù)層面，張杰認為不是某一套大模型的應用技術(shù)路線,，就可以非常完美地解決問題,，他介紹了三種由淺入深的應用技術(shù)路線。

從落地實踐看,，目前,，前兩種接受度高?！斑@三種方法不是3選1,，在具體場景下，肯定是一套組合拳,?！彼a充道,。

“大家其實看到iPhone在2006就出來了，但整個移動互聯(lián)網(wǎng)時代的開啟是在2012年,?！敝行沤ㄍ蹲C券研究所所長、武超則在不久前的行業(yè)會議上稱,，“這個過程才剛剛開始”,。

她認為大模型有幾個階段的演進，從能聽會說,、能看會認開始,，到能夠像人一樣去組合使用工具，從而讓每個人配一個“斯坦福畢業(yè)的助理”,，再到通用人工智能中的會規(guī)劃,、會決策。

行業(yè)在不斷深入探索,。一位行業(yè)資深人士告訴數(shù)智前線,，他們在做教育等行業(yè)，客戶數(shù)量較大,，在將大模型融入業(yè)務工作流的過程中，遇到很多問題,，“還在去尋找有沒有更能解決問題的方式”,。

企業(yè)紛紛涌向開源大模型

在大模型落地的過程中，越來越多的國內(nèi)企業(yè)開始采用開源大模型,。

一位南方電網(wǎng)人士告訴數(shù)智前線,，內(nèi)部現(xiàn)在進行大模型嘗試時，“都是基于Llama吧”,。Meta公司在今年7月發(fā)布了開源可商用大模型Llama 2,，包含了70億、130億和700億參數(shù)3個版本,。另一位南方電網(wǎng)人士稱,，內(nèi)部對不同開閉源模型正進行測試賽馬。

8月,，金蝶發(fā)布的財務大模型,，也基于開源大模型訓練而來。金蝶CTO趙燕錫告訴數(shù)智前線,，就像手機操作系統(tǒng)有iOS,、安卓一樣，開源模型要打造生成式AI的安卓系統(tǒng),，國內(nèi)有像清華ChatGLM,，國際上有MPT、Llama，未來是一個多模型合作的想法,。

在金融領(lǐng)域落地中,，有資深人士告訴數(shù)智前線，開源,、閉源大模型都有,，因為各金融機構(gòu)體量不一，策略也不一樣,。很多公司先在一個具體場景下用開源模型做出實際效果,，再考慮復制推廣，也有幾個大行對平臺做一些戰(zhàn)略性投入,，在閉源基礎(chǔ)大模型上,，建了一個類似于中臺的平臺，期望將來同時對接多個場景,。

“之前我們自己訓練了兩個不同參數(shù)的模型,，最近我們也在用開源?！敝锌粕钪荂TO宋健告訴數(shù)智前線,。他認為，目前絕大部分文本寫作,、上下文匹配,，130億參數(shù)的模型已夠用，而三四百億參數(shù)的模型,，在解決很多垂類問題上已經(jīng)足夠,，無論國內(nèi)百川，還是國外的Llama,，效果都不錯,。

一家物聯(lián)網(wǎng)公司技術(shù)高管告訴數(shù)智前線，目前開源大模型發(fā)展較快,，開源社區(qū)也發(fā)布了很多模型,，大部分基于Llama 2微調(diào)而來。“我們也測試過很多開源和閉源模型,，由于我們的目標市場需要多語言支持,，會更多考慮Llama 2。如果是面向國內(nèi)市場,，一些國內(nèi)的模型也很優(yōu)秀,。”

“選擇開源和閉源,，實際上各有優(yōu)缺點,。使用開源模型的好處主要是較為自由,，包括部署、微調(diào),、升級和免費,。閉源的好處是有質(zhì)量保證，免自己部署和應用門檻較低,。”上述資深人士介紹,。

他選擇開源的一個重要原因是認為，目前開源模型的繁榮和水平提高呈現(xiàn)一個明顯趨勢,。他打了一個比喻,，開源大模型的水平就好比海平面，閉源大模型相當于一個個島嶼,。目前這些島嶼上漲的速度,，跟不上海平面上漲的速度，大部分島嶼將會被海水淹沒,，可能世界上最后就剩下幾座上漲比較快的島嶼,。

模型本身現(xiàn)在可選的很多，多位業(yè)內(nèi)人士也贊同,，開源和閉源不是客戶會關(guān)心的問題,，“極少客戶會去指定用哪一款模型”。因為客戶并不直接使用基礎(chǔ)大模型,，最終客戶是沒有感知的,。“客戶更關(guān)心的是精度,、速度和價格。當然最終保證無害性,、合法性,，這是應用開發(fā)商必須解決的問題?！鄙鲜鑫锫?lián)網(wǎng)行業(yè)專家說,。

張杰告訴數(shù)智前線，因為開源可商用大模型,，每一款可能都有自己的優(yōu)缺點,，比如說有些適合做一些分類型的任務，有些性能比較好,，有些可能就生成式的任務表現(xiàn)比較好,，還是要根據(jù)具體場景，一些ROI的需求,，選擇不同的模型,。

“總體來講,，我們覺得接下來大模型非常重要的趨勢，就是開源,?！敝行沤ㄍ蹲C券武超則稱，非標準化的場景,，非標準化的算力,，這種架構(gòu)決定開源可能會是一個比較趨同的方向。

大廠態(tài)度發(fā)生變化

開源世界的迅速繁榮,，也正導致大模型生態(tài)鏈企業(yè)甚至底層芯片廠商的態(tài)度和策略發(fā)生一些微妙變化,。

一家國內(nèi)主流AI芯片企業(yè)人士告訴數(shù)智前線，Meta推出Llama 2開源模型后,，呈現(xiàn)出的效果較好,，這對目前市場上一些大模型來說是個絕殺。為此,，他們已暫緩了對一些大模型的適配工作,，觀望一下再說。

國內(nèi)外大模型大廠也已迅速在策略上做出改變,，普遍朝著“左手閉源,，右手開源”的方向走。

在國外,，微軟除了投資OpenAI閉源大模型,，也和Meta實現(xiàn)牽手，宣布在其Azure云和Windows內(nèi)上線開源的Llama 2,。亞馬遜AWS,、谷歌云也都在自研大模型基礎(chǔ)上，支持第三方和開源模型,。

在國內(nèi),，8月初，百度先宣布升級千帆大模型平臺,，接入Llama2全系列,、清華ChatGLM2、RWKV等33個大模型,，并對這些模型進行性能增強,、推理優(yōu)化等工作；之后,，阿里開源通義千問70億參數(shù)模型,，包括通用模型Qwen-7B和對話模型Qwen-7B-Chat，稱“開源,、免費,、可商用”,；而在8月16日，騰訊亦亮出新動作,，宣布騰訊云TI平臺已接入Llama 2,、Falcon、Dolly等20多個主流模型,，旨在打造行業(yè)大模型精選商店,。

大廠們何以會有如此“整齊劃一”的動作？

市場需求變化是一個因素,。百度智能云AI與大數(shù)據(jù)平臺總經(jīng)理忻舟告訴數(shù)智前線,，他們發(fā)現(xiàn)市場需求已逐漸進入深水區(qū)，僅文心一言一個模型,，不能滿足客戶多樣化需求,，而如果能把一個平臺做好，“會有更多的流量”,。

業(yè)界觀察,，7月下旬，百度在對外表述中,，已將原來的“文心千帆大模型平臺”轉(zhuǎn)變?yōu)椤扒Х竽Ｐ推脚_”,，在做“去文心化”。

另一個現(xiàn)實因素是,，大廠們單個項目報價普遍在千萬元級別,，閉源大模型暫時還沒能有足夠多的大項目落地。

此外,，清華ChatGLM建立了有策略的,、組合的商業(yè)模式，把小模型開源出去,，吸引商機和生態(tài),，它的閉源大模型也可以為企業(yè)提供定制化服務。大模型廠商提供一個開源的但規(guī)模較小的大模型供大家使用,，也是一種營銷模式。

一位熟悉阿里云的資深人士也表示,，他猜測,，上述這些因素也是阿里開源兩款大模型的重要原因之一?！白吡硗庖粭l路試試看,。”

而大模型變現(xiàn)的通路,，并不只是模型本身,。

數(shù)智前線獲悉,，華為在大模型上的考量，算力是重頭之一,。7月底到8月初,，任正非就大模型有兩次講話，均與算力相關(guān),。

先是成立AI算力先遣隊,，由原煤礦軍團團長鄒志磊負責。任正非說,，有4000個客戶想要用華為昇騰平臺去訓練大模型,。華為也將可能在10月成立15個小組去分別服務15個客戶。之后,，針對華為在《自然》雜志上發(fā)表的華為云盤古氣象大模型的論文,，任正非也談及要“在新的淘金時代賣鏟子”。

無獨有偶,，忻舟介紹,，百度在大模型上的商業(yè)模式可分為兩個層面。從文心一言這個大模型的角度講,，百度賺的是AI的錢,。但千帆同時還是一個支持其他第三方模型的平臺，本質(zhì)上“還是云的思路,，賺云的錢”,。

此外，開源對生態(tài)建設也是百利而無一害,。畢竟大模型被認為是智能時代的操作系統(tǒng),，而操作系統(tǒng)比拼的是生態(tài)，百度智能云AI平臺副總經(jīng)理李景秋認為,，好的開源模型會極大吸引市場上創(chuàng)新公司關(guān)注大模型并參與其中,，進而帶來整個上下游服務生態(tài)的完善。

今年7月,，阿里云也對外喊出“將促進中國大模型生態(tài)的繁榮作為首要目標”的口號,。“這就類似于原來開源軟件的模式,，通過開源來吸引客戶,，建立產(chǎn)品的社區(qū)?！币晃淮竽Ｐ皖I(lǐng)域資深人士表示,。

該人士認為，無論國內(nèi)國外,、開源閉源,，大模型的發(fā)布可能還會更多,，具有通用基礎(chǔ)能力的大模型，可能會集中到少數(shù)幾個廠商,，但具有行業(yè)細分的大模型,，比較典型的像醫(yī)療、法律,、教育,，會有更多廠商去做。另外,，基于大模型的能力做出來的應用級產(chǎn)品,，會逐漸繁榮，形成一個新的生態(tài)和軟件開發(fā)模式,，“比如最近比較火的MetaGPT和ToolLLM”,。