久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

大模型落地,,痛并堅持著

 不二BPANDA 2023-08-18 發(fā)布于浙江
圖片
當下國內(nèi)業(yè)界對大模型態(tài)度發(fā)生轉(zhuǎn)變,落地預期回歸理性,,左手閉源,,右手開源。兩手都要抓,,兩手都要硬,。
文|趙艷秋 周享玥
編|牛慧
在經(jīng)歷數(shù)個月的探索后,,國內(nèi)首批大模型的行業(yè)落地進展浮出水面,,而這些代表性企業(yè)的動作引發(fā)業(yè)界關(guān)注。
大模型已給一些行業(yè)帶去質(zhì)變,,但也并不像當初憧憬的那樣豐富多彩,,而開源大模型給市場界格局帶來變數(shù),產(chǎn)業(yè)界暗流涌動,。
01
浮出水面的行業(yè)實踐
8月15日,,在北京舉辦的百度WAVE SUMMIT 2023峰會期間,國家電網(wǎng)智研院知識計算技術(shù)主管張強分享了大模型在國網(wǎng)電力設備運檢上的落地探索,。
“整個電網(wǎng)的設備規(guī)模超過了4萬億,,而與設備相關(guān)的標準、產(chǎn)品資料,、故障案例等,,是國網(wǎng)公司重要的數(shù)據(jù)資產(chǎn)和生產(chǎn)要素?!睆垙娬f,。目前大模型實踐以設備為核心切入點。會后,,張強打開手機上的工作App為數(shù)智前線演示,,相關(guān)業(yè)務模塊已接入大模型,基層班組可獲得設備運檢中的相關(guān)判據(jù)和依據(jù)來源,。
圖片
國家電網(wǎng)介紹大模型落地實踐時,,觀眾爭相拍攝PPT內(nèi)容
區(qū)別于互聯(lián)網(wǎng)行業(yè),,工業(yè)的專業(yè)知識樣本稀缺,積累困難,,大模型的訓練過程,,也是對這些數(shù)字資產(chǎn)的系統(tǒng)化梳理和重構(gòu)過程,這期間有很多挑戰(zhàn)?,F(xiàn)在,,國網(wǎng)智研院的行業(yè)預訓練語言模型參數(shù)超過70億,正在進行150億參數(shù)的電力認知大模型全量精調(diào)訓練,。
一位物聯(lián)網(wǎng)技術(shù)專家告訴數(shù)智前線,,類似國網(wǎng),他們落地中進度較好的也是面向內(nèi)部員工的文檔知識問答,。此前,,員工檢索企業(yè)內(nèi)部文獻文檔很費勁。原先知識圖譜技術(shù)手段,,成本高,,需要標注很多數(shù)據(jù),訓練很多小模型,,而回答問題的覆蓋度還較低,。有了大模型,只要把文檔做簡單預處理,,“丟給”大模型,,大模型學習后就能直接回答問題,還能提供知識溯源出處,,回答的覆蓋度也較高,,“這是對原來知識管理賽道很大的顛覆”。
除了能源企業(yè),,在7月華為開發(fā)者大會HDC期間,,工商銀行人工智能和大數(shù)據(jù)實驗室副總經(jīng)理黃炳也介紹了大模型的初步實踐,例如輔助客服人員,,能將專業(yè)知識轉(zhuǎn)化為“大白話”的知識運營助手,,為投研團隊提供晨報的生成服務,以及工行辦公系統(tǒng)中的文案創(chuàng)作,、網(wǎng)訊編寫,、會議摘要等。有趣的是,,網(wǎng)訊編寫經(jīng)過模型訓練,,會有“工行文風”。
黃炳介紹,,這些場景都是人機協(xié)作,,對員工和管理層有感知,。比如,,投研團隊用的晨報生成服務,,過去雇傭?qū)嵙暽ㄙM1個小時,現(xiàn)在只需5分鐘,。
在能源,、金融之外,上市公司中康科技首席技術(shù)官唐珂軻在WAVE SUMMIT期間告訴數(shù)智前線,,基于通用大模型訓練的行業(yè)模型,,在三類醫(yī)藥相關(guān)場景中最先落地。
其中一類是與幾家連鎖藥店做的藥事服務,,可提升店員的專業(yè)度,;一類是輔助醫(yī)生的臨床科研,比如文獻整理和自動總結(jié),、醫(yī)療領(lǐng)域?qū)I(yè)的Meta分析,。“以前做一篇Meta分析至少3~6個月,,現(xiàn)在只需花10分鐘,。”唐珂軻說,,自己之前做過科研,,能感知到大模型對臨床科研效率上質(zhì)的改變。第三類是患者出院后的健康管理,,這部分此前基本是缺失的,。他們目前在廣東、湖南等地,,與不同醫(yī)院落地了針對不同腫瘤的模型,,支撐乳腺癌、肝癌,、肺癌等患者出院后的服務,,這是腫瘤患者非常需要的。
唐珂軻稱,,醫(yī)療數(shù)據(jù)相對的封閉性,,會給行業(yè)模型訓練帶來挑戰(zhàn)。但他看好大模型對行業(yè)的前景改變,?!叭ツ暝诖罱ɑ颊呋卦L系統(tǒng)時,技術(shù)實施復雜度“令人頭疼”,,但今年在大模型基礎(chǔ)上投喂幾千條數(shù)據(jù),,效果就不錯”,。
上海南洋萬邦智能物聯(lián)部經(jīng)理曾佑軒告訴數(shù)智前線,在落地實踐中,,大模型在AI助手,、知識管理兩大方向上落地較多。該公司是上海儀電下屬的數(shù)科公司,。談到大模型成本,,曾佑軒介紹,目前AI助手的費用已做到每月每人10元,。這并不像大家想象中那么高昂,。
大模型已在為企業(yè)降本增效。一位云計算資深人士告訴數(shù)智前線,,他了解原來某大型家具企業(yè),,外包客服要請數(shù)百人,現(xiàn)在已縮減到小幾十人,。“像這種項目,,企業(yè)幾十萬可以搞定,又能節(jié)約成本,,是比較好的落地,。”
02
“大家都冷靜理性了”
在大模型的落地實踐中,,行業(yè)對大模型有了更深入的認知,,很多企業(yè)調(diào)整了預期,“大家冷靜理性了,?!?/div>
“我們從今年初開始重點關(guān)注大模型,當時的想法是要把大模型更好地用起來,?!币晃荒茉创笃髽I(yè)人工智能專家近日告訴數(shù)智前線,“但在逐漸用的過程中,,我們發(fā)現(xiàn)不是那么理想,,也不會那么快?!?/div>
他們現(xiàn)在偏向于先支撐內(nèi)部人員,,因為“大模型的回答,尤其是事實類的還不是太好”,,直接開放給客戶還有一定風險,。而面向內(nèi)部,會經(jīng)過大家的過濾、判斷和把關(guān),。內(nèi)部人員再結(jié)合他們的理解,,對外來服務。“我們會灰度地去過渡,,逐步開放一些功能,。”
無獨有偶,,工行目前的應用也先從內(nèi)部開始,,優(yōu)先面向金融文本和金融圖像分析創(chuàng)作,,且“場景肯定有錯誤容忍度”,。
實際上,大模型的實際落地與當初的預期存在一定落差,?!按竽P湍芙鉀Q的問題,比一開始想象的要少很多,。”一位行業(yè)資深人士告訴數(shù)智前線,。
造成這個落差的原因有多方面。從場景上說,,ChatGPT剛出來時,,大家對大模型有很多憧憬,一位云計算人士舉例,,曾有企業(yè)找他咨詢,,AI能不能替代采購,因為采購環(huán)節(jié)最易滋生腐敗,,老板都想把這塊監(jiān)管或考慮用技術(shù)取代,。但采購不是一個簡單決策,需要綜合考量,。
“很多企業(yè)要么完全不知道怎么用,,要么就是天馬行空,但因為提出的場景復雜,、決策鏈太長,,實際做不到?!彼f,。而另一些人士認為,大家可能把大模型與通用人工智能混為一談,。
從技術(shù)角度看,,在醫(yī)療、教育等一些專業(yè)度、準確度要求高的客服場景,,大語言模型的幻覺是個問題,。當他們把行業(yè)數(shù)據(jù)注入到基礎(chǔ)大模型時,不管是微調(diào),,還是其他手段,,模型能吸納并能轉(zhuǎn)化成正確輸出的,大概有70%到80%,。這就要求不得不用更多辦法,,去處理那20%到30%的錯誤率。
但目前沒有特別低成本和快速的辦法,。”上述人士反饋,,很多東西需要去做強化學習和復雜的人工標定,所花的成本可能是現(xiàn)在成本基礎(chǔ)再乘以10甚至更多,,這讓很多企業(yè)難以接受,。
針對上述兩個問題,聚焦領(lǐng)域大模型開發(fā)的中關(guān)村科金技術(shù)副總裁張杰告訴數(shù)智前線,,在場景選擇上,,他覺得接下來適合大模型進一步落地的較好賽道,是專業(yè)性較高,,且容錯性較高的場景,,如企業(yè)知識問答、營銷機器人,、坐席助手,。而通用性太高或容錯性又比較低的場景,如自動駕駛,,不是特別好的商業(yè)賽道,。
從技術(shù)層面,張杰認為不是某一套大模型的應用技術(shù)路線,,就可以非常完美地解決問題,,他介紹了三種由淺入深的應用技術(shù)路線。
圖片
從落地實踐看,,目前,,前兩種接受度高?!斑@三種方法不是3選1,,在具體場景下,肯定是一套組合拳,?!彼a充道,。
“大家其實看到iPhone在2006就出來了,但整個移動互聯(lián)網(wǎng)時代的開啟是在2012年,?!敝行沤ㄍ蹲C券研究所所長、武超則在不久前的行業(yè)會議上稱,,“這個過程才剛剛開始”,。
她認為大模型有幾個階段的演進,從能聽會說,、能看會認開始,,到能夠像人一樣去組合使用工具,從而讓每個人配一個“斯坦福畢業(yè)的助理”,,再到通用人工智能中的會規(guī)劃,、會決策。
行業(yè)在不斷深入探索,。一位行業(yè)資深人士告訴數(shù)智前線,,他們在做教育等行業(yè),客戶數(shù)量較大,,在將大模型融入業(yè)務工作流的過程中,遇到很多問題,,“還在去尋找有沒有更能解決問題的方式”,。
03
企業(yè)紛紛涌向開源大模型
在大模型落地的過程中,越來越多的國內(nèi)企業(yè)開始采用開源大模型,。
一位南方電網(wǎng)人士告訴數(shù)智前線,,內(nèi)部現(xiàn)在進行大模型嘗試時,“都是基于Llama吧”,。Meta公司在今年7月發(fā)布了開源可商用大模型Llama 2,,包含了70億、130億和700億參數(shù)3個版本,。另一位南方電網(wǎng)人士稱,,內(nèi)部對不同開閉源模型正進行測試賽馬。
8月,,金蝶發(fā)布的財務大模型,,也基于開源大模型訓練而來。金蝶CTO趙燕錫告訴數(shù)智前線,,就像手機操作系統(tǒng)有iOS,、安卓一樣,開源模型要打造生成式AI的安卓系統(tǒng),,國內(nèi)有像清華ChatGLM,,國際上有MPT、Llama,未來是一個多模型合作的想法,。
在金融領(lǐng)域落地中,,有資深人士告訴數(shù)智前線,開源,、閉源大模型都有,,因為各金融機構(gòu)體量不一,策略也不一樣,。很多公司先在一個具體場景下用開源模型做出實際效果,,再考慮復制推廣,也有幾個大行對平臺做一些戰(zhàn)略性投入,,在閉源基礎(chǔ)大模型上,,建了一個類似于中臺的平臺,期望將來同時對接多個場景,。
“之前我們自己訓練了兩個不同參數(shù)的模型,,最近我們也在用開源?!敝锌粕钪荂TO宋健告訴數(shù)智前線,。他認為,目前絕大部分文本寫作,、上下文匹配,,130億參數(shù)的模型已夠用,而三四百億參數(shù)的模型,,在解決很多垂類問題上已經(jīng)足夠,,無論國內(nèi)百川,還是國外的Llama,,效果都不錯,。
圖片
一家物聯(lián)網(wǎng)公司技術(shù)高管告訴數(shù)智前線,目前開源大模型發(fā)展較快,,開源社區(qū)也發(fā)布了很多模型,,大部分基于Llama 2微調(diào)而來。“我們也測試過很多開源和閉源模型,,由于我們的目標市場需要多語言支持,,會更多考慮Llama 2。如果是面向國內(nèi)市場,,一些國內(nèi)的模型也很優(yōu)秀,。”
“選擇開源和閉源,,實際上各有優(yōu)缺點,。使用開源模型的好處主要是較為自由,,包括部署、微調(diào),、升級和免費,。閉源的好處是有質(zhì)量保證,免自己部署和應用門檻較低,。”上述資深人士介紹,。
他選擇開源的一個重要原因是認為,目前開源模型的繁榮和水平提高呈現(xiàn)一個明顯趨勢,。他打了一個比喻,,開源大模型的水平就好比海平面,閉源大模型相當于一個個島嶼,。目前這些島嶼上漲的速度,,跟不上海平面上漲的速度,大部分島嶼將會被海水淹沒,,可能世界上最后就剩下幾座上漲比較快的島嶼,。
模型本身現(xiàn)在可選的很多,多位業(yè)內(nèi)人士也贊同,,開源和閉源不是客戶會關(guān)心的問題,,“極少客戶會去指定用哪一款模型”。因為客戶并不直接使用基礎(chǔ)大模型,,最終客戶是沒有感知的,。“客戶更關(guān)心的是精度,、速度和價格。當然最終保證無害性,、合法性,,這是應用開發(fā)商必須解決的問題?!鄙鲜鑫锫?lián)網(wǎng)行業(yè)專家說,。
張杰告訴數(shù)智前線,因為開源可商用大模型,,每一款可能都有自己的優(yōu)缺點,,比如說有些適合做一些分類型的任務,有些性能比較好,,有些可能就生成式的任務表現(xiàn)比較好,,還是要根據(jù)具體場景,一些ROI的需求,,選擇不同的模型,。
“總體來講,,我們覺得接下來大模型非常重要的趨勢,就是開源,?!敝行沤ㄍ蹲C券武超則稱,非標準化的場景,,非標準化的算力,,這種架構(gòu)決定開源可能會是一個比較趨同的方向。
04
大廠態(tài)度發(fā)生變化
開源世界的迅速繁榮,,也正導致大模型生態(tài)鏈企業(yè)甚至底層芯片廠商的態(tài)度和策略發(fā)生一些微妙變化,。
一家國內(nèi)主流AI芯片企業(yè)人士告訴數(shù)智前線,Meta推出Llama 2開源模型后,,呈現(xiàn)出的效果較好,,這對目前市場上一些大模型來說是個絕殺。為此,,他們已暫緩了對一些大模型的適配工作,,觀望一下再說。
國內(nèi)外大模型大廠也已迅速在策略上做出改變,,普遍朝著“左手閉源,,右手開源”的方向走。
在國外,,微軟除了投資OpenAI閉源大模型,,也和Meta實現(xiàn)牽手,宣布在其Azure云和Windows內(nèi)上線開源的Llama 2,。亞馬遜AWS,、谷歌云也都在自研大模型基礎(chǔ)上,支持第三方和開源模型,。
在國內(nèi),,8月初,百度先宣布升級千帆大模型平臺,,接入Llama2全系列,、清華ChatGLM2、RWKV等33個大模型,,并對這些模型進行性能增強,、推理優(yōu)化等工作;之后,,阿里開源通義千問70億參數(shù)模型,,包括通用模型Qwen-7B和對話模型Qwen-7B-Chat,稱“開源,、免費,、可商用”,;而在8月16日,騰訊亦亮出新動作,,宣布騰訊云TI平臺已接入Llama 2,、Falcon、Dolly等20多個主流模型,,旨在打造行業(yè)大模型精選商店,。
圖片
大廠們何以會有如此“整齊劃一”的動作?
市場需求變化是一個因素,。百度智能云AI與大數(shù)據(jù)平臺總經(jīng)理忻舟告訴數(shù)智前線,,他們發(fā)現(xiàn)市場需求已逐漸進入深水區(qū),僅文心一言一個模型,,不能滿足客戶多樣化需求,,而如果能把一個平臺做好,“會有更多的流量”,。
業(yè)界觀察,,7月下旬,百度在對外表述中,,已將原來的“文心千帆大模型平臺”轉(zhuǎn)變?yōu)椤扒Х竽P推脚_”,,在做“去文心化”。
另一個現(xiàn)實因素是,,大廠們單個項目報價普遍在千萬元級別,,閉源大模型暫時還沒能有足夠多的大項目落地。
此外,,清華ChatGLM建立了有策略的,、組合的商業(yè)模式,把小模型開源出去,,吸引商機和生態(tài),,它的閉源大模型也可以為企業(yè)提供定制化服務。大模型廠商提供一個開源的但規(guī)模較小的大模型供大家使用,,也是一種營銷模式。
一位熟悉阿里云的資深人士也表示,,他猜測,,上述這些因素也是阿里開源兩款大模型的重要原因之一?!白吡硗庖粭l路試試看,。”
而大模型變現(xiàn)的通路,,并不只是模型本身,。
數(shù)智前線獲悉,,華為在大模型上的考量,算力是重頭之一,。7月底到8月初,,任正非就大模型有兩次講話,均與算力相關(guān),。
先是成立AI算力先遣隊,,由原煤礦軍團團長鄒志磊負責。任正非說,,有4000個客戶想要用華為昇騰平臺去訓練大模型,。華為也將可能在10月成立15個小組去分別服務15個客戶。之后,,針對華為在《自然》雜志上發(fā)表的華為云盤古氣象大模型的論文,,任正非也談及要“在新的淘金時代賣鏟子”。
無獨有偶,,忻舟介紹,,百度在大模型上的商業(yè)模式可分為兩個層面。從文心一言這個大模型的角度講,,百度賺的是AI的錢,。但千帆同時還是一個支持其他第三方模型的平臺,本質(zhì)上“還是云的思路,,賺云的錢”,。
此外,開源對生態(tài)建設也是百利而無一害,。畢竟大模型被認為是智能時代的操作系統(tǒng),,而操作系統(tǒng)比拼的是生態(tài),百度智能云AI平臺副總經(jīng)理李景秋認為,,好的開源模型會極大吸引市場上創(chuàng)新公司關(guān)注大模型并參與其中,,進而帶來整個上下游服務生態(tài)的完善。
今年7月,,阿里云也對外喊出“將促進中國大模型生態(tài)的繁榮作為首要目標”的口號,。“這就類似于原來開源軟件的模式,,通過開源來吸引客戶,,建立產(chǎn)品的社區(qū)?!币晃淮竽P皖I(lǐng)域資深人士表示,。
該人士認為,無論國內(nèi)國外,、開源閉源,,大模型的發(fā)布可能還會更多,,具有通用基礎(chǔ)能力的大模型,可能會集中到少數(shù)幾個廠商,,但具有行業(yè)細分的大模型,,比較典型的像醫(yī)療、法律,、教育,,會有更多廠商去做。另外,,基于大模型的能力做出來的應用級產(chǎn)品,,會逐漸繁榮,形成一個新的生態(tài)和軟件開發(fā)模式,,“比如最近比較火的MetaGPT和ToolLLM”,。

    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點,。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,,謹防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報,。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多