讓技術(shù)創(chuàng)新原生于場景,, 愛數(shù)如何高效推動大模型產(chǎn)業(yè)落地,? 文 | 智能相對論(aixdlun) 作者 | 葉遠風(fēng) 大模型時代,廠商們狂奔突襲,,技術(shù)創(chuàng)新一浪高過一浪,。 在這個過程中,先趕上風(fēng)口做出一個大模型產(chǎn)品,,宣傳一波,、站穩(wěn)腳跟,再慢慢談場景應(yīng)用,、價值落地,,是很多廠商的做法——從技術(shù)出發(fā)再往場景切入,成為業(yè)界普遍的“路線圖”,。 但是,,隨著場景落地變得越來越重要,越來越成為業(yè)界尤其是政企客戶的普遍關(guān)切,,一種新的路線正在出現(xiàn),。 2023世界人工智能大會期間,大數(shù)據(jù)基礎(chǔ)設(shè)施提供商愛數(shù)在“大模型時代的領(lǐng)域認知智能”分論壇上宣布全面升級AnyShare智能內(nèi)容管理平臺,,推出AnyShare認知助手和AnyShare大模型一體機,,并發(fā)布領(lǐng)域認知中臺方案,正式布局大模型,。 在直觀上,,愛數(shù)的這次發(fā)布,并沒有像很多大廠那樣推出一個有名字的大模型產(chǎn)品,,而是強調(diào)“助力行業(yè)客戶解決數(shù)據(jù)治理、數(shù)據(jù)運營,、內(nèi)容管理難題,,加速業(yè)務(wù)智能化”,。 換言之,大模型“產(chǎn)品”不是愛數(shù)的布局重點,,把大模型“能力”嵌入已有的數(shù)據(jù)服務(wù)業(yè)務(wù)才是關(guān)鍵,。 在這里,從場景需求出發(fā)再思考技術(shù)的融合,,成為大模型一種新的發(fā)展路線,。 聚焦落地后, 大模型的路線分化是必然結(jié)果 每個明星大模型產(chǎn)品的發(fā)布,,往往都是先展示一套面向C端的“聊天能力”,,然后再公布其發(fā)展的“宏偉藍圖”——拉攏合作伙伴往各大場景布局落地。 數(shù)字化,、智能化過去已經(jīng)玩過的全場景構(gòu)想,,在大模型這里又來了一遍。 在千行百業(yè)都將被大模型占領(lǐng)的預(yù)期下,,創(chuàng)造一個能夠?qū)崿F(xiàn)這樣的市場機會的大模型,,就成為從大廠到中小創(chuàng)業(yè)者的普遍理想。 而這,,就是一種典型的“跟風(fēng)”,,先做出來畫個大餅再說,管它后邊如何,。 實際上,,既然大模型是注定要走向千行百業(yè)的,那么從千行百業(yè)原生出契合各自場景需求的大模型,,某種程度上才應(yīng)該是最恰當(dāng)?shù)姆绞街弧?/p> 這正是愛數(shù)在做的,。 從2021年起,愛數(shù)就在推出數(shù)據(jù)智能產(chǎn)品,,并與德國漢堡大學(xué),、復(fù)旦大學(xué)、天津大學(xué)等建立聯(lián)合實驗室,。領(lǐng)域認知智能是愛數(shù)幫助客戶實現(xiàn)數(shù)智化轉(zhuǎn)型的重要著力方向,,已經(jīng)持續(xù)耕耘多時。 現(xiàn)在,,當(dāng)大模型東風(fēng)吹起來,,除了火熱的、更容易被大眾直接感知的AIGC,,實際上最根本帶動的是AGI(通用人工智能)的發(fā)展,,而這與愛數(shù)實現(xiàn)領(lǐng)域認知智能的方向是一致的。 對愛數(shù)這樣已經(jīng)從事數(shù)據(jù)服務(wù),、認知智能的廠商來說,,積極擁抱大模型,,將全域數(shù)據(jù)能力及領(lǐng)域認知智能積累的優(yōu)勢與大模型技術(shù)深度結(jié)合,就成為一種自然而然的選擇,。 不需要跟風(fēng),,不需要刻意,場景的價值基礎(chǔ)一開始就具備,,大模型帶來的是直接落地的強化能力,。 過去,愛數(shù)雖然著力推動客戶實現(xiàn)業(yè)務(wù)智能化,,但仍然面臨一些挑戰(zhàn),,例如在業(yè)務(wù)運營、決策方面缺乏高質(zhì)量數(shù)據(jù),;由于業(yè)務(wù)不標準,、執(zhí)行不規(guī)范導(dǎo)致數(shù)據(jù)難治理;以及信息,、知識的共享還需要人力繁瑣的操作積累原始的數(shù)據(jù),,等等。 在業(yè)界,,這種先需要大量的人力投入然后再創(chuàng)造智能化價值的過程,,被稱為“有多少人工就有多少智能”。大模型的介入,,讓愛數(shù)得以解決過去企業(yè)智能化轉(zhuǎn)型在業(yè)務(wù),、知識、數(shù)據(jù)等層面大量需要人力工作的問題,,全過程都不再需要太多人力的介入,,而實現(xiàn)“有多少數(shù)據(jù)就有多少智能”。 如此,,愛數(shù)的數(shù)據(jù)資產(chǎn)化,、數(shù)據(jù)知識化、數(shù)據(jù)服務(wù)化和數(shù)據(jù)要素化努力就將事半功倍,,幫助客戶更好地實現(xiàn)業(yè)務(wù)智能化,。 例如,在城市招商的過程中,,愛數(shù)原本就能幫助政務(wù)客戶實現(xiàn)領(lǐng)域認知智能,,自動化整理各種產(chǎn)業(yè)鏈對象的知識,根據(jù)城市園區(qū)建設(shè)需求匹配對應(yīng)的潛在合作對象,。 大模型的加入,,讓這些知識的獲取也不再需要繁瑣的、長周期的大量人力投入,而是可以通過AGI能力大大加速,,并在資源匹配上變得更加精準,。 可以看到,愛數(shù)的大模型完全起源于場景業(yè)務(wù)的需求,,是對創(chuàng)新技術(shù)的充分利用,推動原有數(shù)字化,、智能化服務(wù)的效率和質(zhì)量提升,,而這,正好也符合廣大政企客戶對大模型的價值期待,。 一窩蜂式的搞概念,,帶來的只有看客,而不是真正的接納,。 新的路線選擇,, “附帶”解決了大模型落地三大場景痛點 當(dāng)大模型開始從場景出發(fā)而不是從技術(shù)出發(fā),大模型過去在落地層面所面臨的三大痛點問題也在得到解決,。 1,、解決數(shù)據(jù)安全的核心關(guān)切 任何的大模型要走向應(yīng)用,在龐大的公域數(shù)據(jù)預(yù)訓(xùn)練后,,都必須要有一個根據(jù)政企業(yè)務(wù)需求進行再訓(xùn)練的過程,。這其中就存在數(shù)據(jù)泄露等安全隱患,成為很多政企客戶在選擇大模型時的首要關(guān)注因素,。 而如果長期耕耘場景,,知道政企客戶的痛點所在,大模型能力就能以恰當(dāng)?shù)姆绞健爸踩搿薄?/p> 愛數(shù)聯(lián)合行業(yè)生態(tài)伙伴共創(chuàng)的大模型一體就是如此,。 此次大會上,,愛數(shù)推出了AnyShare領(lǐng)域大模型一體機AS19000,該設(shè)備獨立部署于政企客戶的私有云環(huán)境下,,領(lǐng)域大模型訓(xùn)練和推理實現(xiàn)了分離(即一體機本身自帶有已經(jīng)訓(xùn)練好的大模型,,接入即可投入使用)。 這種物理上的隔離,,一方面解決了數(shù)據(jù)安全的問題,,另一方面,基于強大的預(yù)訓(xùn)練過程+硬件高配置又具備強大的大模型能力,,能為政企客戶帶來一體化的智能內(nèi)容管理體驗,。 此外,一體機模式還解決了大模型推理所耗費算力成本高昂的問題,,實現(xiàn)更經(jīng)濟性的部署,。 2、解決大模型與業(yè)務(wù)割裂問題 幾乎所有數(shù)字化、智能化轉(zhuǎn)型,,都會面臨外部服務(wù)商不了解內(nèi)部業(yè)務(wù)實際,、技術(shù)與場景割裂的痛點問題。 大模型進入行業(yè)和場景,,在根本上也是一種轉(zhuǎn)型升級,,也在面臨相同的問題,那些手舉所謂優(yōu)質(zhì)大模型的廠商雖然確實在技術(shù)創(chuàng)新上有所建樹,,但真正要深入場景卻未必懂企業(yè)具體的業(yè)務(wù)和需求,。 這時候,原本就深耕場景的廠商其優(yōu)勢就凸顯出來,。 前文提到愛數(shù)通過大模型解決業(yè)務(wù),、數(shù)據(jù)治理、知識運營過程中耗費人工的問題,,其主要方式,,就是推出一套數(shù)據(jù)驅(qū)動業(yè)務(wù)的領(lǐng)域認知中臺,以領(lǐng)域認知智能賦能數(shù)據(jù)資產(chǎn)化,,實現(xiàn)業(yè)務(wù)智能化,。 領(lǐng)域認知中臺的核心邏輯在于理解業(yè)務(wù)目標、流程,、標準,、規(guī)則和指標,建立一套統(tǒng)一的業(yè)務(wù)模型,。具體而言,,即在數(shù)據(jù)資源化的基礎(chǔ)上,基于領(lǐng)域知識網(wǎng)絡(luò)和領(lǐng)域大模型實現(xiàn)數(shù)據(jù)知識化,,通過愛數(shù)領(lǐng)域認知助手落地具體應(yīng)用場景,,以AnyFabric智能運營中心和AnyShare知識中心為載體,實現(xiàn)業(yè)務(wù)智能化,。 這個中臺不僅僅能夠覆蓋所有的業(yè)務(wù),,還能夠確保數(shù)據(jù)安全、訪問控制安全,、安全運維及安全災(zāi)備,,進一步回應(yīng)政企客戶的安全關(guān)切。 如此,,大模型能力,、愛數(shù)的數(shù)據(jù)服務(wù)、政企業(yè)務(wù)場景實際實現(xiàn)了三位一體的融合,。 典型如,,愛數(shù)發(fā)布的“領(lǐng)域認知助手”,,提供創(chuàng)新的智能搜索、智能問答,、輔助創(chuàng)作,、輔助閱讀等認知能力,將大模型能力具象化,,直接貼合員工的日常工作,,讓內(nèi)容生產(chǎn)實現(xiàn)真正的“智能化”。 3,、解決大模型“黑箱”難題 在內(nèi)容輸出上瞎編亂湊已經(jīng)成為全球大模型的技術(shù)頑疾,,無論GPT-4還是國內(nèi)一眾大模型產(chǎn)品,把信息張冠李戴的現(xiàn)象都十分嚴重,,例如李白的詩句被說成是杜甫作的。 目前為止,,包括OpenAI在內(nèi)的廠商都在“尋找最合適的解決辦法”,,但在一些測試中,這種現(xiàn)象也只是得到部分緩解,。 在根本上,,這是因為通用大模型無法針對性識別某個具體領(lǐng)域的信息之間的邏輯聯(lián)系進行針對性處理,要解決這個問題,,可能需要很多針對性的知識進行“校正”,,其技術(shù)實現(xiàn)難度較大,或者說訓(xùn)練參數(shù)量需要更加龐大,。 現(xiàn)在,,當(dāng)場景業(yè)務(wù)經(jīng)驗積累在前,大模型的“黑箱”造成信息輸出偏差的問題得到了自然而然的解決,。 愛數(shù)在過去就為不同行業(yè),、場景建立了一套系統(tǒng)的領(lǐng)域知識網(wǎng)絡(luò),作為其領(lǐng)域認知智能的重要智力來源?,F(xiàn)在,,這套領(lǐng)域知識網(wǎng)絡(luò)與大模型結(jié)合,用正確的場景知識邏輯作為“同步評審”,,讓大模型可實現(xiàn)可控可干預(yù)可解釋,,直接推動大模型輸出結(jié)果的精確化。 實際上,,愛數(shù)領(lǐng)域知識網(wǎng)絡(luò)與大模型的結(jié)合,,也是大模型深入場景的一種必要。 例如,,在化工等“容錯率”極低的行業(yè),,大模型的結(jié)果輸出必須做到精準無誤,無法容忍重要的信息張冠李戴。而愛數(shù)的領(lǐng)域知識網(wǎng)絡(luò)中,,任何一個材料的工藝都來自于大量實踐,,屬于最省成本、最安全可控的流程方法,,精確到了數(shù)量,、比例、時間等每一個可度量的單位條件,,形成了結(jié)構(gòu)化,、規(guī)范化的數(shù)據(jù),最終通過大模型實現(xiàn)用戶查詢,、引用,,指導(dǎo)技術(shù)人員操作,降低成本,、防范風(fēng)險,。 明星產(chǎn)品風(fēng)光過后, 大模型落地呼喚產(chǎn)業(yè)生態(tài) 除了愛數(shù),,最近很多有關(guān)大模型的行業(yè)動作,,都逐步脫離“快速打出明星產(chǎn)品”的做法。 例如,,AI計算領(lǐng)域的昇騰全棧體系中,,開源的昇思AI開發(fā)框架推出專門推動大模型開發(fā)的新版本,并邀請來自客戶企業(yè),、伙伴,、高校的開發(fā)者一起做大模型,推動大模型生態(tài)的繁榮,。 也即,,昇思不再尋求自己做一個大模型產(chǎn)品,而是讓那些更接近場景的主體去做大模型——不只有愛數(shù),,整個行業(yè)都開始通過融合場景的方式推動大模型產(chǎn)業(yè)落地,。 在這個過程中,大廠,、創(chuàng)業(yè)者,、數(shù)字化服務(wù)商、高校,、科研院所,、基礎(chǔ)軟件、基礎(chǔ)硬件,、整機廠甚至政企客戶本身……大模型的生態(tài)會在場景需求導(dǎo)向下,,變得越來越豐富,,生態(tài)主體之間也在不斷相互協(xié)同。 例如,,愛數(shù)就宣布要開放合作通用大模型,,以及與客戶共創(chuàng)垂直領(lǐng)域的大模型,以合作姿態(tài)推動大模型能力進化,。 當(dāng)這種普遍的氛圍形成,,大模型風(fēng)口下“贏家通吃”的野心將消散。 以場景落地為目標,,將有不同的大模型在各自領(lǐng)域創(chuàng)造屬于自己的價值,,除了愛數(shù)這樣的已經(jīng)有深厚場景業(yè)務(wù)積累的玩家,那些新晉創(chuàng)業(yè)者的大模型可以只服務(wù)一家公司,,例如美團收購光年之外,,后者的產(chǎn)品將直接面向美團,獲得“最好的歸宿”,;大廠的大模型也可以只作為業(yè)務(wù)的強化,,例如字節(jié)的大模型專注于服務(wù)好自身的內(nèi)容、電商業(yè)務(wù),,等等。 只有從場景出發(fā)的百花齊放,,才有大模型繁榮的未來,,一個深刻改變世界的未來。 |
|