【原】ChatGPT冷觀察：沒(méi)有大模型的土壤，開(kāi)不出ChatBot的花

智能相對(duì)論 2023-02-16 發(fā)布于湖南

展開(kāi)全文

IDC《2022中國(guó)大模型發(fā)展白皮書(shū)》,，道出中國(guó)版ChatGPT甄別方式,？

文|智能相對(duì)論（aixdlun）

作者|葉遠(yuǎn)風(fēng)

誰(shuí)在跟風(fēng)，誰(shuí)又有真本事能做出中國(guó)版的對(duì)標(biāo)產(chǎn)品來(lái),？

這恐怕是ChatGPT這股熱潮以來(lái),，關(guān)心中國(guó)AI發(fā)展的業(yè)界人士最想問(wèn)的問(wèn)題。

或者說(shuō),，在中國(guó)人工智能不落后于全世界的當(dāng)下，業(yè)界也在普遍渴望一個(gè)真正有實(shí)力的ChatGPT類產(chǎn)品出現(xiàn),。

但是,，在一個(gè)人人都有那么點(diǎn)AI底子、能說(shuō)出一些AI技術(shù)成果的今天,，如果沒(méi)有專業(yè)的,、系統(tǒng)的判斷標(biāo)準(zhǔn)，這個(gè)問(wèn)題可能很難有答案——風(fēng)潮下人人都像是跟風(fēng)的,，也都像是有能力的,。

不過(guò)，IDC剛剛發(fā)布的一個(gè)關(guān)于大模型的報(bào)告,，卻某種程度上“附帶”解決了這個(gè)問(wèn)題,。

在《2022中國(guó)大模型發(fā)展白皮書(shū)》中，面向大模型的發(fā)展,，IDC在行業(yè)首次提出大模型評(píng)估框架,，通過(guò)多維度標(biāo)準(zhǔn)，對(duì)行業(yè)主要大模型的發(fā)展?fàn)顩r進(jìn)行了系統(tǒng)化的判斷和評(píng)分,。

當(dāng)大模型能力的判斷有了較為權(quán)威的行業(yè)標(biāo)準(zhǔn)后,，誰(shuí)能做出真正的ChatGPT類產(chǎn)品，其實(shí)已經(jīng)有了答案,。

ChatGPT是AI的一大步,，

但只是大模型的一小步

在問(wèn)能不能之前，先要問(wèn)是什么,。

雖然ChatGPT的問(wèn)世已經(jīng)有數(shù)個(gè)月的時(shí)間,，但對(duì)多數(shù)人尤其是行業(yè)外的“吃瓜群眾”而言，除了知道這是AI領(lǐng)域的一大突破外,，對(duì)它究竟是什么并沒(méi)有深入地了解,。

實(shí)際上，ChatGPT就是一種大規(guī)模語(yǔ)言模型（LLM Large Language Model），是大模型在NLP領(lǐng)域不斷發(fā)展的一種結(jié)果,。

從技術(shù)角度看,，目前大模型已經(jīng)深入各個(gè)AI領(lǐng)域，如NLP,、CV,、科學(xué)計(jì)算等，但它最早發(fā)端于NLP,，以谷歌的BERT,、OpenAI的GPT和百度文心大模型為代表，參數(shù)規(guī)模逐步提升至千億,、萬(wàn)億,，同時(shí)用于訓(xùn)練的數(shù)據(jù)量級(jí)也顯著提升。

隨著“大本營(yíng)”NLP領(lǐng)域大模型的不斷進(jìn)化,，最終OpenAI的GPT率先開(kāi)出了ChatGPT這朵花,。

所謂GPT，即Generative Pre-Trained Transformer,，就是通過(guò)Transformer為基礎(chǔ)模型,，使用預(yù)訓(xùn)練技術(shù)得到通用的文本模型。

GPT家族已經(jīng)先后擁有GPT-1,，GPT-2,，GPT-3，以及圖像預(yù)訓(xùn)練iGPT等模型,，ChatGPT本質(zhì)就是GPT-3.5,，只不過(guò)因?yàn)閺?qiáng)大的對(duì)話能力突然爆火起來(lái)。不同的是,，ChatGPT采用了新的指示學(xué)習(xí)（Instruction Learning）和人工反饋的強(qiáng)化學(xué)習(xí)（Reinforcement Learning from Human Feedback,，RLHF）來(lái)指導(dǎo)模型的訓(xùn)練，前者帶來(lái)了理解能力,，后者增強(qiáng)了模型效果,。

無(wú)論如何，大模型良好的通用性,、泛化性,，以及顯著降低人工智能應(yīng)用門(mén)檻的優(yōu)勢(shì)，在ChatGPT上得到了淋漓盡致的展示,。

從這個(gè)意義上看,，任何NLP領(lǐng)域的大模型，在良好的發(fā)展之后,，都會(huì),、都可以生長(zhǎng)出自己的ChatGPT,，或者，更專業(yè)的概念稱為ChatBot類產(chǎn)品,。

“智能相對(duì)論”總結(jié)目前市面上領(lǐng)先的NLP大模型以及ChatBot產(chǎn)品如下：

從這個(gè)列表可以看出兩件事：

1,、所有成型的ChatBot都只能是大模型發(fā)展的一種產(chǎn)品化結(jié)果，國(guó)外Google的Bard,、國(guó)內(nèi)百度的文心一言（ERNIE Bot）都是如此,，其本質(zhì)都是前期大模型家族的最新產(chǎn)品。

2,、不管哪個(gè)ChatBot,，能做得怎么樣，幾乎都取決于前期大模型家族的發(fā)展情況,。

對(duì)大多數(shù)缺乏優(yōu)秀大模型基礎(chǔ)的廠商而言,，要么必須花長(zhǎng)周期重走一遍類似從“文心”到“文心一言”的路徑，要么就繞過(guò)大模型直接做ChatBot——其質(zhì)量可想而知,。

而判斷大模型家族的基礎(chǔ)究竟如何,，IDC的報(bào)告剛好就起到了作用。

此次IDC為了充分評(píng)估大模型技術(shù)能力,、功能豐富度與底層深度學(xué)習(xí)平臺(tái)開(kāi)發(fā)能力，以及對(duì)各行業(yè)賦能的實(shí)際效果,，并考慮到大模型的未來(lái)商業(yè)化前景,，搭建起了大模型評(píng)估框架V1.0：

最終，IDC中國(guó)將大模型市場(chǎng)服務(wù)劃分成了L1-L5五個(gè)層級(jí)（層級(jí)越高,，廠商在大模型市場(chǎng)梯隊(duì)越靠前）,，最終評(píng)價(jià)結(jié)果是當(dāng)前大部分廠商能力處于L2-L3層級(jí)。其中,，最為凸顯的是唯一處在第一梯隊(duì)的百度文心大模型,，產(chǎn)品能力、生態(tài)能力達(dá)到L4水平,，應(yīng)用能力達(dá)到L3水平：

目前,，被IDC高度評(píng)價(jià)的文心大模型已經(jīng)建設(shè)了包括基礎(chǔ)大模型（NLP、CV,、跨模態(tài)）,、任務(wù)大模型、行業(yè)大模型三大類在內(nèi)的36個(gè)大模型,。IDC認(rèn)為,，百度文心大模型在產(chǎn)品能力上呈現(xiàn)出較強(qiáng)技術(shù)實(shí)力和平臺(tái)積累，“文心大模型+深度學(xué)習(xí)平臺(tái)”創(chuàng)新了人工智能研發(fā)應(yīng)用范式,，滿足市場(chǎng)大規(guī)模落地需求,，達(dá)到行業(yè)前端水平,。

IDC中國(guó)副總裁兼首席分析師武連峰表示，“大模型的背后蘊(yùn)藏著一場(chǎng)人工智能落地模式的變革,。如今火爆全球的ChatGPT背后的技術(shù)支撐正是大模型,。沒(méi)有對(duì)大模型的長(zhǎng)期投入，就不會(huì)誕生ChatGPT這樣的應(yīng)用,。在IDC提出的大模型評(píng)估框架下,，百度文心大模型在本次評(píng)估中表現(xiàn)非常突出，是其打造文心一言的堅(jiān)實(shí)基礎(chǔ),?！?/p>

因此，國(guó)內(nèi)已經(jīng)宣布要做ChatGPT類產(chǎn)品的科技大廠中,，能夠最終做出類ChatGPT產(chǎn)品的,，可能還是只有擁有中國(guó)科技企業(yè)最成熟的大模型開(kāi)發(fā)工具和產(chǎn)品體系的百度。

當(dāng)然,，這個(gè)結(jié)果并不意外,，國(guó)內(nèi)長(zhǎng)期堅(jiān)持在大模型領(lǐng)域投入的，百度就是其中一,。

大模型評(píng)估框架下,，

ChatBot兩種發(fā)展路徑顯現(xiàn)

既然IDC以權(quán)威、系統(tǒng)的方式證明了國(guó)內(nèi)（主要是百度文心,、文心一言）有充分的推出ChatBot的大模型基礎(chǔ)能力,，那么為什么最先走出來(lái)被廣泛關(guān)注到的還是ChatGPT？

如果從文心的發(fā)展與GPT的發(fā)展對(duì)比來(lái)看,，大模型時(shí)代,，ChatBot的兩種發(fā)展路徑的不同已經(jīng)顯現(xiàn)出來(lái)。

早在2019年3月,，百度就做出了文心 ERNIE 1.0,，這一技術(shù)創(chuàng)新與“同類”GPT-1、BERT的差距都只有幾個(gè)月,，且百度積累的大規(guī)模知識(shí)和海量多元數(shù)據(jù),，讓文心得以快速發(fā)展。

到了2021年,，ERNIE 3.0大模型即擁有千億參數(shù),，后來(lái)ERNIE 3.0 Titan更是達(dá)到了2600億。

這個(gè)發(fā)展過(guò)程,，百度也逐漸構(gòu)建起一套包括文心大模型層,、工具平臺(tái)層、產(chǎn)品與社區(qū)的三層體系,，這就是IDC在報(bào)告中強(qiáng)調(diào)的,，“模型+工具平臺(tái)+生態(tài)”三級(jí)協(xié)同加速產(chǎn)業(yè)智能化,。

說(shuō)白了，百度從一開(kāi)始就在想著怎么讓文心大模型進(jìn)產(chǎn)業(yè),、怎么落地獲得商業(yè)價(jià)值,，也是按照這個(gè)“總綱”在走、在設(shè)計(jì)其整個(gè)體系,。

最典型如,，文心已累計(jì)發(fā)布11個(gè)行業(yè)大模型，在金融,、能源,、制造、城市,、傳媒,、互聯(lián)網(wǎng)等行業(yè)擁有實(shí)際落地的標(biāo)桿案例，盯住的是解決客戶的實(shí)際痛點(diǎn),，把大模型能力應(yīng)用到客戶業(yè)務(wù)流程關(guān)鍵環(huán)節(jié)中,，求技術(shù)效果突破、求產(chǎn)品創(chuàng)新,、求生產(chǎn)流程變革,、求降本增效，等等,。

在這些行業(yè)大模型往下,，還有任務(wù)大模型、基礎(chǔ)大模型的全力支撐,；再往上，又有工具,、產(chǎn)品的落地轉(zhuǎn)化,。

這種體系化面向產(chǎn)業(yè)的做法，一方面源于中國(guó)獨(dú)特的產(chǎn)業(yè)智能化需求的大背景,，另一方面與百度將AI的發(fā)展更多地轉(zhuǎn)向現(xiàn)實(shí)產(chǎn)業(yè)價(jià)值有關(guān),。

如果說(shuō)這種做法有什么后果，那就是集中B端落地,、晦澀的技術(shù)和產(chǎn)品帶來(lái)的技術(shù)認(rèn)知不足,。

現(xiàn)在，大洋彼岸的ChatGPT突然搞出了“大新聞”,，舉起了旗幟,，文心基于此前的能力積累也能做出類ChatGPT的面向C端大眾的ChatBot產(chǎn)品文心一言，于是,，這就成了百度彰顯自身技術(shù)能力的一個(gè)契機(jī),。

反過(guò)來(lái)看,，ChatGPT則先面向C端做出了老少咸宜的大眾化可觸達(dá)產(chǎn)品，相似的技術(shù)底子下,，聲量自然就更高,。

毫無(wú)意外的是，在OpenAI的布局中,，ChatGPT接下來(lái)也會(huì)嘗試走入更多垂直產(chǎn)業(yè)中發(fā)揮價(jià)值,。

最終，兩種路徑都將殊途同歸,，實(shí)現(xiàn)B,、C的全覆蓋，只是所處階段不同而已,。

技術(shù)層不可跟風(fēng)也跟不了風(fēng),，

但ChatBot產(chǎn)業(yè)應(yīng)用卻值得廣泛嘗試

做ChatBot，在技術(shù)層面不應(yīng)該跟風(fēng)上馬,，它只能是LLM的一種自然的結(jié)果,。

用更直接的話說(shuō)，如果認(rèn)為ChatBot真的有用,，想要造福自身業(yè)務(wù)或者惠及伙伴,、客戶，更多缺乏基礎(chǔ)的科技大廠應(yīng)該沉下心來(lái)做這件事,，而不是大干快上,、急著表態(tài)。

跟風(fēng)哄抬股價(jià),、刺激關(guān)注并不可取,，最終欺騙的是投資者和關(guān)心企業(yè)的人。

不過(guò),，在這股風(fēng)潮中,，于產(chǎn)業(yè)方而言，卻并不存在什么跟風(fēng)不跟風(fēng),。

作為AI領(lǐng)域好不容易等來(lái)的確確實(shí)實(shí)可能改變價(jià)值認(rèn)知的產(chǎn)品,，ChatBot在任何產(chǎn)業(yè)都值得嘗試，只要有益于業(yè)務(wù)都可以探索這股AI的全新力量,。

之前,，在ChatGPT被歸入的AIGC（生成式AI）場(chǎng)景下，百度文心已經(jīng)有大量的產(chǎn)業(yè)實(shí)踐,。

例如,，ERNIE 3.0文本理解與創(chuàng)作API，覆蓋寫(xiě)作文,、摘要,、文案,、小說(shuō)、對(duì)聯(lián)等多項(xiàng)生成能力,，每天服務(wù)上萬(wàn)用戶,；而基于文心大模型的智能視頻合成平臺(tái)則讓用戶在一鍵輸入新聞圖文內(nèi)容鏈接后，就可以自動(dòng)化完成視頻制作,，這些都大大提升了內(nèi)容創(chuàng)造的效率和質(zhì)量,。

在文心一言推出后，已有攜程,、汽車之家,、愛(ài)藝奇、大量媒體機(jī)構(gòu)等宣布接入,。

最近,，百度方面還宣布，未來(lái)會(huì)推出生態(tài)合作計(jì)劃,，要吸引和支持更多伙伴加入進(jìn)來(lái),，一起拓展覆蓋范圍更廣的商業(yè)市場(chǎng)。

在熱烈的預(yù)期之下,，真實(shí)的產(chǎn)業(yè)成果正在被探索,、走向落地。

值得一提的是,，作為基于百度智能云技術(shù)打造出來(lái)的大模型,，文心一言未來(lái)也將通過(guò)百度智能云對(duì)外提供服務(wù)，為產(chǎn)業(yè)帶來(lái)真正的AI普惠,，這也將根本性地改變?cè)剖袌?chǎng)的游戲規(guī)則,。之前選擇云廠商更多看算力、存儲(chǔ)等基礎(chǔ)云服務(wù),，以后用戶對(duì)云廠商的需求更加聚焦智能服務(wù),，會(huì)更多關(guān)注模型、框架,、芯片以及應(yīng)用，這四層架構(gòu)之間的協(xié)同,。云服務(wù)正從數(shù)字時(shí)代躍遷到智能時(shí)代,，智能化對(duì)各行各業(yè)效率的提升將顯著顯現(xiàn)。

正如IDC所言,，各行業(yè)技術(shù)買(mǎi)家都應(yīng)該盡早擁抱大模型,，利用大模型進(jìn)行降本增效、產(chǎn)品革新,，“越早開(kāi)始將大模型與自身行業(yè),、任務(wù)相結(jié)合,，模型與技術(shù)之間才有更多的時(shí)間進(jìn)行打磨優(yōu)化，在未來(lái)大模型深入各行各業(yè)的時(shí)候才能擁有話語(yǔ)權(quán)”,。

除了“看熱鬧”,，想要在ChatGPT帶來(lái)的風(fēng)潮中抓住商業(yè)機(jī)會(huì)的企業(yè)，以及對(duì)ChatBot真正有需求的產(chǎn)業(yè)主體,，都應(yīng)該行動(dòng)起來(lái)了,。