2018年至今,NLP領(lǐng)域經(jīng)歷了非常大的變化,,Transformer,、ELMO、BERT,、GPT-3,,再到最近的ChatGPT(GPT 3.5的微調(diào))的突破,NLP在預(yù)訓(xùn)練大模型的暴力拆解路上越走越遠(yuǎn),,這也讓各行業(yè)開始相信:很多之前無法做到的場(chǎng)景,、效果,現(xiàn)在可以有新的解法和落地,。 智能客服,,是NLP和深度學(xué)習(xí)技術(shù)落地的重要領(lǐng)域之一,。客服可以基于提前設(shè)定好的規(guī)則,,對(duì)用戶意圖進(jìn)行判斷并生成對(duì)應(yīng)的固定話術(shù),。文本機(jī)器人、外呼機(jī)器人,,可以替代掉原有重復(fù)性比較強(qiáng)的人工動(dòng)作,,逐漸轉(zhuǎn)變?yōu)橄鄬?duì)日常的落地場(chǎng)景。比如你日常所接聽到的快遞客服電話,,訂單咨詢的對(duì)話框等等,,背后都有來自客服機(jī)器人的驅(qū)動(dòng)。 但在對(duì)客服要求比較高的企業(yè)級(jí)場(chǎng)景中,,對(duì)多輪對(duì)話理解用戶意圖和知識(shí)專業(yè)度要求高,,現(xiàn)有的客服機(jī)器人仍有很大提升的空間。
這樣的問題也曾經(jīng)困擾浪潮信息的客服系統(tǒng)研發(fā)人員。 近日,,鈦媒體App對(duì)話浪潮信息服務(wù)總監(jiān)陳彬,、浪潮信息AI軟件研發(fā)總監(jiān)吳韶華,圍繞智能客服市場(chǎng)當(dāng)前解決的難題,,以AI大模型的實(shí)際落地應(yīng)用為視角,,進(jìn)行深入交流。 具體來講,,浪潮信息以AI大模型“源”為智能引擎,,和InService智能服務(wù)平臺(tái),,搭建出了“智能客服大腦”。 據(jù)介紹,,“智能客服大腦”學(xué)習(xí)了2萬余份產(chǎn)品文檔和用戶手冊(cè)的數(shù)據(jù),,并結(jié)合百萬條浪潮信息專家工程師服務(wù)對(duì)話、數(shù)十萬份日志,、工單數(shù)據(jù)等算法訓(xùn)練,,具備語言理解、數(shù)據(jù)分析,、自主學(xué)習(xí)和智能推理等能力,,支持自然語言交互服務(wù)、已授權(quán)IT設(shè)備的智能運(yùn)維與診斷,、以及備品備件等資源的智能管理和調(diào)度,。 AI大模型在應(yīng)用過程中必然會(huì)面臨各個(gè)行業(yè)的應(yīng)用落地。在此之前,,浪潮AI大模型“源”已經(jīng)在人機(jī)交互,、知識(shí)檢索、語言翻譯,、文學(xué)創(chuàng)作等領(lǐng)域有所應(yīng)用,。 以大模型作為基礎(chǔ)能力,通過大模型的蒸餾實(shí)現(xiàn)相關(guān)的小模型,,不僅實(shí)現(xiàn)的速度更快,,智能化水平更高,從技術(shù)角度來講,,大模型在落地過程中呈現(xiàn)出了與以往模型非常不同的技術(shù)特征,也帶來了更好的智能化水平,。不論對(duì)大模型進(jìn)行微調(diào),,還是引入領(lǐng)域知識(shí)庫(kù)的方式,均是業(yè)界在探索的路徑,。 在浪潮信息AI軟件研發(fā)總監(jiān)吳韶華看來,,“大模型想要在某個(gè)方向上訓(xùn)練得更好,智能化水平更高,,確實(shí)需要在具體落地場(chǎng)景引入額外的領(lǐng)域知識(shí),,才能解決實(shí)際問題。AI大模型有其自身特點(diǎn),,訓(xùn)練時(shí)使用的數(shù)據(jù)集主要來自互聯(lián)網(wǎng),,在通用知識(shí)和領(lǐng)域知識(shí)的分布上存在不均,會(huì)影響其在具體行業(yè)的應(yīng)用,?!?/p> 舉個(gè)例子,,在浪潮信息服務(wù)所面臨的主要客戶問題,包括咨詢和故障報(bào)修兩大類:前者如各類的產(chǎn)品服務(wù)政策,、設(shè)備使用,、以及復(fù)雜的技術(shù)咨詢,如技術(shù)咨詢方面其實(shí)比較常見的是如何做系統(tǒng)安裝,、Raid配置等,,因?yàn)檫@個(gè)過程比較復(fù)雜,常出現(xiàn)各種問題,;產(chǎn)品咨詢包括購(gòu)買產(chǎn)品的內(nèi)存配置,、保修時(shí)長(zhǎng)等等;故障報(bào)修相對(duì)會(huì)比較有針對(duì)性,、更多元,,例如無法開機(jī)、硬盤故障,、內(nèi)存故障等等,。 在浪潮信息的咨詢客戶中,有80%的用戶為非專業(yè)工程師,,智能客服需要在準(zhǔn)確理解用戶,、精準(zhǔn)定義問題的基礎(chǔ)上,通過多輪回答解決技術(shù)問題,,給予客戶滿意的答案,。對(duì)于客戶而言,如若智能客服所給予的答案過于標(biāo)準(zhǔn)和冗余,,卻無法快速幫客戶解決具體問題,,客服所給予的答案只可被定義為對(duì)的答案而不是好的答案。 實(shí)際上,,浪潮信息從4,、5年前就開始進(jìn)行客服的數(shù)字化轉(zhuǎn)型和探索,并且在2019年開始著手應(yīng)用業(yè)內(nèi)在探索的FAQ,、任務(wù)式對(duì)話,、知識(shí)圖譜等NLP領(lǐng)域相關(guān)技術(shù),對(duì)客服系統(tǒng)進(jìn)行了一定程度的改造和提升,。 但當(dāng)時(shí)遇到的瓶頸也十分明顯,,主要在于兩方面:“一是企業(yè)產(chǎn)品信息更新快,造成模型訓(xùn)練任務(wù)非常大,,加之模型知識(shí)庫(kù)的封閉,,在訓(xùn)練效果上也受到制約;二是機(jī)器人需要對(duì)上下文結(jié)合語境進(jìn)行語義理解,引導(dǎo)客戶提問并且精準(zhǔn)識(shí)別問題,,在專業(yè)知識(shí)領(lǐng)域的IT行業(yè),,難度非常高?!崩顺毙畔⒎?wù)與實(shí)施部總監(jiān)陳彬指出,。 除了在大模型的落地中引入領(lǐng)域知識(shí)外,浪潮智能客服在研發(fā)過程中還重點(diǎn)考慮了其他幾點(diǎn)因素: 第一,,客服系統(tǒng)是不是真正地理解客戶,,是否能夠通過多次對(duì)話了解到客戶真實(shí)的服務(wù)意圖。企業(yè)級(jí)場(chǎng)景中,,客戶有個(gè)報(bào)修問題,,但無法用專業(yè)的技術(shù)語言對(duì)服務(wù)場(chǎng)景進(jìn)行準(zhǔn)確描述時(shí),就非??简?yàn)客服系統(tǒng)的理解能力,。 第二,是否需要投入額外和高昂的人力成本讓客服機(jī)器人具備自主學(xué)習(xí),、迭代的能力,。讓專業(yè)工程師做重復(fù)的模型訓(xùn)練工作,既不符合企業(yè)成本要求,,也不符合企業(yè)建設(shè)專家型團(tuán)隊(duì)的長(zhǎng)期規(guī)劃,。 第三,B端客戶對(duì)企業(yè)的服務(wù)體驗(yàn),、服務(wù)口碑要求高,,訓(xùn)練出的客服系統(tǒng)是否能夠讓更多的客戶接受、信任并滿意地使用,。 相較于傳統(tǒng)的智能客服采用多模型,、多數(shù)據(jù)庫(kù)的架構(gòu),浪潮信息智能客服系統(tǒng)最終實(shí)現(xiàn)統(tǒng)一架構(gòu)支持多任務(wù)解決問題,。而此前完成一套客服動(dòng)作,,往往涉及FAQ、任務(wù)式知識(shí)圖譜,、知識(shí)檢索等模塊,需要在多個(gè)知識(shí)庫(kù),、模型之間進(jìn)行任務(wù)調(diào)度,,架構(gòu)復(fù)雜且維護(hù)難度比較大。 此外,,由于在模型訓(xùn)練上實(shí)現(xiàn)了自進(jìn)化,、快進(jìn)化學(xué)習(xí),而不是原有需要人工或半人工搭建和訓(xùn)練模型的過程,,在人工標(biāo)注和訓(xùn)練成本上得到了極大降低,。 從浪潮信息數(shù)據(jù)中心服務(wù)的成效來看,,在應(yīng)用智能客服系統(tǒng)后,客戶問答的匹配率(即覆蓋率)達(dá)到92%,,對(duì)常見的復(fù)雜問題的解決率目前能達(dá)到80%以上,,平均解決率是65%左右。此外,,服務(wù)整體人員規(guī)模占浪潮信息總?cè)藛T規(guī)模的4%,,而業(yè)內(nèi)一般都占比15%到20%左右,在整體人均效能上得到了一定提升,。 “服務(wù)作為一個(gè)公司的重要窗口業(yè)務(wù)部門,,也是和客戶交互最緊密的平臺(tái)。所以我們首先考慮的是怎么把實(shí)際業(yè)務(wù)和AI算法結(jié)合在一起,。本身IT的服務(wù)場(chǎng)景非常復(fù)雜,,且面對(duì)是更多大量的B類客戶,我們當(dāng)初也在討論,,是否真的需要花這么大的精力,,把傳統(tǒng)的服務(wù)場(chǎng)景,做AI的相關(guān)技術(shù)和算法的落地,,在項(xiàng)目初期也是比較有爭(zhēng)議的,。”陳彬表示,。 但從目前取得的成效來看,,當(dāng)初的投入是值得的。 結(jié)合鈦媒體的觀察,,客服機(jī)器人的背后仍是復(fù)雜的AI技術(shù)棧作為支撐,。涉及語音識(shí)別、語義理解和生成,、人機(jī)交互等等,,存在系統(tǒng)搭建成本較高。如AI的邊際成本,,模型訓(xùn)練中對(duì)人工標(biāo)注數(shù)據(jù)的成本,,加之企業(yè)多數(shù)存在二次開發(fā)的定制化要求,導(dǎo)致部署交付成本也難以避免,。 企業(yè)對(duì)技術(shù)的投入和成熟與否直接決定了體驗(yàn)的高低,,而如今浪潮AI大模型“源”在智能客服場(chǎng)景的實(shí)際落地應(yīng)用,為業(yè)界提供了一種另一種可參考的解決方案,。 (本文首發(fā)鈦媒體APP 作者 | 楊麗) |
|