久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

AI PM視角:對(duì)話機(jī)器人的算法是如何開發(fā)的?

 天承辦公室 2021-08-30

編輯導(dǎo)語:對(duì)話機(jī)器人在我們的日常生活中已經(jīng)十分常見,,那么,,你了解對(duì)話機(jī)器人中的具體算法開發(fā)過程嗎?對(duì)話機(jī)器人所使用的算法可分為哪些類別?本篇文章里,,作者就對(duì)話機(jī)器人的算法開發(fā)流程進(jìn)行了整體總結(jié),,不妨來看一下。

AI PM視角:對(duì)話機(jī)器人的算法是如何開發(fā)的,?

AI對(duì)話機(jī)器人目前應(yīng)用已經(jīng)很廣泛了,。智能客服、語音助手,、外呼機(jī)器人……等等,,在日常生活中你可能已經(jīng)碰到了很多的對(duì)話機(jī)器人。那對(duì)話機(jī)器人中,,算法開發(fā)過程是怎么樣的呢,?今天筆者從一個(gè)AI產(chǎn)品經(jīng)理的視角,做一個(gè)簡單的介紹和闡述,。

如果你問一個(gè)AI算法工程師,,如何將算法模型搭建至滿足業(yè)務(wù)需求,上線,、給用戶使用,,算法工程師可能會(huì)跟你說一堆的AI技術(shù)細(xì)節(jié)。包括如何選型,、算法模型間的技術(shù)差異點(diǎn),,等等。往往讓非算法技術(shù)人員聽得云里霧里,,覺得很高大上但不明就里,。

本文我們不講AI技術(shù)細(xì)節(jié),我們從AI PM的視角,,來闡述對(duì)話機(jī)器人的開發(fā)過程中,,算法扮演了什么角色,承擔(dān)了什么任務(wù),,以及如何影響最終的產(chǎn)出結(jié)果的,。

對(duì)話機(jī)器人當(dāng)中使用的算法,可大致分為:意圖識(shí)別,、實(shí)體識(shí)別,、相似度計(jì)算3大類。主要應(yīng)用于機(jī)器人對(duì)于客戶應(yīng)答的識(shí)別能力,。在產(chǎn)品開發(fā)過程中,,算法的開發(fā)流程大致如下:

AI PM視角:對(duì)話機(jī)器人的算法是如何開發(fā)的?

下面我們詳細(xì)描述每個(gè)環(huán)節(jié)的開發(fā)過程與內(nèi)容,。

一,、需求定義

主要角色:產(chǎn)品經(jīng)理,、AI訓(xùn)練師

在做算法的開發(fā)之前,需要走做產(chǎn)品需求定義,。對(duì)話機(jī)器人中,,使用到算法的地方,主要在于語義識(shí)別的部分,。主要包括:意圖識(shí)別,、實(shí)體識(shí)別、相似度計(jì)算,,等等,。這里以意圖識(shí)別為例,做相應(yīng)的介紹與闡述,。

在應(yīng)用于業(yè)務(wù)場景的對(duì)話機(jī)器人當(dāng)中,,通常需要基于該場景,做多個(gè)意圖的識(shí)別,。通常來說,,意圖的數(shù)量少則幾個(gè),多則幾十個(gè)不等,。而具體需要做多少意圖的識(shí)別,,以及每個(gè)意圖的定義是什么,意圖與意圖之間的邊界是什么,,需要做開發(fā)前的需求定義,。

一般需求定義是由產(chǎn)品經(jīng)理或AI訓(xùn)練師來做的。意圖是根據(jù)業(yè)務(wù)場景進(jìn)行切分的,,而產(chǎn)品經(jīng)理作為對(duì)話機(jī)器人的設(shè)計(jì)者,,本身應(yīng)對(duì)業(yè)務(wù)場景有深刻的了解。同時(shí),,不同于傳統(tǒng)的互聯(lián)網(wǎng)產(chǎn)品經(jīng)理多是對(duì)于產(chǎn)品功能的設(shè)計(jì),,在對(duì)話機(jī)器人的【對(duì)話】層面的設(shè)計(jì),更是體現(xiàn)AI產(chǎn)品經(jīng)理價(jià)值與思路的方面,。

所以產(chǎn)品經(jīng)理需要基于業(yè)務(wù),,做每個(gè)意圖的定義,需做到明確,、清晰,、可驗(yàn)證。這對(duì)后續(xù)的算法開發(fā)至關(guān)重要,,是開發(fā)的方向,、驗(yàn)收的標(biāo)準(zhǔn)、產(chǎn)品的價(jià)值體現(xiàn),。

除了產(chǎn)品經(jīng)理,,也可由AI訓(xùn)練師做算法需求定義,。一般而言,AI訓(xùn)練師的職責(zé)是基于客戶的對(duì)話場景,,做對(duì)話流程設(shè)計(jì)、對(duì)話知識(shí)構(gòu)建與優(yōu)化的,,AI訓(xùn)練師應(yīng)是業(yè)務(wù)場景專家,,所以需要做算法需求的定義。

AI訓(xùn)練師與產(chǎn)品經(jīng)理的區(qū)別在于,,對(duì)話機(jī)器人的功能層面是有產(chǎn)品經(jīng)理負(fù)責(zé),,而AI訓(xùn)練師主要著重于基于對(duì)話場景的對(duì)話設(shè)計(jì)。產(chǎn)品經(jīng)理也需對(duì)AI訓(xùn)練師的工作內(nèi)容熟悉,,以相應(yīng)地設(shè)計(jì)可構(gòu)造優(yōu)秀對(duì)話設(shè)計(jì)的產(chǎn)品功能,。是對(duì)話機(jī)器人的整體owner。

二,、模型預(yù)研

主要角色:算法工程師

明確了產(chǎn)品需求,,在產(chǎn)品經(jīng)理/AI訓(xùn)練師做完算法需求的宣講之后,算法工程師就要根據(jù)需求,,進(jìn)行算法模型的預(yù)研,。具體來說,就是要判斷目前積累的數(shù)據(jù)和沉淀的算法,,是否可以達(dá)到業(yè)務(wù)的需求,。

預(yù)研的目的主要有2點(diǎn):

算法工程師通常會(huì)在前期做技術(shù)相關(guān)的調(diào)研,了解目前業(yè)內(nèi)主流算法,,包括已被驗(yàn)證的較為優(yōu)秀的模型,,以保證在技術(shù)層面至少在業(yè)內(nèi)是持平和領(lǐng)先的。

同時(shí),,不同業(yè)務(wù)要求的算法能力不同,。算法工程師需要根據(jù)業(yè)務(wù)特性,選型相應(yīng)的模型,,多備幾套方案,,以供模型訓(xùn)練時(shí)使用。

模型預(yù)研的結(jié)果,,通常需要做一個(gè)小型的匯報(bào),。目的是同步模型預(yù)期選型,讓產(chǎn)品經(jīng)理,、AI訓(xùn)練師了解不同的算法模型的優(yōu)劣勢,,以及后優(yōu)化維護(hù)的不同特點(diǎn)。同時(shí)也收集各方的意見,,做最終的模型選擇,。

模型預(yù)研的目的主要是降低風(fēng)險(xiǎn),,即降低模型選錯(cuò)的風(fēng)險(xiǎn)。因?yàn)槟P褪且粋€(gè)從搭建開始,,通過數(shù)據(jù)不斷地訓(xùn)練優(yōu)化的過程,。如果模型選型錯(cuò)誤,有可能出現(xiàn)后續(xù)不管數(shù)據(jù)如何訓(xùn)練,,都無法解決業(yè)務(wù)問題的情況,。所以模型預(yù)研對(duì)于后續(xù)的模型訓(xùn)練,有著重要的意義,。

三,、數(shù)據(jù)準(zhǔn)備與標(biāo)注

主要角色:數(shù)據(jù)標(biāo)注師、算法工程師

當(dāng)算法需求確定后,,就需要根據(jù)定義的需求,,進(jìn)行數(shù)據(jù)標(biāo)注。這里通常指的是有監(jiān)督學(xué)習(xí)的算法數(shù)據(jù)標(biāo)注,。數(shù)據(jù)標(biāo)注的過程主要包括:數(shù)據(jù)準(zhǔn)備,、數(shù)據(jù)清洗、標(biāo)注規(guī)范制定,、試標(biāo)數(shù)據(jù),、標(biāo)注答疑、正式標(biāo)注,。

1)數(shù)據(jù)準(zhǔn)備

在算法團(tuán)隊(duì)中,,有專門的數(shù)據(jù)分析員,做相應(yīng)的對(duì)話數(shù)據(jù)抽取,。抽取的數(shù)據(jù)是數(shù)據(jù)標(biāo)注的來源,。數(shù)據(jù)抽取需要根據(jù)以下原則:

  • 抽取的數(shù)據(jù)需包含在行業(yè)中具有代表性的數(shù)據(jù);如行業(yè)標(biāo)桿客戶等,。
  • 抽取的數(shù)據(jù)需盡可能覆蓋行業(yè)中多樣的數(shù)據(jù),;讓數(shù)據(jù)分布更加均勻,提供覆蓋面廣的數(shù)據(jù)分布,。

2)數(shù)據(jù)清洗

抽取了數(shù)據(jù)之后,,數(shù)據(jù)的結(jié)構(gòu)、質(zhì)量不一,,需要進(jìn)行數(shù)據(jù)清洗,。通常會(huì)篩除吊無效的、質(zhì)量不佳的數(shù)據(jù),。數(shù)據(jù)清洗可能運(yùn)用的技術(shù)手段有:關(guān)鍵詞,、實(shí)體識(shí)別、無監(jiān)督學(xué)習(xí)等等,。目的是可清洗出質(zhì)量較好的數(shù)據(jù)以供標(biāo)注,。

3)標(biāo)注規(guī)范制定

在需求定義時(shí),,通常會(huì)給每個(gè)意圖做定義,定義會(huì)明確意圖A是指什么,,意圖B時(shí)指什么,。哪些情況屬于意圖A,哪些情況屬于意圖B,。標(biāo)注團(tuán)隊(duì)首先需要明確每個(gè)意圖的定義,,作為標(biāo)注的指南。

產(chǎn)品經(jīng)理/AI訓(xùn)練師會(huì)給出一份數(shù)據(jù)標(biāo)注的規(guī)范,。這份規(guī)范需要標(biāo)注團(tuán)隊(duì)leader與他們做深入的溝通與理解,以求理解透徹需求,,并可實(shí)際落地至標(biāo)注工作中,,確保需求落地不偏差。

4)試標(biāo)數(shù)據(jù)

制定了標(biāo)注規(guī)范,,同時(shí)拿到了已清洗的抽取數(shù)據(jù)后,,就進(jìn)入了試標(biāo)數(shù)據(jù)環(huán)節(jié)。為什么不直接正式標(biāo)注呢,?因?yàn)橥ǔ?biāo)注都是大批量的,,若出現(xiàn)標(biāo)注規(guī)范理解不到位,或者標(biāo)注規(guī)范本身指定得有問題,,那返工將是很大的人力物力損失,。

為了降低這樣的風(fēng)險(xiǎn),通常會(huì)在前期先拿一小部分?jǐn)?shù)據(jù)進(jìn)行試標(biāo),。試標(biāo)的量根據(jù)情況而定,,通常控制在1-2天時(shí)間內(nèi),,并需收集標(biāo)注反饋,,注明問題與疑惑。

試標(biāo)結(jié)束后,,需要召集標(biāo)注同學(xué),、產(chǎn)品經(jīng)理、AI訓(xùn)練師,、算法工程師,,召開問題同步討論會(huì)。會(huì)議的目的是確定試標(biāo)的問題的解決方案,,各方達(dá)成共識(shí),。方可進(jìn)入下一步驟。

5)正式標(biāo)注

按照確定的且達(dá)成共識(shí)的標(biāo)注規(guī)范,,標(biāo)注團(tuán)隊(duì)就進(jìn)入了正式標(biāo)注階段,。通常標(biāo)注的數(shù)量較多,,需要在標(biāo)注團(tuán)隊(duì)中分配任務(wù)。

標(biāo)注完成后,,需要有標(biāo)注審核員進(jìn)行審核,。通常為抽樣審核。若不通過需打回重標(biāo),。

標(biāo)注結(jié)束后,,須由標(biāo)注團(tuán)隊(duì)Leader匯總標(biāo)注結(jié)果,提交給算法工程師,。

四,、模型構(gòu)建

主要角色:算法工程師

在接收到標(biāo)注團(tuán)隊(duì)的標(biāo)注數(shù)據(jù)后,算法工程師就需要拿這些數(shù)據(jù),,讓模型運(yùn)轉(zhuǎn)起來,。模型構(gòu)建包括3個(gè)環(huán)節(jié):模型設(shè)計(jì)、特征工程,、模型訓(xùn)練,。

1)模型設(shè)計(jì)

算法工程師會(huì)根據(jù)業(yè)務(wù)的需要,以及算法積累,,進(jìn)行模型設(shè)計(jì),。在這個(gè)環(huán)節(jié)中,產(chǎn)品經(jīng)理應(yīng)與算法工程師確定,,在當(dāng)前業(yè)務(wù)下,,這個(gè)模型該不該做,我們有沒有能力做這個(gè)模型,。在這個(gè)階段中,,最重要的是定義模型目標(biāo)變量。不同的目標(biāo)變量,,決定了這個(gè)模型應(yīng)用的場景,,以及能達(dá)到的業(yè)務(wù)預(yù)期。

2)特征工程

選型之后,,算法工程師會(huì)進(jìn)行特征工程的工作,。整個(gè)模型構(gòu)建可以理解為:從樣本數(shù)據(jù)中提取可以很好描述數(shù)據(jù)的特征,再利用它們建立出對(duì)未知數(shù)據(jù)有優(yōu)先預(yù)測能力的模型,。

所以在模型構(gòu)建中,,特征工程師非常重要的部分。數(shù)據(jù)和特征決定了機(jī)器學(xué)習(xí)的上限,,而模型和算法只是逼近這個(gè)上限而已,。

而現(xiàn)有的技術(shù)能力,如神經(jīng)網(wǎng)絡(luò)等算法能力,可通過模型的自主提取特征能力,,而取代人工提取特征的過程,。方式的不同,在效果上也可能比算法工程師人工提取特征,,可能有提高,。需具體業(yè)務(wù)情況具體看。

3)模型訓(xùn)練

算法工程師會(huì)根據(jù)數(shù)據(jù)在不同模型的訓(xùn)練結(jié)果,,做調(diào)參工作,,以確保模型最終的效果是可滿足業(yè)務(wù)的要求,并可持續(xù)優(yōu)化的,。

算法工程師在訓(xùn)練模型時(shí)使用的數(shù)據(jù)為【訓(xùn)練集】,,該數(shù)據(jù)集合需不能與最后模型測試使用的【測試集】重合/有交集,以確保后續(xù)測試是客觀,、不失真的,。

五、模型測試

主要角色:測試工程師

模型構(gòu)建完成后,,就需要算法測試工程師介入測試模型的效果。對(duì)于算法的測試,,衡量的基礎(chǔ)指標(biāo)主要是:P值(精準(zhǔn)率),、R值(召回率)F1值,分別衡量模型預(yù)測的準(zhǔn)確性,、覆蓋面和二者的綜合能力,。

當(dāng)然,還可以根據(jù)業(yè)務(wù)的不同,,有其他的測試驗(yàn)收指標(biāo),,這邊不贅述。

測試的過程,,一般會(huì)使用腳本自動(dòng)化測試,,以覆蓋數(shù)據(jù)量龐大的測試內(nèi)容,保證最短時(shí)間內(nèi)測可能多的內(nèi)容,。

測試完成后,,測試工程師需出具測試報(bào)告。報(bào)告的接收方為:算法工程師,、產(chǎn)品經(jīng)理,、AI訓(xùn)練師。需確認(rèn)報(bào)告內(nèi)容,。同時(shí),,產(chǎn)品經(jīng)理/AI訓(xùn)練師需評(píng)估,模型的效果是否符合預(yù)期。若否,,則需算法模型重新訓(xùn)練調(diào)優(yōu),,直至達(dá)到上線標(biāo)準(zhǔn)為止。

六,、模型驗(yàn)證

主要角色:產(chǎn)品經(jīng)理,、AI訓(xùn)練師

模型驗(yàn)證指的是模型上線后的數(shù)據(jù)觀察,以驗(yàn)證模型效果,,通常由產(chǎn)品經(jīng)理/AI訓(xùn)練師,,做上線后的跟蹤與觀察。在上線之后,,一般會(huì)做算法相關(guān)的數(shù)據(jù)統(tǒng)計(jì),,每天實(shí)時(shí)監(jiān)測數(shù)據(jù)的情況。

若有數(shù)據(jù)異?;虿环项A(yù)期,,通常需要做以下處理。

1)告知算法團(tuán)隊(duì),,做數(shù)據(jù)反饋收集與模型優(yōu)化

算法的優(yōu)化過程是較為緩慢的,,涉及的流程包括數(shù)據(jù)重新標(biāo)注、模型重新訓(xùn)練,、重新測試/調(diào)優(yōu)等等,。通常周期以“周”為單位。

2)通過規(guī)則矯正

業(yè)務(wù)的問題總是需要及時(shí)地處理與反饋的,,所以需要一些輔助措施,,來響應(yīng)響應(yīng)的需求。一旦發(fā)現(xiàn)算法模型效果不佳,,需要產(chǎn)品經(jīng)理/AI訓(xùn)練師通過規(guī)則矯正的方式,,優(yōu)先做處理。當(dāng)后續(xù)算法優(yōu)化更新之后,,再做原有規(guī)則的恢復(fù),。

七、結(jié)語

對(duì)話機(jī)器人算法的開發(fā)過程,,是一個(gè)閉環(huán)的過程,。通過數(shù)據(jù)的訓(xùn)練、測試,、調(diào)優(yōu),,達(dá)成相應(yīng)的業(yè)務(wù)目標(biāo)。隨著數(shù)據(jù)的不斷反饋,,算法模型的效果則會(huì)越來越符合業(yè)務(wù)的需求,,是一個(gè)循序漸進(jìn)的過程,。本篇文章大致介紹了算法開發(fā)的整個(gè)流程與脈絡(luò),希望可以幫到你,。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn),。請注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請遵守用戶 評(píng)論公約

    類似文章 更多