為了讓大語言模型的AI能力更貼近業(yè)務(wù)需求,,本文詳細(xì)介紹了在阿里云百煉創(chuàng)建自定義模型的最佳實(shí)踐。即便不清楚大模型的技術(shù)細(xì)節(jié),,您也能按照本篇的操作指引創(chuàng)建一個(gè)有效的自定義模型,,從而輕松地為業(yè)務(wù)場景添加大模型服務(wù)能力,。 自定義模型概述自定義大模型是指基于通用大語言模型,通過微調(diào)和訓(xùn)練,,能更好地適應(yīng)特定領(lǐng)域或任務(wù)的大語言模型,。 為什么選擇自定義模型?提高特定領(lǐng)域的準(zhǔn)確性:通用的大語言模型盡管強(qiáng)大,,但在處理特定領(lǐng)域的任務(wù)時(shí),,可能會(huì)因?yàn)槿狈︻I(lǐng)域特定知識(shí)而表現(xiàn)不佳。自定義大語言模型通過領(lǐng)域特定的數(shù)據(jù)進(jìn)行重新訓(xùn)練,,可以顯著提高在該領(lǐng)域的表現(xiàn)和準(zhǔn)確性,。 增強(qiáng)模型的適用性:自定義大語言模型可以根據(jù)特定應(yīng)用場景的需求進(jìn)行微調(diào),使其更好地適應(yīng)特定任務(wù),。例如,,在客戶服務(wù)中,自定義模型可以更好地理解和回應(yīng)客戶的特定問題,,提高客戶滿意度,。 節(jié)約開發(fā)時(shí)間和成本:利用現(xiàn)有的大語言模型進(jìn)行定制化訓(xùn)練,比從頭開發(fā)一個(gè)模型要節(jié)約大量時(shí)間和成本,。您可以快速部署自定義模型,,滿足業(yè)務(wù)需求。 增強(qiáng)品牌和用戶體驗(yàn):自定義大語言模型可以根據(jù)企業(yè)的品牌語言風(fēng)格進(jìn)行調(diào)整,,確保輸出內(nèi)容的一致性和品牌調(diào)性,,從而提升用戶體驗(yàn)和品牌形象。
創(chuàng)建自定義模型的流程創(chuàng)建自定義模型涉及三個(gè)主要步驟:模型調(diào)優(yōu),、模型部署,、模型評測,以及三個(gè)輔助步驟:訓(xùn)練數(shù)據(jù)準(zhǔn)備,、評測模板設(shè)計(jì),、調(diào)整訓(xùn)練策略。 模型調(diào)優(yōu)階段:模型會(huì)“學(xué)習(xí)”大量訓(xùn)練數(shù)據(jù)的語言特征,,從而理解并生成相似的自然語言,。開始模型調(diào)優(yōu)之前,您需要做一些訓(xùn)練數(shù)據(jù)準(zhǔn)備工作,,包括數(shù)據(jù)收集,、數(shù)據(jù)清洗、數(shù)據(jù)集劃分等操作,。您需按照訓(xùn)練新模型向?qū)У闹敢渲?span style="outline: none;box-sizing: border-box;margin: 0px;padding: 0px;font-weight: 700;">模型調(diào)優(yōu),。根據(jù)配置的訓(xùn)練超參數(shù)(超參數(shù)是指在模型調(diào)優(yōu)前需要提前設(shè)定的參數(shù),包括學(xué)習(xí)率,、迭代次數(shù)等),,阿里云百煉將自動(dòng)訓(xùn)練您選擇的預(yù)置模型,。一般情況下,訓(xùn)練過程是自動(dòng)完成的,,無需進(jìn)一步操作,。 模型部署階段:您需要將自定義模型部署到獨(dú)占實(shí)例上,然后調(diào)用或評測自定義模型,。部署新模型向?qū)椭渲?span style="outline: none;box-sizing: border-box;margin: 0px;padding: 0px;font-weight: 700;">模型部署,。根據(jù)配置的自定義模型規(guī)格和資源配置方式,阿里云百煉將計(jì)算預(yù)估價(jià)格,。待您確認(rèn)價(jià)格后,,阿里云百煉會(huì)自動(dòng)部署模型,一般無需干預(yù),。完成部署后,,您便可以在代碼或評測中配置自定義模型。 模型評測階段:您可以評測已部署的自定義模型,。您可以按照創(chuàng)建評測任務(wù)向?qū)У闹敢渲?span style="outline: none;box-sizing: border-box;margin: 0px;padding: 0px;font-weight: 700;">模型評測,。自定義模型不涉及評測模板設(shè)計(jì)環(huán)節(jié)。根據(jù)您選擇的評測方式,、數(shù)據(jù)和維度,,阿里云百煉將自動(dòng)完成評測,一般無需干預(yù),。
說明 如果對模型的評測結(jié)果不滿意,,您還可以調(diào)整訓(xùn)練策略(選擇不同的預(yù)置模型作為基礎(chǔ)模型、擴(kuò)充訓(xùn)練數(shù)據(jù)樣本,、選擇不同的超參數(shù)配置等),,再次完成訓(xùn)練、部署和評測,。您可以重復(fù)整個(gè)流程,,直到模型的評測結(jié)果滿足預(yù)期,。 說明 在阿里云百煉,,完成調(diào)優(yōu)的模型必須部署后才能調(diào)用和評測。因此,,您需要首先完成模型部署,,方可繼續(xù)評測模型。 前提條件前置知識(shí)您可能需要了解機(jī)器學(xué)習(xí),、深度學(xué)習(xí)和自然語言處理的基礎(chǔ)概念,。如果不了解這些概念,您也可以遵循本實(shí)踐文檔的指引完成整個(gè)創(chuàng)建流程,。 工具和資源您需要開通阿里云百煉大模型服務(wù)平臺(tái),,并確認(rèn)賬號(hào)余額充足,,以免無法創(chuàng)建自定義模型。 計(jì)費(fèi)信息創(chuàng)建自定義模型時(shí),,可能涉及多種計(jì)費(fèi)項(xiàng),,包括但不限于模型調(diào)優(yōu)、模型部署和模型評測,。計(jì)費(fèi)規(guī)則請參考產(chǎn)品計(jì)費(fèi),。 訓(xùn)練數(shù)據(jù)準(zhǔn)備在開始訓(xùn)練前,您需要完成訓(xùn)練數(shù)據(jù)的準(zhǔn)備工作,。這些準(zhǔn)備工作包括:從業(yè)務(wù)場景中收集具有代表性的業(yè)務(wù)數(shù)據(jù),,并轉(zhuǎn)換為問答對的形式(數(shù)據(jù)收集);上傳訓(xùn)練數(shù)據(jù),、評測數(shù)據(jù),、驗(yàn)證數(shù)據(jù)(數(shù)據(jù)上傳);使用阿里云大模型服務(wù)平臺(tái)百煉提供的數(shù)據(jù)清洗工具和數(shù)據(jù)增強(qiáng)工具,,提升訓(xùn)練數(shù)據(jù)的質(zhì)量,。 1. 數(shù)據(jù)收集您可以從各種信息來源中發(fā)掘有業(yè)務(wù)價(jià)值的數(shù)據(jù),并將這些數(shù)據(jù)編排成特定結(jié)構(gòu),。您在完成數(shù)據(jù)收集時(shí),,需仔細(xì)考慮以下策略: 來源多樣化:從書籍摘錄、學(xué)術(shù)論文,、新聞報(bào)道和專業(yè)網(wǎng)站等多種來源收集數(shù)據(jù),,來確保模型的適用范圍更廣,可以處理不同類型的問題或理解多種表達(dá)方式,。 質(zhì)量控制:數(shù)據(jù)質(zhì)量決定了模型質(zhì)量,。質(zhì)量高、數(shù)量足的數(shù)據(jù)可以讓模型學(xué)得更好,,表現(xiàn)更優(yōu),。 平衡性考量:確保問題類型、難度和答案的分布均勻,,避免模型偏向某一特定類型的數(shù)據(jù),,導(dǎo)致訓(xùn)練偏差。
在阿里云百煉,,您需要將收集到的數(shù)據(jù)編排成“Prompt-Completion”格式,,便于平臺(tái)解析和訓(xùn)練。為了盡可能提高訓(xùn)練效率,,我們建議至少準(zhǔn)備500條訓(xùn)練數(shù)據(jù),,要求如下: 文本分割:合理分割長文本,確保每個(gè)Prompt-Completion對聚焦于單一明確的主題,便于模型學(xué)習(xí),。 脫敏處理:移除個(gè)人身份信息,、敏感詞匯或不適宜內(nèi)容,保證數(shù)據(jù)合規(guī)與安全,。 說明 小貼士:構(gòu)建聊天機(jī)器人的數(shù)據(jù)收集 假設(shè)您想創(chuàng)建一個(gè)智能聊天機(jī)器人,,能夠回答客戶提出的問題。 在數(shù)據(jù)收集階段,,您的目標(biāo)是:為聊天機(jī)器人收集學(xué)習(xí)材料,。 數(shù)據(jù)來源: 用戶聊天記錄:比如網(wǎng)站上的在線客服聊天記錄。 FAQ文檔:公司網(wǎng)站上的常見問題解答列表,。 客戶服務(wù)郵件:客戶發(fā)送給客服團(tuán)隊(duì)的問題和相應(yīng)的回復(fù),。 數(shù)據(jù)示例: 用戶聊天記錄:導(dǎo)出在線客服系統(tǒng)中的聊天記錄,可以包括客戶問題和客服回復(fù),。例如: 客戶:你們的退貨政策是什么,?
客服:我們的退貨政策是在購買30天內(nèi)可以無條件退貨。 FAQ文檔:收集網(wǎng)站上列出的常見問題及其答案,。例如: 問:如何更改我的密碼,?
答:請點(diǎn)擊“設(shè)置”,然后選擇“更改密碼”,。 客戶服務(wù)郵件:導(dǎo)出郵件系統(tǒng)中跟客戶的來往郵件,。例如: 客戶郵件:我的訂單沒有收到,怎么辦,?
客服回復(fù):我們很抱歉,,請?zhí)峁┠挠唵翁?hào),我們會(huì)盡快處理,。
數(shù)據(jù)編排: Prompt | Completion | 你們的退貨政策是什么,? | 我們的退貨政策是購買30天內(nèi)可以無條件退貨。 | 如何更改我的密碼,? | 請點(diǎn)擊“設(shè)置”,,然后選擇“更改密碼”。 | 我的訂單沒有收到,,怎么辦,? | 我們很抱歉,請?zhí)峁┠挠唵翁?hào),,我們會(huì)盡快處理,。 |
2. 數(shù)據(jù)上傳您需要將準(zhǔn)備好的數(shù)據(jù)上傳至阿里云百煉,以備進(jìn)一步清洗和增強(qiáng),,或直接參與模型調(diào)優(yōu)。平臺(tái)自動(dòng)進(jìn)行格式檢查和基礎(chǔ)數(shù)據(jù)質(zhì)量審核,確保數(shù)據(jù)符合訓(xùn)練要求,。 阿里云百煉支持創(chuàng)建不同數(shù)據(jù)類型的數(shù)據(jù)集,,包括訓(xùn)練集、評測集,,支持多版本數(shù)據(jù)管理,,發(fā)布后可前往模型調(diào)優(yōu)/評測功能使用。您可以利用平臺(tái)提供的工具對數(shù)據(jù)集進(jìn)行標(biāo)簽標(biāo)注,、篩選和版本管理,,有利于迭代訓(xùn)練和性能追蹤。 說明 小貼士:迭代優(yōu)化 數(shù)據(jù)準(zhǔn)備是一個(gè)迭代過程,,初期數(shù)據(jù)集不必完美,,但在模型調(diào)優(yōu)過程中,根據(jù)訓(xùn)練反饋不斷調(diào)整和豐富數(shù)據(jù),,可以逐步提升模型表現(xiàn),。 3. 數(shù)據(jù)清洗與數(shù)據(jù)增強(qiáng)(可選)數(shù)據(jù)清洗是指檢查并處理收集到的數(shù)據(jù),以保證數(shù)據(jù)的質(zhì)量,、完整性和一致性,。這一步驟可以顯著提高模型的訓(xùn)練效果和預(yù)測能力。數(shù)據(jù)增強(qiáng)是指增加多樣性并擴(kuò)展訓(xùn)練數(shù)據(jù)的規(guī)模,。 阿里云百煉提供了模型數(shù)據(jù)的版本管理能力,,您的數(shù)據(jù)將在清洗或增強(qiáng)后自動(dòng)生成一個(gè)新版本。新版本數(shù)據(jù)獨(dú)立保存,,不會(huì)覆蓋源數(shù)據(jù),。 重要 如果您的數(shù)據(jù)類型不適合數(shù)據(jù)清洗與增強(qiáng)(如法律文件、醫(yī)學(xué)記錄,、文學(xué)作品,、方言匯總、用戶評論,、技術(shù)手冊等),,建議跳過該步驟。 建議您優(yōu)先清洗數(shù)據(jù),,再增強(qiáng)清洗后的數(shù)據(jù),。這樣可以確保增強(qiáng)操作是在一個(gè)干凈、高質(zhì)量的數(shù)據(jù)集上進(jìn)行的,。這樣可以避免在低質(zhì)量數(shù)據(jù)上進(jìn)行增強(qiáng),,從而保證模型調(diào)優(yōu)的數(shù)據(jù)源是準(zhǔn)確的。 說明 小貼士:精準(zhǔn)與多樣化 在數(shù)據(jù)處理中,,數(shù)據(jù)清洗和數(shù)據(jù)增強(qiáng)是提升數(shù)據(jù)質(zhì)量和多樣性的關(guān)鍵步驟,。為了確保這兩個(gè)步驟的有效性和合理性,請您參考以下建議: 逐步清洗: 分階段進(jìn)行數(shù)據(jù)清洗,每次只執(zhí)行特定的一類清洗操作(如移除重復(fù)項(xiàng),、處理缺失值等),。這樣可以更容易地檢測和糾正錯(cuò)誤,提高數(shù)據(jù)的整潔度和一致性,。 驗(yàn)證清洗效果: 每個(gè)清洗步驟之后,,檢查數(shù)據(jù)的樣本,以確保數(shù)據(jù)的完整性和真實(shí)性沒有被破壞,。 任務(wù)相關(guān)性: 在數(shù)據(jù)增強(qiáng)時(shí),,確保生成的增強(qiáng)數(shù)據(jù)與目標(biāo)任務(wù)高度相關(guān),避免引入不相關(guān)的變體,,保持?jǐn)?shù)據(jù)上下文和語義的一致性,。 多樣化策略: 使用多種數(shù)據(jù)增強(qiáng)策略(如同義詞替換、隨機(jī)抽樣,、翻譯變換等),,以最大限度地增加數(shù)據(jù)的多樣性。這有助于提升模型的泛化能力,。 平衡增強(qiáng): 生成的增強(qiáng)數(shù)據(jù)應(yīng)在類別,、難度和結(jié)構(gòu)上相對平衡,避免讓模型接觸過多的特定類型數(shù)據(jù),,導(dǎo)致過擬合,。確保在數(shù)據(jù)增強(qiáng)過程中,不偏離數(shù)據(jù)的真實(shí)分布,。
模型調(diào)優(yōu)完成訓(xùn)練數(shù)據(jù)的準(zhǔn)備后,,您便可以開始模型調(diào)優(yōu)。模型調(diào)優(yōu),,即使用訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集訓(xùn)練模型,。 阿里云百煉提供Fine-tuning的訓(xùn)練方式,還提供多種參數(shù)的調(diào)整,,可以根據(jù)業(yè)務(wù)需求調(diào)整參數(shù),,優(yōu)化模型調(diào)優(yōu)效果。以下是新建模型訓(xùn)練任務(wù)和關(guān)聯(lián)模型訓(xùn)練任務(wù)的操作方法: 新建訓(xùn)練任務(wù)您可通過模型調(diào)優(yōu)頁面的訓(xùn)練新模型操作向?qū)?,完成?xùn)練的參數(shù)設(shè)置,,具體操作如下: 登錄阿里云百煉控制臺(tái),在左側(cè)導(dǎo)航欄中,,選擇模型工具 > 模型調(diào)優(yōu),。這里展示了所有調(diào)優(yōu)任務(wù)。 點(diǎn)擊訓(xùn)練新模型,,阿里云百煉將會(huì)引導(dǎo)您配置訓(xùn)練參數(shù): 最大靈活性:全參數(shù)訓(xùn)練可使模型適應(yīng)新的數(shù)據(jù)和任務(wù),,具有最大的調(diào)整靈活性,。 高性能:在理論上,全參數(shù)訓(xùn)練可以獲得最高的性能,,因?yàn)樗袇?shù)都經(jīng)過調(diào)整以優(yōu)化特定任務(wù),。
時(shí)間成本高:訓(xùn)練時(shí)間長,,特別是在大型數(shù)據(jù)集上的訓(xùn)練,。 過擬合風(fēng)險(xiǎn):如果數(shù)據(jù)量不足或不平衡,全參數(shù)訓(xùn)練可能導(dǎo)致模型過擬合于特定訓(xùn)練數(shù)據(jù),。
快速訓(xùn)練:比全參數(shù)訓(xùn)練更快,,適合快速迭代和原型開發(fā)。 減小過擬合風(fēng)險(xiǎn):微調(diào)部分參數(shù)可以降低過擬合風(fēng)險(xiǎn),。
性能可能受限:在某些任務(wù)上,,性能可能略低于全參數(shù)訓(xùn)練。 適用范圍有限:當(dāng)任務(wù)的性質(zhì)高度變化或與預(yù)訓(xùn)練任務(wù)顯著不同,,高效訓(xùn)練可能無法有效遷移已有的知識(shí),。
訓(xùn)練方式:阿里云百煉支持全參訓(xùn)練和高效訓(xùn)練兩種方式,以下是選擇建議: 訓(xùn)練方式 | 優(yōu)點(diǎn) | 缺點(diǎn) | 全參訓(xùn)練 |
|
| 高效訓(xùn)練 |
|
|
高效訓(xùn)練能較好地平衡訓(xùn)練時(shí)長和訓(xùn)練效果,,一般建議您選擇高效訓(xùn)練,。 選擇模型:阿里云百煉支持基于預(yù)置模型或自定義模型的調(diào)優(yōu)。 如果您是第一次訓(xùn)練模型,,建議選擇預(yù)置模型,;如果您調(diào)整了訓(xùn)練策略,希望基于已訓(xùn)練的模型進(jìn)行再次訓(xùn)練,,則可選擇自定義模型,。 阿里云百煉提供了多種可調(diào)優(yōu)的預(yù)置模型,各模型特性請參閱模型調(diào)用,。 選擇訓(xùn)練數(shù)據(jù):選擇參與訓(xùn)練的數(shù)據(jù)集,,您在已上傳的數(shù)據(jù)集列表中選擇訓(xùn)練集。 說明 如果清洗或增強(qiáng)了數(shù)據(jù),,您需要注意數(shù)據(jù)集的名稱和版本,,以免誤選未經(jīng)處理的數(shù)據(jù)。 選擇驗(yàn)證數(shù)據(jù):選擇參與驗(yàn)證訓(xùn)練效果的數(shù)據(jù)集,,您可以選擇自動(dòng)切分或從數(shù)據(jù)列表中選擇驗(yàn)證集,。 如果您沒有準(zhǔn)備驗(yàn)證數(shù)據(jù)集,建議選擇自動(dòng)切分,,阿里云百煉將從選定的訓(xùn)練集中劃分一部分?jǐn)?shù)據(jù)作為驗(yàn)證集,。反之,建議從數(shù)據(jù)列表中選擇驗(yàn)證集,。 說明 如果您清洗或增強(qiáng)了數(shù)據(jù),,您需要注意數(shù)據(jù)集的名稱和版本,,以免誤選未經(jīng)處理的數(shù)據(jù)。 混合訓(xùn)練:為了避免基礎(chǔ)模型能力的遺失并提高訓(xùn)練效果,,阿里云百煉支持您將自備的訓(xùn)練數(shù)據(jù)與預(yù)置通用數(shù)據(jù)混合訓(xùn)練,。您可以調(diào)整自備訓(xùn)練數(shù)據(jù)與預(yù)置通用數(shù)據(jù)的比例,如果所有類型的預(yù)置通用數(shù)據(jù)的比例設(shè)置為0,,您將不使用預(yù)置數(shù)據(jù),。 超參配置:模型的超參配置決定一定程度的模型調(diào)優(yōu)效果,您可按照自己的訓(xùn)練經(jīng)驗(yàn)進(jìn)行配置,。如果您不了解超參數(shù),,阿里云百煉也提供一套基于實(shí)驗(yàn)所得的默認(rèn)配置,您可以遵循默認(rèn)配置,。 開始訓(xùn)練:這一步將展示您的所有訓(xùn)練配置,,阿里云百煉會(huì)自動(dòng)計(jì)算預(yù)估的訓(xùn)練費(fèi)用(稍后您也可以在訓(xùn)練任務(wù)列表中瀏覽預(yù)估費(fèi)用明細(xì),實(shí)際產(chǎn)生費(fèi)用以生成賬單為準(zhǔn)),。待您確認(rèn)配置和價(jià)格信息無誤后即可開始訓(xùn)練,。
開始訓(xùn)練后,您可以在模型調(diào)優(yōu)列表中查看模型的訓(xùn)練進(jìn)度,、預(yù)估費(fèi)用和其他管理操作,。有關(guān)訓(xùn)練費(fèi)用的詳細(xì)信息,請參考產(chǎn)品計(jì)費(fèi),。
說明 小貼士:模型訓(xùn)練入門指南 如果您是大語言模型訓(xùn)練的新手,,以下是一些簡單且實(shí)用的小貼士,幫您輕松入門并提高訓(xùn)練效果: 管理訓(xùn)練任務(wù)待您啟動(dòng)訓(xùn)練后,,您新建的模型訓(xùn)練任務(wù)將出現(xiàn)在模型調(diào)優(yōu)的列表里,其訓(xùn)練狀態(tài)將變更為訓(xùn)練中,。此時(shí),,您可點(diǎn)擊訓(xùn)練任務(wù)的查看操作進(jìn)入訓(xùn)練詳情頁,瀏覽訓(xùn)練任務(wù)的配置和訓(xùn)練的過程指標(biāo),。您可以點(diǎn)擊查看預(yù)估來瀏覽本次訓(xùn)練任務(wù)預(yù)估的計(jì)費(fèi)信息,。您也可以隨時(shí)點(diǎn)擊終止訓(xùn)練來結(jié)束訓(xùn)練任務(wù)。 訓(xùn)練過程指標(biāo)主要有以下三個(gè),,大致體現(xiàn)了模型的訓(xùn)練效果,。如果您不了解這些指標(biāo)的含義,也可以等待訓(xùn)練結(jié)束后,,使用阿里云百煉的模型評測工具評價(jià)訓(xùn)練效果,。 指標(biāo) | 解釋 | Training Loss | Training Loss 代表針對訓(xùn)練數(shù)據(jù)學(xué)習(xí)的擬合程度,曲線一般呈現(xiàn)下降趨勢,。Loss越小,,表示訓(xùn)練數(shù)據(jù)擬合程度越高。過小的Loss易導(dǎo)致數(shù)據(jù)過擬合,,需要根據(jù)實(shí)際訓(xùn)練過程進(jìn)行判斷,。 | Validation Loss | Validation Loss代表針對驗(yàn)證集學(xué)習(xí)的擬合程度,曲線一般呈現(xiàn)先下降后上升趨勢,。Loss越小,,表示驗(yàn)證數(shù)據(jù)擬合程度越高。優(yōu)秀的模型效果往往出現(xiàn)Validation Loss的最小值節(jié)點(diǎn),,此時(shí)擬合程度最佳,,訓(xùn)練效果最好。 | Validation Token Accuracy | Validation Token Acc代表針對驗(yàn)證集學(xué)習(xí)的準(zhǔn)確程度,,曲線一般呈現(xiàn)上升趨勢,。訓(xùn)練過擬合后,,該曲線會(huì)呈現(xiàn)下降趨勢。優(yōu)秀的模型效果往往出現(xiàn)在Validation Token Acc的最大值節(jié)點(diǎn),,此時(shí)預(yù)測準(zhǔn)確率最高,,訓(xùn)練效果最好。 |
一般情況下,,千條以下的數(shù)據(jù)訓(xùn)練所需的時(shí)長為2-3個(gè)小時(shí),。由于平臺(tái)承載能力有限,可能出現(xiàn)排隊(duì)狀態(tài),,還請您諒解,。訓(xùn)練任務(wù)完成后,列表及詳情頁中模型的狀態(tài)將變更為訓(xùn)練成功,,此時(shí)您已經(jīng)獲得自定義模型,,該模型已處于等待部署狀態(tài),您可以直接點(diǎn)擊模型部署跳轉(zhuǎn)到部署頁面,。 模型部署待您獲得自定義模型后,,您需要將該模型部署到計(jì)算資源上,方可調(diào)用該模型,。 阿里云百煉提供了多種資源配置方式,,您可以按需選擇。如果需要評測模型的訓(xùn)練效果,,您需要先部署自定義模型,,再使用模型評測評估自定義模型的訓(xùn)練效果。 新建部署任務(wù)登錄阿里云百煉控制臺(tái),,在左側(cè)導(dǎo)航欄中,,選擇模型工具 > 模型部署。您也可以在模型工具 > 模型訓(xùn)練中等待模型訓(xùn)練結(jié)束后,,直接點(diǎn)擊模型部署,。這里展示了所有模型部署任務(wù)。 點(diǎn)擊部署新模型,,您將跟隨向?qū)У闹敢瓿刹渴鹋渲茫?/p> 選擇模型:阿里云百煉提供了兩類可部署的模型,,此處請您選擇之前訓(xùn)練的自定義模型。 選擇資源配置:阿里云百煉提供了兩類資源配置方式,。包月資源是按月購買計(jì)算資源的方式,,不同版本的包月資源在部署模型的能力上有差別。按量付費(fèi)是按實(shí)際使用時(shí)長購買計(jì)算資源的方式,,您可以按需購買一定數(shù)量的計(jì)算資源,,也可以隨后變更計(jì)算資源的數(shù)量。為完成后續(xù)的模型評測,對訓(xùn)練效果做進(jìn)一步評估,,此處推薦您選擇按量付費(fèi),。 開始部署:這一步將展示您的所有部署配置和預(yù)估費(fèi)用,待您確認(rèn)所有信息后即可開始部署,。
開始部署后,,您可以在模型部署列表中查看模型的部署進(jìn)度、預(yù)估費(fèi)用和其他管理操作,。有關(guān)部署費(fèi)用的詳細(xì)信息,,請參考產(chǎn)品計(jì)費(fèi)。
一般情況下,,模型部署時(shí)長在幾十分鐘到幾個(gè)小時(shí)不等,,由于阿里云百煉資源限制,部署可能會(huì)產(chǎn)生隊(duì)列,,部署完成后,,狀態(tài)將變?yōu)檫\(yùn)行中,運(yùn)行中的模型可被調(diào)用,,用于模型評測及應(yīng)用調(diào)用,。 說明 小貼士:實(shí)例管理與性能優(yōu)化 什么是實(shí)例: 簡單定義:實(shí)例是運(yùn)行模型和處理請求的獨(dú)立計(jì)算單元,通常對應(yīng)一臺(tái)服務(wù)器,、一塊GPU,或在容器化環(huán)境中對應(yīng)一個(gè)容器,。 實(shí)例用途:實(shí)例用于將模型加載到內(nèi)存中,,接受用戶請求,執(zhí)行推理任務(wù)(如文本生成,、分類等),,并返回結(jié)果。
實(shí)例數(shù)量對性能的影響: 響應(yīng)時(shí)間:增加實(shí)例數(shù)量能有效分擔(dān)負(fù)載,,降低每個(gè)實(shí)例處理請求的時(shí)間,,提高整體響應(yīng)速度。 并發(fā)處理:更多實(shí)例可以并行處理更多請求,,提高系統(tǒng)的并發(fā)處理能力,。 成本效益:增加實(shí)例數(shù)量能提高性能和用戶體驗(yàn),但成本可能增加,,需要權(quán)衡,。
管理部署任務(wù)待您啟動(dòng)部署后,您新建的模型部署任務(wù)將出現(xiàn)在模型部署的列表里,,其部署狀態(tài)將變更為部署中,。此時(shí),您可點(diǎn)擊部署任務(wù)的查看操作瀏覽部署任務(wù)的配置,。您可以點(diǎn)擊擴(kuò)縮容來變更計(jì)算資源的用量,。您也可以隨時(shí)點(diǎn)擊下線來結(jié)束部署任務(wù),。 待部署完成后,其部署狀態(tài)將變更為運(yùn)行中,。此時(shí)您訓(xùn)練的自定義模型已經(jīng)具備了推理調(diào)用的能力,。您可以點(diǎn)擊去體驗(yàn),在模型體驗(yàn)頁面測試您的自定義模型推理效果,。此時(shí),,您可以使用模型評測對自定義模型的效果做評估。 模型評測完成模型部署后,,如需測試模型的效果,,可在模型評測中進(jìn)行評測。對于本篇介紹的自定義模型,,阿里云百煉提供了基線評測方法,。基線評測預(yù)置多種常用的能力評測集及評測腳本,可自動(dòng)評測模型多種基本能力,。 新建評測任務(wù)登錄阿里云百煉控制臺(tái),,在左側(cè)導(dǎo)航欄中,選擇模型工具 > 模型評測,。這里展示了所有模型評測任務(wù),。 點(diǎn)擊創(chuàng)建評測任務(wù),您將遵循向?qū)瓿稍u測任務(wù)的配置: 評測方式:阿里云百煉提供了多種評測方式,。對于自定義模型,,請您選擇基線評測。 選擇模型:請?jiān)谙吕蛑羞x擇已部署的目標(biāo)評測模型,。 選擇評測數(shù)據(jù):阿里云百煉預(yù)置了基線評測集(包括C-Eval/CMMLU等主流榜單評測集)對待測模型的各項(xiàng)基礎(chǔ)通用能力進(jìn)行自動(dòng)評測,。您可以任選評測數(shù)據(jù),以此構(gòu)建您的所有評測數(shù)據(jù),。 開始評測:這一步將展示您的所有評測配置和預(yù)估費(fèi)用,,待您確認(rèn)所有信息后即可開始評測。
開始評測后,,您可以在模型評測列表中查看模型的評測進(jìn)度,、預(yù)估費(fèi)用和其他管理操作。有關(guān)評測費(fèi)用的詳細(xì)信息,,請參考產(chǎn)品計(jì)費(fèi),。
管理評測任務(wù)當(dāng)評測開始后,該評測任務(wù)的狀態(tài)將變更為執(zhí)行中或隊(duì)列中,,您可以隨時(shí)點(diǎn)擊中止來結(jié)束評測,。待評測完成后,您可以點(diǎn)擊結(jié)果查看詳細(xì)的評測結(jié)果。您可以點(diǎn)擊刪除刪去一項(xiàng)評測任務(wù),。 后續(xù)操作至此,,本篇已經(jīng)介紹了自定義模型調(diào)優(yōu)、部署與評測的全生命周期管理,。閱讀完本篇后,,您可以自行創(chuàng)建一個(gè)自定義模型,并能夠在業(yè)務(wù)場景中調(diào)用該自定義模型,。
|