【大語言模型】自定義模型最佳實(shí)踐

三月陽春 2024-10-09

展開全文

為了讓大語言模型的AI能力更貼近業(yè)務(wù)需求,，本文詳細(xì)介紹了在阿里云百煉創(chuàng)建自定義模型的最佳實(shí)踐。即便不清楚大模型的技術(shù)細(xì)節(jié),，您也能按照本篇的操作指引創(chuàng)建一個(gè)有效的自定義模型,，從而輕松地為業(yè)務(wù)場景添加大模型服務(wù)能力,。

自定義模型概述

自定義大模型是指基于通用大語言模型，通過微調(diào)和訓(xùn)練,，能更好地適應(yīng)特定領(lǐng)域或任務(wù)的大語言模型,。

為什么選擇自定義模型？

提高特定領(lǐng)域的準(zhǔn)確性：通用的大語言模型盡管強(qiáng)大,，但在處理特定領(lǐng)域的任務(wù)時(shí),，可能會(huì)因?yàn)槿狈︻I(lǐng)域特定知識(shí)而表現(xiàn)不佳。自定義大語言模型通過領(lǐng)域特定的數(shù)據(jù)進(jìn)行重新訓(xùn)練,，可以顯著提高在該領(lǐng)域的表現(xiàn)和準(zhǔn)確性,。
增強(qiáng)模型的適用性：自定義大語言模型可以根據(jù)特定應(yīng)用場景的需求進(jìn)行微調(diào)，使其更好地適應(yīng)特定任務(wù),。例如,，在客戶服務(wù)中，自定義模型可以更好地理解和回應(yīng)客戶的特定問題,，提高客戶滿意度,。
節(jié)約開發(fā)時(shí)間和成本：利用現(xiàn)有的大語言模型進(jìn)行定制化訓(xùn)練，比從頭開發(fā)一個(gè)模型要節(jié)約大量時(shí)間和成本,。您可以快速部署自定義模型,，滿足業(yè)務(wù)需求。
增強(qiáng)品牌和用戶體驗(yàn)：自定義大語言模型可以根據(jù)企業(yè)的品牌語言風(fēng)格進(jìn)行調(diào)整,，確保輸出內(nèi)容的一致性和品牌調(diào)性,，從而提升用戶體驗(yàn)和品牌形象。

創(chuàng)建自定義模型的流程

創(chuàng)建自定義模型涉及三個(gè)主要步驟：模型調(diào)優(yōu),、模型部署,、模型評測，以及三個(gè)輔助步驟：訓(xùn)練數(shù)據(jù)準(zhǔn)備,、評測模板設(shè)計(jì),、調(diào)整訓(xùn)練策略。

模型調(diào)優(yōu)階段：模型會(huì)“學(xué)習(xí)”大量訓(xùn)練數(shù)據(jù)的語言特征,，從而理解并生成相似的自然語言,。開始模型調(diào)優(yōu)之前，您需要做一些訓(xùn)練數(shù)據(jù)準(zhǔn)備工作,，包括數(shù)據(jù)收集,、數(shù)據(jù)清洗、數(shù)據(jù)集劃分等操作,。您需按照訓(xùn)練新模型向?qū)У闹敢渲?span style="outline: none;box-sizing: border-box;margin: 0px;padding: 0px;font-weight: 700;">模型調(diào)優(yōu),。根據(jù)配置的訓(xùn)練超參數(shù)（超參數(shù)是指在模型調(diào)優(yōu)前需要提前設(shè)定的參數(shù)，包括學(xué)習(xí)率,、迭代次數(shù)等）,，阿里云百煉將自動(dòng)訓(xùn)練您選擇的預(yù)置模型,。一般情況下，訓(xùn)練過程是自動(dòng)完成的,，無需進(jìn)一步操作,。
模型部署階段：您需要將自定義模型部署到獨(dú)占實(shí)例上，然后調(diào)用或評測自定義模型,。部署新模型向?qū)椭渲?span style="outline: none;box-sizing: border-box;margin: 0px;padding: 0px;font-weight: 700;">模型部署,。根據(jù)配置的自定義模型規(guī)格和資源配置方式，阿里云百煉將計(jì)算預(yù)估價(jià)格,。待您確認(rèn)價(jià)格后,，阿里云百煉會(huì)自動(dòng)部署模型，一般無需干預(yù),。完成部署后,，您便可以在代碼或評測中配置自定義模型。
模型評測階段：您可以評測已部署的自定義模型,。您可以按照創(chuàng)建評測任務(wù)向?qū)У闹敢渲?span style="outline: none;box-sizing: border-box;margin: 0px;padding: 0px;font-weight: 700;">模型評測,。自定義模型不涉及評測模板設(shè)計(jì)環(huán)節(jié)。根據(jù)您選擇的評測方式,、數(shù)據(jù)和維度,，阿里云百煉將自動(dòng)完成評測，一般無需干預(yù),。

說明

如果對模型的評測結(jié)果不滿意,，您還可以調(diào)整訓(xùn)練策略（選擇不同的預(yù)置模型作為基礎(chǔ)模型、擴(kuò)充訓(xùn)練數(shù)據(jù)樣本,、選擇不同的超參數(shù)配置等）,，再次完成訓(xùn)練、部署和評測,。您可以重復(fù)整個(gè)流程,，直到模型的評測結(jié)果滿足預(yù)期,。

說明

在阿里云百煉,，完成調(diào)優(yōu)的模型必須部署后才能調(diào)用和評測。因此,，您需要首先完成模型部署,，方可繼續(xù)評測模型。

前提條件

前置知識(shí)

您可能需要了解機(jī)器學(xué)習(xí),、深度學(xué)習(xí)和自然語言處理的基礎(chǔ)概念,。如果不了解這些概念，您也可以遵循本實(shí)踐文檔的指引完成整個(gè)創(chuàng)建流程,。

工具和資源

您需要開通阿里云百煉大模型服務(wù)平臺(tái),，并確認(rèn)賬號(hào)余額充足,，以免無法創(chuàng)建自定義模型。

計(jì)費(fèi)信息

創(chuàng)建自定義模型時(shí),，可能涉及多種計(jì)費(fèi)項(xiàng),，包括但不限于模型調(diào)優(yōu)、模型部署和模型評測,。計(jì)費(fèi)規(guī)則請參考產(chǎn)品計(jì)費(fèi),。

訓(xùn)練數(shù)據(jù)準(zhǔn)備

在開始訓(xùn)練前，您需要完成訓(xùn)練數(shù)據(jù)的準(zhǔn)備工作,。這些準(zhǔn)備工作包括：從業(yè)務(wù)場景中收集具有代表性的業(yè)務(wù)數(shù)據(jù),，并轉(zhuǎn)換為問答對的形式（數(shù)據(jù)收集）；上傳訓(xùn)練數(shù)據(jù),、評測數(shù)據(jù),、驗(yàn)證數(shù)據(jù)（數(shù)據(jù)上傳）；使用阿里云大模型服務(wù)平臺(tái)百煉提供的數(shù)據(jù)清洗工具和數(shù)據(jù)增強(qiáng)工具,，提升訓(xùn)練數(shù)據(jù)的質(zhì)量,。

1. 數(shù)據(jù)收集

您可以從各種信息來源中發(fā)掘有業(yè)務(wù)價(jià)值的數(shù)據(jù)，并將這些數(shù)據(jù)編排成特定結(jié)構(gòu),。您在完成數(shù)據(jù)收集時(shí),，需仔細(xì)考慮以下策略：

來源多樣化：從書籍摘錄、學(xué)術(shù)論文,、新聞報(bào)道和專業(yè)網(wǎng)站等多種來源收集數(shù)據(jù),，來確保模型的適用范圍更廣，可以處理不同類型的問題或理解多種表達(dá)方式,。
質(zhì)量控制：數(shù)據(jù)質(zhì)量決定了模型質(zhì)量,。質(zhì)量高、數(shù)量足的數(shù)據(jù)可以讓模型學(xué)得更好,，表現(xiàn)更優(yōu),。
平衡性考量：確保問題類型、難度和答案的分布均勻,，避免模型偏向某一特定類型的數(shù)據(jù),，導(dǎo)致訓(xùn)練偏差。

在阿里云百煉,，您需要將收集到的數(shù)據(jù)編排成“Prompt-Completion”格式,，便于平臺(tái)解析和訓(xùn)練。為了盡可能提高訓(xùn)練效率,，我們建議至少準(zhǔn)備500條訓(xùn)練數(shù)據(jù),，要求如下：

文本分割：合理分割長文本，確保每個(gè)Prompt-Completion對聚焦于單一明確的主題，便于模型學(xué)習(xí),。
脫敏處理：移除個(gè)人身份信息,、敏感詞匯或不適宜內(nèi)容，保證數(shù)據(jù)合規(guī)與安全,。
說明
小貼士：構(gòu)建聊天機(jī)器人的數(shù)據(jù)收集
假設(shè)您想創(chuàng)建一個(gè)智能聊天機(jī)器人,，能夠回答客戶提出的問題。
在數(shù)據(jù)收集階段,，您的目標(biāo)是：為聊天機(jī)器人收集學(xué)習(xí)材料,。
數(shù)據(jù)來源：
用戶聊天記錄：比如網(wǎng)站上的在線客服聊天記錄。
FAQ文檔：公司網(wǎng)站上的常見問題解答列表,。
客戶服務(wù)郵件：客戶發(fā)送給客服團(tuán)隊(duì)的問題和相應(yīng)的回復(fù),。
數(shù)據(jù)示例：
用戶聊天記錄：導(dǎo)出在線客服系統(tǒng)中的聊天記錄，可以包括客戶問題和客服回復(fù),。例如：
```
客戶：你們的退貨政策是什么,？
客服：我們的退貨政策是在購買30天內(nèi)可以無條件退貨。
```

FAQ文檔：收集網(wǎng)站上列出的常見問題及其答案,。例如：

問：如何更改我的密碼,？
答：請點(diǎn)擊“設(shè)置”，然后選擇“更改密碼”,。

客戶服務(wù)郵件：導(dǎo)出郵件系統(tǒng)中跟客戶的來往郵件,。例如：

客戶郵件：我的訂單沒有收到，怎么辦,？
客服回復(fù)：我們很抱歉,，請?zhí)峁┠挠唵翁?hào)，我們會(huì)盡快處理,。

數(shù)據(jù)編排：

Prompt	Completion
你們的退貨政策是什么,？	我們的退貨政策是購買30天內(nèi)可以無條件退貨。
如何更改我的密碼,？	請點(diǎn)擊“設(shè)置”,，然后選擇“更改密碼”。
我的訂單沒有收到,，怎么辦,？	我們很抱歉，請?zhí)峁┠挠唵翁?hào),，我們會(huì)盡快處理,。

2. 數(shù)據(jù)上傳

您需要將準(zhǔn)備好的數(shù)據(jù)上傳至阿里云百煉，以備進(jìn)一步清洗和增強(qiáng),，或直接參與模型調(diào)優(yōu)。平臺(tái)自動(dòng)進(jìn)行格式檢查和基礎(chǔ)數(shù)據(jù)質(zhì)量審核，確保數(shù)據(jù)符合訓(xùn)練要求,。

阿里云百煉支持創(chuàng)建不同數(shù)據(jù)類型的數(shù)據(jù)集,，包括訓(xùn)練集、評測集,，支持多版本數(shù)據(jù)管理,，發(fā)布后可前往模型調(diào)優(yōu)/評測功能使用。您可以利用平臺(tái)提供的工具對數(shù)據(jù)集進(jìn)行標(biāo)簽標(biāo)注,、篩選和版本管理,，有利于迭代訓(xùn)練和性能追蹤。

操作步驟

說明

小貼士：迭代優(yōu)化

數(shù)據(jù)準(zhǔn)備是一個(gè)迭代過程,，初期數(shù)據(jù)集不必完美,，但在模型調(diào)優(yōu)過程中，根據(jù)訓(xùn)練反饋不斷調(diào)整和豐富數(shù)據(jù),，可以逐步提升模型表現(xiàn),。

3. 數(shù)據(jù)清洗與數(shù)據(jù)增強(qiáng)（可選）

數(shù)據(jù)清洗是指檢查并處理收集到的數(shù)據(jù)，以保證數(shù)據(jù)的質(zhì)量,、完整性和一致性,。這一步驟可以顯著提高模型的訓(xùn)練效果和預(yù)測能力。數(shù)據(jù)增強(qiáng)是指增加多樣性并擴(kuò)展訓(xùn)練數(shù)據(jù)的規(guī)模,。

阿里云百煉提供了模型數(shù)據(jù)的版本管理能力,，您的數(shù)據(jù)將在清洗或增強(qiáng)后自動(dòng)生成一個(gè)新版本。新版本數(shù)據(jù)獨(dú)立保存,，不會(huì)覆蓋源數(shù)據(jù),。

重要

如果您的數(shù)據(jù)類型不適合數(shù)據(jù)清洗與增強(qiáng)（如法律文件、醫(yī)學(xué)記錄,、文學(xué)作品,、方言匯總、用戶評論,、技術(shù)手冊等）,，建議跳過該步驟。

建議您優(yōu)先清洗數(shù)據(jù),，再增強(qiáng)清洗后的數(shù)據(jù),。這樣可以確保增強(qiáng)操作是在一個(gè)干凈、高質(zhì)量的數(shù)據(jù)集上進(jìn)行的,。這樣可以避免在低質(zhì)量數(shù)據(jù)上進(jìn)行增強(qiáng),，從而保證模型調(diào)優(yōu)的數(shù)據(jù)源是準(zhǔn)確的。

數(shù)據(jù)清洗操作步驟

數(shù)據(jù)增強(qiáng)操作步驟

說明

小貼士：精準(zhǔn)與多樣化

在數(shù)據(jù)處理中,，數(shù)據(jù)清洗和數(shù)據(jù)增強(qiáng)是提升數(shù)據(jù)質(zhì)量和多樣性的關(guān)鍵步驟,。為了確保這兩個(gè)步驟的有效性和合理性，請您參考以下建議：

逐步清洗：分階段進(jìn)行數(shù)據(jù)清洗，每次只執(zhí)行特定的一類清洗操作（如移除重復(fù)項(xiàng),、處理缺失值等）,。這樣可以更容易地檢測和糾正錯(cuò)誤，提高數(shù)據(jù)的整潔度和一致性,。
驗(yàn)證清洗效果：每個(gè)清洗步驟之后,，檢查數(shù)據(jù)的樣本，以確保數(shù)據(jù)的完整性和真實(shí)性沒有被破壞,。
任務(wù)相關(guān)性：在數(shù)據(jù)增強(qiáng)時(shí),，確保生成的增強(qiáng)數(shù)據(jù)與目標(biāo)任務(wù)高度相關(guān)，避免引入不相關(guān)的變體,，保持?jǐn)?shù)據(jù)上下文和語義的一致性,。
多樣化策略：使用多種數(shù)據(jù)增強(qiáng)策略（如同義詞替換、隨機(jī)抽樣,、翻譯變換等）,，以最大限度地增加數(shù)據(jù)的多樣性。這有助于提升模型的泛化能力,。
平衡增強(qiáng)：生成的增強(qiáng)數(shù)據(jù)應(yīng)在類別,、難度和結(jié)構(gòu)上相對平衡，避免讓模型接觸過多的特定類型數(shù)據(jù),，導(dǎo)致過擬合,。確保在數(shù)據(jù)增強(qiáng)過程中，不偏離數(shù)據(jù)的真實(shí)分布,。

模型調(diào)優(yōu)

完成訓(xùn)練數(shù)據(jù)的準(zhǔn)備后,，您便可以開始模型調(diào)優(yōu)。模型調(diào)優(yōu),，即使用訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集訓(xùn)練模型,。

阿里云百煉提供Fine-tuning的訓(xùn)練方式，還提供多種參數(shù)的調(diào)整,，可以根據(jù)業(yè)務(wù)需求調(diào)整參數(shù),，優(yōu)化模型調(diào)優(yōu)效果。以下是新建模型訓(xùn)練任務(wù)和關(guān)聯(lián)模型訓(xùn)練任務(wù)的操作方法：

新建訓(xùn)練任務(wù)

您可通過模型調(diào)優(yōu)頁面的訓(xùn)練新模型操作向?qū)?，完成?xùn)練的參數(shù)設(shè)置,，具體操作如下：

登錄阿里云百煉控制臺(tái)，在左側(cè)導(dǎo)航欄中,，選擇模型工具 > 模型調(diào)優(yōu),。這里展示了所有調(diào)優(yōu)任務(wù)。
點(diǎn)擊訓(xùn)練新模型,，阿里云百煉將會(huì)引導(dǎo)您配置訓(xùn)練參數(shù)：

最大靈活性：全參數(shù)訓(xùn)練可使模型適應(yīng)新的數(shù)據(jù)和任務(wù),，具有最大的調(diào)整靈活性,。
高性能：在理論上，全參數(shù)訓(xùn)練可以獲得最高的性能,，因?yàn)樗袇?shù)都經(jīng)過調(diào)整以優(yōu)化特定任務(wù),。

時(shí)間成本高：訓(xùn)練時(shí)間長,，特別是在大型數(shù)據(jù)集上的訓(xùn)練,。
過擬合風(fēng)險(xiǎn)：如果數(shù)據(jù)量不足或不平衡，全參數(shù)訓(xùn)練可能導(dǎo)致模型過擬合于特定訓(xùn)練數(shù)據(jù),。

快速訓(xùn)練：比全參數(shù)訓(xùn)練更快,，適合快速迭代和原型開發(fā)。
減小過擬合風(fēng)險(xiǎn)：微調(diào)部分參數(shù)可以降低過擬合風(fēng)險(xiǎn),。

性能可能受限：在某些任務(wù)上,，性能可能略低于全參數(shù)訓(xùn)練。
適用范圍有限：當(dāng)任務(wù)的性質(zhì)高度變化或與預(yù)訓(xùn)練任務(wù)顯著不同,，高效訓(xùn)練可能無法有效遷移已有的知識(shí),。

訓(xùn)練方式：阿里云百煉支持全參訓(xùn)練和高效訓(xùn)練兩種方式，以下是選擇建議：
訓(xùn)練方式
優(yōu)點(diǎn)
缺點(diǎn)
全參訓(xùn)練

高效訓(xùn)練

高效訓(xùn)練能較好地平衡訓(xùn)練時(shí)長和訓(xùn)練效果,，一般建議您選擇高效訓(xùn)練,。
選擇模型：阿里云百煉支持基于預(yù)置模型或自定義模型的調(diào)優(yōu)。
如果您是第一次訓(xùn)練模型,，建議選擇預(yù)置模型,；如果您調(diào)整了訓(xùn)練策略，希望基于已訓(xùn)練的模型進(jìn)行再次訓(xùn)練,，則可選擇自定義模型,。
阿里云百煉提供了多種可調(diào)優(yōu)的預(yù)置模型，各模型特性請參閱模型調(diào)用,。
選擇訓(xùn)練數(shù)據(jù)：選擇參與訓(xùn)練的數(shù)據(jù)集,，您在已上傳的數(shù)據(jù)集列表中選擇訓(xùn)練集。
說明
如果清洗或增強(qiáng)了數(shù)據(jù),，您需要注意數(shù)據(jù)集的名稱和版本,，以免誤選未經(jīng)處理的數(shù)據(jù)。
選擇驗(yàn)證數(shù)據(jù)：選擇參與驗(yàn)證訓(xùn)練效果的數(shù)據(jù)集,，您可以選擇自動(dòng)切分或從數(shù)據(jù)列表中選擇驗(yàn)證集,。
如果您沒有準(zhǔn)備驗(yàn)證數(shù)據(jù)集，建議選擇自動(dòng)切分,，阿里云百煉將從選定的訓(xùn)練集中劃分一部分?jǐn)?shù)據(jù)作為驗(yàn)證集,。反之，建議從數(shù)據(jù)列表中選擇驗(yàn)證集,。
說明
如果您清洗或增強(qiáng)了數(shù)據(jù),，您需要注意數(shù)據(jù)集的名稱和版本,，以免誤選未經(jīng)處理的數(shù)據(jù)。
混合訓(xùn)練：為了避免基礎(chǔ)模型能力的遺失并提高訓(xùn)練效果,，阿里云百煉支持您將自備的訓(xùn)練數(shù)據(jù)與預(yù)置通用數(shù)據(jù)混合訓(xùn)練,。您可以調(diào)整自備訓(xùn)練數(shù)據(jù)與預(yù)置通用數(shù)據(jù)的比例，如果所有類型的預(yù)置通用數(shù)據(jù)的比例設(shè)置為0,，您將不使用預(yù)置數(shù)據(jù),。
超參配置：模型的超參配置決定一定程度的模型調(diào)優(yōu)效果，您可按照自己的訓(xùn)練經(jīng)驗(yàn)進(jìn)行配置,。如果您不了解超參數(shù),，阿里云百煉也提供一套基于實(shí)驗(yàn)所得的默認(rèn)配置，您可以遵循默認(rèn)配置,。
開始訓(xùn)練：這一步將展示您的所有訓(xùn)練配置,，阿里云百煉會(huì)自動(dòng)計(jì)算預(yù)估的訓(xùn)練費(fèi)用（稍后您也可以在訓(xùn)練任務(wù)列表中瀏覽預(yù)估費(fèi)用明細(xì)，實(shí)際產(chǎn)生費(fèi)用以生成賬單為準(zhǔn)）,。待您確認(rèn)配置和價(jià)格信息無誤后即可開始訓(xùn)練,。

開始訓(xùn)練后，您可以在模型調(diào)優(yōu)列表中查看模型的訓(xùn)練進(jìn)度,、預(yù)估費(fèi)用和其他管理操作,。有關(guān)訓(xùn)練費(fèi)用的詳細(xì)信息，請參考產(chǎn)品計(jì)費(fèi),。

說明

小貼士：模型訓(xùn)練入門指南

如果您是大語言模型訓(xùn)練的新手,，以下是一些簡單且實(shí)用的小貼士，幫您輕松入門并提高訓(xùn)練效果：

優(yōu)化學(xué)習(xí)率：

簡單理解：學(xué)習(xí)率決定模型每次調(diào)整的步伐大小,。開始訓(xùn)練時(shí),，可以從較小的學(xué)習(xí)率（如0.001）開始，如果訓(xùn)練速度很慢或效果不好,，可以逐步增加,。
如何調(diào)整：如果驗(yàn)證集性能沒有提升，可以嘗試調(diào)整學(xué)習(xí)率,，通?？s小10倍或增加10倍是一個(gè)好的做法。

選擇合適的批次大?。?/p>

簡單理解：批次大小是每次訓(xùn)練中用來更新模型的樣本數(shù),。更大的批次大小可以提高訓(xùn)練效率。
推薦設(shè)置：常見的批次大小是8,、16或32,，默認(rèn)選擇16.

學(xué)習(xí)監(jiān)控?fù)p失和準(zhǔn)確率：

簡單理解：損失（Loss）表示模型在訓(xùn)練數(shù)據(jù)上的誤差，準(zhǔn)確率（Accuracy）表示模型的性能,。如果損失一直下降而準(zhǔn)確率提升,，說明訓(xùn)練進(jìn)展順利,。
如何操作：您可以進(jìn)入訓(xùn)練任務(wù)詳情頁，實(shí)時(shí)監(jiān)控訓(xùn)練過程中的損失和準(zhǔn)確率變化,。驗(yàn)證集上的損失可以幫助您決定是否需要調(diào)整超參數(shù),。

簡單的數(shù)據(jù)增強(qiáng)方式：

簡單理解：數(shù)據(jù)增強(qiáng)可以增加數(shù)據(jù)的多樣性，提高模型的泛化能力,。例如,，同義詞替換、隨機(jī)遮蓋等,。
如何操作：在數(shù)據(jù)預(yù)處理階段,，進(jìn)行簡單的同義詞替換或其他文本增強(qiáng),。

管理訓(xùn)練任務(wù)

待您啟動(dòng)訓(xùn)練后,，您新建的模型訓(xùn)練任務(wù)將出現(xiàn)在模型調(diào)優(yōu)的列表里，其訓(xùn)練狀態(tài)將變更為訓(xùn)練中,。此時(shí),，您可點(diǎn)擊訓(xùn)練任務(wù)的查看操作進(jìn)入訓(xùn)練詳情頁，瀏覽訓(xùn)練任務(wù)的配置和訓(xùn)練的過程指標(biāo),。您可以點(diǎn)擊查看預(yù)估來瀏覽本次訓(xùn)練任務(wù)預(yù)估的計(jì)費(fèi)信息,。您也可以隨時(shí)點(diǎn)擊終止訓(xùn)練來結(jié)束訓(xùn)練任務(wù)。

訓(xùn)練過程指標(biāo)主要有以下三個(gè),，大致體現(xiàn)了模型的訓(xùn)練效果,。如果您不了解這些指標(biāo)的含義，也可以等待訓(xùn)練結(jié)束后,，使用阿里云百煉的模型評測工具評價(jià)訓(xùn)練效果,。

指標(biāo)	解釋
Training Loss	Training Loss 代表針對訓(xùn)練數(shù)據(jù)學(xué)習(xí)的擬合程度，曲線一般呈現(xiàn)下降趨勢,。Loss越小,，表示訓(xùn)練數(shù)據(jù)擬合程度越高。過小的Loss易導(dǎo)致數(shù)據(jù)過擬合,，需要根據(jù)實(shí)際訓(xùn)練過程進(jìn)行判斷,。
Validation Loss	Validation Loss代表針對驗(yàn)證集學(xué)習(xí)的擬合程度，曲線一般呈現(xiàn)先下降后上升趨勢,。Loss越小,，表示驗(yàn)證數(shù)據(jù)擬合程度越高。優(yōu)秀的模型效果往往出現(xiàn)Validation Loss的最小值節(jié)點(diǎn),，此時(shí)擬合程度最佳,，訓(xùn)練效果最好。
Validation Token Accuracy	Validation Token Acc代表針對驗(yàn)證集學(xué)習(xí)的準(zhǔn)確程度,，曲線一般呈現(xiàn)上升趨勢,。訓(xùn)練過擬合后,，該曲線會(huì)呈現(xiàn)下降趨勢。優(yōu)秀的模型效果往往出現(xiàn)在Validation Token Acc的最大值節(jié)點(diǎn),，此時(shí)預(yù)測準(zhǔn)確率最高,，訓(xùn)練效果最好。

一般情況下,，千條以下的數(shù)據(jù)訓(xùn)練所需的時(shí)長為2-3個(gè)小時(shí),。由于平臺(tái)承載能力有限，可能出現(xiàn)排隊(duì)狀態(tài),，還請您諒解,。訓(xùn)練任務(wù)完成后，列表及詳情頁中模型的狀態(tài)將變更為訓(xùn)練成功,，此時(shí)您已經(jīng)獲得自定義模型,，該模型已處于等待部署狀態(tài)，您可以直接點(diǎn)擊模型部署跳轉(zhuǎn)到部署頁面,。

模型部署

待您獲得自定義模型后,，您需要將該模型部署到計(jì)算資源上，方可調(diào)用該模型,。

阿里云百煉提供了多種資源配置方式,，您可以按需選擇。如果需要評測模型的訓(xùn)練效果,，您需要先部署自定義模型,，再使用模型評測評估自定義模型的訓(xùn)練效果。

新建部署任務(wù)

登錄阿里云百煉控制臺(tái),，在左側(cè)導(dǎo)航欄中,，選擇模型工具 > 模型部署。您也可以在模型工具 > 模型訓(xùn)練中等待模型訓(xùn)練結(jié)束后,，直接點(diǎn)擊模型部署,。這里展示了所有模型部署任務(wù)。
點(diǎn)擊部署新模型,，您將跟隨向?qū)У闹敢瓿刹渴鹋渲茫?/p>

選擇模型：阿里云百煉提供了兩類可部署的模型,，此處請您選擇之前訓(xùn)練的自定義模型。
選擇資源配置：阿里云百煉提供了兩類資源配置方式,。包月資源是按月購買計(jì)算資源的方式,，不同版本的包月資源在部署模型的能力上有差別。按量付費(fèi)是按實(shí)際使用時(shí)長購買計(jì)算資源的方式,，您可以按需購買一定數(shù)量的計(jì)算資源,，也可以隨后變更計(jì)算資源的數(shù)量。為完成后續(xù)的模型評測，對訓(xùn)練效果做進(jìn)一步評估,，此處推薦您選擇按量付費(fèi),。
開始部署：這一步將展示您的所有部署配置和預(yù)估費(fèi)用，待您確認(rèn)所有信息后即可開始部署,。

開始部署后,，您可以在模型部署列表中查看模型的部署進(jìn)度、預(yù)估費(fèi)用和其他管理操作,。有關(guān)部署費(fèi)用的詳細(xì)信息,，請參考產(chǎn)品計(jì)費(fèi)。

一般情況下,，模型部署時(shí)長在幾十分鐘到幾個(gè)小時(shí)不等,，由于阿里云百煉資源限制，部署可能會(huì)產(chǎn)生隊(duì)列,，部署完成后,，狀態(tài)將變?yōu)檫\(yùn)行中，運(yùn)行中的模型可被調(diào)用,，用于模型評測及應(yīng)用調(diào)用,。

說明

小貼士：實(shí)例管理與性能優(yōu)化

什么是實(shí)例：

簡單定義：實(shí)例是運(yùn)行模型和處理請求的獨(dú)立計(jì)算單元，通常對應(yīng)一臺(tái)服務(wù)器,、一塊GPU，或在容器化環(huán)境中對應(yīng)一個(gè)容器,。
實(shí)例用途：實(shí)例用于將模型加載到內(nèi)存中,，接受用戶請求，執(zhí)行推理任務(wù)（如文本生成,、分類等）,，并返回結(jié)果。

實(shí)例數(shù)量對性能的影響：

響應(yīng)時(shí)間：增加實(shí)例數(shù)量能有效分擔(dān)負(fù)載,，降低每個(gè)實(shí)例處理請求的時(shí)間,，提高整體響應(yīng)速度。
并發(fā)處理：更多實(shí)例可以并行處理更多請求,，提高系統(tǒng)的并發(fā)處理能力,。
成本效益：增加實(shí)例數(shù)量能提高性能和用戶體驗(yàn)，但成本可能增加,，需要權(quán)衡,。

管理部署任務(wù)

待您啟動(dòng)部署后，您新建的模型部署任務(wù)將出現(xiàn)在模型部署的列表里,，其部署狀態(tài)將變更為部署中,。此時(shí)，您可點(diǎn)擊部署任務(wù)的查看操作瀏覽部署任務(wù)的配置,。您可以點(diǎn)擊擴(kuò)縮容來變更計(jì)算資源的用量,。您也可以隨時(shí)點(diǎn)擊下線來結(jié)束部署任務(wù),。

待部署完成后，其部署狀態(tài)將變更為運(yùn)行中,。此時(shí)您訓(xùn)練的自定義模型已經(jīng)具備了推理調(diào)用的能力,。您可以點(diǎn)擊去體驗(yàn)，在模型體驗(yàn)頁面測試您的自定義模型推理效果,。此時(shí),，您可以使用模型評測對自定義模型的效果做評估。

模型評測

完成模型部署后,，如需測試模型的效果,，可在模型評測中進(jìn)行評測。對于本篇介紹的自定義模型,，阿里云百煉提供了基線評測方法,。基線評測預(yù)置多種常用的能力評測集及評測腳本，可自動(dòng)評測模型多種基本能力,。

新建評測任務(wù)

登錄阿里云百煉控制臺(tái),，在左側(cè)導(dǎo)航欄中，選擇模型工具 > 模型評測,。這里展示了所有模型評測任務(wù),。
點(diǎn)擊創(chuàng)建評測任務(wù)，您將遵循向?qū)瓿稍u測任務(wù)的配置：

評測方式：阿里云百煉提供了多種評測方式,。對于自定義模型,，請您選擇基線評測。
選擇模型：請?jiān)谙吕蛑羞x擇已部署的目標(biāo)評測模型,。
選擇評測數(shù)據(jù)：阿里云百煉預(yù)置了基線評測集（包括C-Eval/CMMLU等主流榜單評測集）對待測模型的各項(xiàng)基礎(chǔ)通用能力進(jìn)行自動(dòng)評測,。您可以任選評測數(shù)據(jù)，以此構(gòu)建您的所有評測數(shù)據(jù),。
開始評測：這一步將展示您的所有評測配置和預(yù)估費(fèi)用,，待您確認(rèn)所有信息后即可開始評測。

開始評測后,，您可以在模型評測列表中查看模型的評測進(jìn)度,、預(yù)估費(fèi)用和其他管理操作。有關(guān)評測費(fèi)用的詳細(xì)信息,，請參考產(chǎn)品計(jì)費(fèi),。

管理評測任務(wù)

當(dāng)評測開始后，該評測任務(wù)的狀態(tài)將變更為執(zhí)行中或隊(duì)列中,，您可以隨時(shí)點(diǎn)擊中止來結(jié)束評測,。待評測完成后，您可以點(diǎn)擊結(jié)果查看詳細(xì)的評測結(jié)果。您可以點(diǎn)擊刪除刪去一項(xiàng)評測任務(wù),。

后續(xù)操作

至此,，本篇已經(jīng)介紹了自定義模型調(diào)優(yōu)、部署與評測的全生命周期管理,。閱讀完本篇后,，您可以自行創(chuàng)建一個(gè)自定義模型，并能夠在業(yè)務(wù)場景中調(diào)用該自定義模型,。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn),。請注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息，謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,，請點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：三月陽春 > 《待分類》

舉報(bào)/認(rèn)領(lǐng)