久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

【大語言模型】自定義模型最佳實(shí)踐

 三月陽春 2024-10-09

為了讓大語言模型的AI能力更貼近業(yè)務(wù)需求,,本文詳細(xì)介紹了在阿里云百煉創(chuàng)建自定義模型的最佳實(shí)踐。即便不清楚大模型的技術(shù)細(xì)節(jié),,您也能按照本篇的操作指引創(chuàng)建一個(gè)有效的自定義模型,,從而輕松地為業(yè)務(wù)場景添加大模型服務(wù)能力,。

自定義模型概述

自定義大模型是指基于通用大語言模型,通過微調(diào)和訓(xùn)練,,能更好地適應(yīng)特定領(lǐng)域或任務(wù)的大語言模型,。

為什么選擇自定義模型?

  1. 提高特定領(lǐng)域的準(zhǔn)確性:通用的大語言模型盡管強(qiáng)大,,但在處理特定領(lǐng)域的任務(wù)時(shí),,可能會(huì)因?yàn)槿狈︻I(lǐng)域特定知識(shí)而表現(xiàn)不佳。自定義大語言模型通過領(lǐng)域特定的數(shù)據(jù)進(jìn)行重新訓(xùn)練,,可以顯著提高在該領(lǐng)域的表現(xiàn)和準(zhǔn)確性,。

  2. 增強(qiáng)模型的適用性:自定義大語言模型可以根據(jù)特定應(yīng)用場景的需求進(jìn)行微調(diào),使其更好地適應(yīng)特定任務(wù),。例如,,在客戶服務(wù)中,自定義模型可以更好地理解和回應(yīng)客戶的特定問題,,提高客戶滿意度,。

  3. 節(jié)約開發(fā)時(shí)間和成本:利用現(xiàn)有的大語言模型進(jìn)行定制化訓(xùn)練,比從頭開發(fā)一個(gè)模型要節(jié)約大量時(shí)間和成本,。您可以快速部署自定義模型,,滿足業(yè)務(wù)需求。

  4. 增強(qiáng)品牌和用戶體驗(yàn):自定義大語言模型可以根據(jù)企業(yè)的品牌語言風(fēng)格進(jìn)行調(diào)整,,確保輸出內(nèi)容的一致性和品牌調(diào)性,,從而提升用戶體驗(yàn)和品牌形象。

創(chuàng)建自定義模型的流程

創(chuàng)建自定義模型涉及三個(gè)主要步驟:模型調(diào)優(yōu),、模型部署,、模型評測,以及三個(gè)輔助步驟:訓(xùn)練數(shù)據(jù)準(zhǔn)備,、評測模板設(shè)計(jì),、調(diào)整訓(xùn)練策略。

  1. 模型調(diào)優(yōu)階段:模型會(huì)“學(xué)習(xí)”大量訓(xùn)練數(shù)據(jù)的語言特征,,從而理解并生成相似的自然語言,。開始模型調(diào)優(yōu)之前,您需要做一些訓(xùn)練數(shù)據(jù)準(zhǔn)備工作,,包括數(shù)據(jù)收集,、數(shù)據(jù)清洗、數(shù)據(jù)集劃分等操作,。您需按照訓(xùn)練新模型向?qū)У闹敢渲?span style="outline: none;box-sizing: border-box;margin: 0px;padding: 0px;font-weight: 700;">模型調(diào)優(yōu),。根據(jù)配置的訓(xùn)練超參數(shù)(超參數(shù)是指在模型調(diào)優(yōu)前需要提前設(shè)定的參數(shù),包括學(xué)習(xí)率,、迭代次數(shù)等),,阿里云百煉將自動(dòng)訓(xùn)練您選擇的預(yù)置模型,。一般情況下,訓(xùn)練過程是自動(dòng)完成的,,無需進(jìn)一步操作,。

  2. 模型部署階段:您需要將自定義模型部署到獨(dú)占實(shí)例上,然后調(diào)用或評測自定義模型,。部署新模型向?qū)椭渲?span style="outline: none;box-sizing: border-box;margin: 0px;padding: 0px;font-weight: 700;">模型部署,。根據(jù)配置的自定義模型規(guī)格和資源配置方式,阿里云百煉將計(jì)算預(yù)估價(jià)格,。待您確認(rèn)價(jià)格后,,阿里云百煉會(huì)自動(dòng)部署模型,一般無需干預(yù),。完成部署后,,您便可以在代碼或評測中配置自定義模型。

  3. 模型評測階段:您可以評測已部署的自定義模型,。您可以按照創(chuàng)建評測任務(wù)向?qū)У闹敢渲?span style="outline: none;box-sizing: border-box;margin: 0px;padding: 0px;font-weight: 700;">模型評測,。自定義模型不涉及評測模板設(shè)計(jì)環(huán)節(jié)。根據(jù)您選擇的評測方式,、數(shù)據(jù)和維度,,阿里云百煉將自動(dòng)完成評測,一般無需干預(yù),。

說明

如果對模型的評測結(jié)果不滿意,,您還可以調(diào)整訓(xùn)練策略(選擇不同的預(yù)置模型作為基礎(chǔ)模型、擴(kuò)充訓(xùn)練數(shù)據(jù)樣本,、選擇不同的超參數(shù)配置等),,再次完成訓(xùn)練、部署和評測,。您可以重復(fù)整個(gè)流程,,直到模型的評測結(jié)果滿足預(yù)期,。

說明

在阿里云百煉,,完成調(diào)優(yōu)的模型必須部署后才能調(diào)用和評測。因此,,您需要首先完成模型部署,,方可繼續(xù)評測模型。

image

前提條件

前置知識(shí)

您可能需要了解機(jī)器學(xué)習(xí),、深度學(xué)習(xí)和自然語言處理的基礎(chǔ)概念,。如果不了解這些概念,您也可以遵循本實(shí)踐文檔的指引完成整個(gè)創(chuàng)建流程,。

工具和資源

您需要開通阿里云百煉大模型服務(wù)平臺(tái),,并確認(rèn)賬號(hào)余額充足,,以免無法創(chuàng)建自定義模型。

計(jì)費(fèi)信息

創(chuàng)建自定義模型時(shí),,可能涉及多種計(jì)費(fèi)項(xiàng),,包括但不限于模型調(diào)優(yōu)、模型部署和模型評測,。計(jì)費(fèi)規(guī)則請參考產(chǎn)品計(jì)費(fèi),。

訓(xùn)練數(shù)據(jù)準(zhǔn)備

在開始訓(xùn)練前,您需要完成訓(xùn)練數(shù)據(jù)的準(zhǔn)備工作,。這些準(zhǔn)備工作包括:從業(yè)務(wù)場景中收集具有代表性的業(yè)務(wù)數(shù)據(jù),,并轉(zhuǎn)換為問答對的形式(數(shù)據(jù)收集);上傳訓(xùn)練數(shù)據(jù),、評測數(shù)據(jù),、驗(yàn)證數(shù)據(jù)(數(shù)據(jù)上傳);使用阿里云大模型服務(wù)平臺(tái)百煉提供的數(shù)據(jù)清洗工具和數(shù)據(jù)增強(qiáng)工具,,提升訓(xùn)練數(shù)據(jù)的質(zhì)量,。

1. 數(shù)據(jù)收集

您可以從各種信息來源中發(fā)掘有業(yè)務(wù)價(jià)值的數(shù)據(jù),并將這些數(shù)據(jù)編排成特定結(jié)構(gòu),。您在完成數(shù)據(jù)收集時(shí),,需仔細(xì)考慮以下策略:

  • 來源多樣化:從書籍摘錄、學(xué)術(shù)論文,、新聞報(bào)道和專業(yè)網(wǎng)站等多種來源收集數(shù)據(jù),,來確保模型的適用范圍更廣,可以處理不同類型的問題或理解多種表達(dá)方式,。

  • 質(zhì)量控制:數(shù)據(jù)質(zhì)量決定了模型質(zhì)量,。質(zhì)量高、數(shù)量足的數(shù)據(jù)可以讓模型學(xué)得更好,,表現(xiàn)更優(yōu),。

  • 平衡性考量:確保問題類型、難度和答案的分布均勻,,避免模型偏向某一特定類型的數(shù)據(jù),,導(dǎo)致訓(xùn)練偏差。

在阿里云百煉,,您需要將收集到的數(shù)據(jù)編排成“Prompt-Completion”格式,,便于平臺(tái)解析和訓(xùn)練。為了盡可能提高訓(xùn)練效率,,我們建議至少準(zhǔn)備500條訓(xùn)練數(shù)據(jù),,要求如下:

  • 文本分割:合理分割長文本,確保每個(gè)Prompt-Completion對聚焦于單一明確的主題,便于模型學(xué)習(xí),。

  • 脫敏處理:移除個(gè)人身份信息,、敏感詞匯或不適宜內(nèi)容,保證數(shù)據(jù)合規(guī)與安全,。

  • 說明

  • 小貼士:構(gòu)建聊天機(jī)器人的數(shù)據(jù)收集

  • 假設(shè)您想創(chuàng)建一個(gè)智能聊天機(jī)器人,,能夠回答客戶提出的問題。

  • 在數(shù)據(jù)收集階段,,您的目標(biāo)是:為聊天機(jī)器人收集學(xué)習(xí)材料,。

  • 數(shù)據(jù)來源:

  • 用戶聊天記錄:比如網(wǎng)站上的在線客服聊天記錄。

  • FAQ文檔:公司網(wǎng)站上的常見問題解答列表,。

  • 客戶服務(wù)郵件:客戶發(fā)送給客服團(tuán)隊(duì)的問題和相應(yīng)的回復(fù),。

  • 數(shù)據(jù)示例:

  • 用戶聊天記錄:導(dǎo)出在線客服系統(tǒng)中的聊天記錄,可以包括客戶問題和客服回復(fù),。例如:

    客戶:你們的退貨政策是什么,?
    客服:我們的退貨政策是在購買30天內(nèi)可以無條件退貨。
  • FAQ文檔:收集網(wǎng)站上列出的常見問題及其答案,。例如:

    問:如何更改我的密碼,?
    答:請點(diǎn)擊“設(shè)置”,然后選擇“更改密碼”,。
  • 客戶服務(wù)郵件:導(dǎo)出郵件系統(tǒng)中跟客戶的來往郵件,。例如:

    客戶郵件:我的訂單沒有收到,怎么辦,?
    客服回復(fù):我們很抱歉,,請?zhí)峁┠挠唵翁?hào),我們會(huì)盡快處理,。
  • 數(shù)據(jù)編排:

  • Prompt

    Completion

    你們的退貨政策是什么,?

    我們的退貨政策是購買30天內(nèi)可以無條件退貨。

    如何更改我的密碼,?

    請點(diǎn)擊“設(shè)置”,,然后選擇“更改密碼”。

    我的訂單沒有收到,,怎么辦,?

    我們很抱歉,請?zhí)峁┠挠唵翁?hào),,我們會(huì)盡快處理,。

2. 數(shù)據(jù)上傳

您需要將準(zhǔn)備好的數(shù)據(jù)上傳至阿里云百煉,以備進(jìn)一步清洗和增強(qiáng),,或直接參與模型調(diào)優(yōu)。平臺(tái)自動(dòng)進(jìn)行格式檢查和基礎(chǔ)數(shù)據(jù)質(zhì)量審核,確保數(shù)據(jù)符合訓(xùn)練要求,。

阿里云百煉支持創(chuàng)建不同數(shù)據(jù)類型的數(shù)據(jù)集,,包括訓(xùn)練集、評測集,,支持多版本數(shù)據(jù)管理,,發(fā)布后可前往模型調(diào)優(yōu)/評測功能使用。您可以利用平臺(tái)提供的工具對數(shù)據(jù)集進(jìn)行標(biāo)簽標(biāo)注,、篩選和版本管理,,有利于迭代訓(xùn)練和性能追蹤。

操作步驟

說明

小貼士:迭代優(yōu)化

數(shù)據(jù)準(zhǔn)備是一個(gè)迭代過程,,初期數(shù)據(jù)集不必完美,,但在模型調(diào)優(yōu)過程中,根據(jù)訓(xùn)練反饋不斷調(diào)整和豐富數(shù)據(jù),,可以逐步提升模型表現(xiàn),。

3. 數(shù)據(jù)清洗與數(shù)據(jù)增強(qiáng)(可選)

數(shù)據(jù)清洗是指檢查并處理收集到的數(shù)據(jù),以保證數(shù)據(jù)的質(zhì)量,、完整性和一致性,。這一步驟可以顯著提高模型的訓(xùn)練效果和預(yù)測能力。數(shù)據(jù)增強(qiáng)是指增加多樣性并擴(kuò)展訓(xùn)練數(shù)據(jù)的規(guī)模,。

阿里云百煉提供了模型數(shù)據(jù)的版本管理能力,,您的數(shù)據(jù)將在清洗或增強(qiáng)后自動(dòng)生成一個(gè)新版本。新版本數(shù)據(jù)獨(dú)立保存,,不會(huì)覆蓋源數(shù)據(jù),。

重要

如果您的數(shù)據(jù)類型不適合數(shù)據(jù)清洗與增強(qiáng)(如法律文件、醫(yī)學(xué)記錄,、文學(xué)作品,、方言匯總、用戶評論,、技術(shù)手冊等),,建議跳過該步驟。

建議您優(yōu)先清洗數(shù)據(jù),,再增強(qiáng)清洗后的數(shù)據(jù),。這樣可以確保增強(qiáng)操作是在一個(gè)干凈、高質(zhì)量的數(shù)據(jù)集上進(jìn)行的,。這樣可以避免在低質(zhì)量數(shù)據(jù)上進(jìn)行增強(qiáng),,從而保證模型調(diào)優(yōu)的數(shù)據(jù)源是準(zhǔn)確的。

數(shù)據(jù)清洗操作步驟

數(shù)據(jù)增強(qiáng)操作步驟

說明

小貼士:精準(zhǔn)與多樣化

在數(shù)據(jù)處理中,,數(shù)據(jù)清洗和數(shù)據(jù)增強(qiáng)是提升數(shù)據(jù)質(zhì)量和多樣性的關(guān)鍵步驟,。為了確保這兩個(gè)步驟的有效性和合理性,請您參考以下建議:

  • 逐步清洗: 分階段進(jìn)行數(shù)據(jù)清洗,每次只執(zhí)行特定的一類清洗操作(如移除重復(fù)項(xiàng),、處理缺失值等),。這樣可以更容易地檢測和糾正錯(cuò)誤,提高數(shù)據(jù)的整潔度和一致性,。

  • 驗(yàn)證清洗效果: 每個(gè)清洗步驟之后,,檢查數(shù)據(jù)的樣本,以確保數(shù)據(jù)的完整性和真實(shí)性沒有被破壞,。

  • 任務(wù)相關(guān)性: 在數(shù)據(jù)增強(qiáng)時(shí),,確保生成的增強(qiáng)數(shù)據(jù)與目標(biāo)任務(wù)高度相關(guān),避免引入不相關(guān)的變體,,保持?jǐn)?shù)據(jù)上下文和語義的一致性,。

  • 多樣化策略: 使用多種數(shù)據(jù)增強(qiáng)策略(如同義詞替換、隨機(jī)抽樣,、翻譯變換等),,以最大限度地增加數(shù)據(jù)的多樣性。這有助于提升模型的泛化能力,。

  • 平衡增強(qiáng): 生成的增強(qiáng)數(shù)據(jù)應(yīng)在類別,、難度和結(jié)構(gòu)上相對平衡,避免讓模型接觸過多的特定類型數(shù)據(jù),,導(dǎo)致過擬合,。確保在數(shù)據(jù)增強(qiáng)過程中,不偏離數(shù)據(jù)的真實(shí)分布,。

模型調(diào)優(yōu)

完成訓(xùn)練數(shù)據(jù)的準(zhǔn)備后,,您便可以開始模型調(diào)優(yōu)。模型調(diào)優(yōu),,即使用訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集訓(xùn)練模型,。

阿里云百煉提供Fine-tuning的訓(xùn)練方式,還提供多種參數(shù)的調(diào)整,,可以根據(jù)業(yè)務(wù)需求調(diào)整參數(shù),,優(yōu)化模型調(diào)優(yōu)效果。以下是新建模型訓(xùn)練任務(wù)和關(guān)聯(lián)模型訓(xùn)練任務(wù)的操作方法:

新建訓(xùn)練任務(wù)

您可通過模型調(diào)優(yōu)頁面的訓(xùn)練新模型操作向?qū)?,完成?xùn)練的參數(shù)設(shè)置,,具體操作如下:

  1. 登錄阿里云百煉控制臺(tái)在左側(cè)導(dǎo)航欄中,,選擇模型工具 > 模型調(diào)優(yōu),。這里展示了所有調(diào)優(yōu)任務(wù)。

  2. 點(diǎn)擊訓(xùn)練新模型,,阿里云百煉將會(huì)引導(dǎo)您配置訓(xùn)練參數(shù):

    • 最大靈活性:全參數(shù)訓(xùn)練可使模型適應(yīng)新的數(shù)據(jù)和任務(wù),,具有最大的調(diào)整靈活性,。

    • 高性能:在理論上,全參數(shù)訓(xùn)練可以獲得最高的性能,,因?yàn)樗袇?shù)都經(jīng)過調(diào)整以優(yōu)化特定任務(wù),。

    • 時(shí)間成本高:訓(xùn)練時(shí)間長,,特別是在大型數(shù)據(jù)集上的訓(xùn)練,。

    • 過擬合風(fēng)險(xiǎn):如果數(shù)據(jù)量不足或不平衡,全參數(shù)訓(xùn)練可能導(dǎo)致模型過擬合于特定訓(xùn)練數(shù)據(jù),。

    • 快速訓(xùn)練:比全參數(shù)訓(xùn)練更快,,適合快速迭代和原型開發(fā)。

    • 減小過擬合風(fēng)險(xiǎn):微調(diào)部分參數(shù)可以降低過擬合風(fēng)險(xiǎn),。

    • 性能可能受限:在某些任務(wù)上,,性能可能略低于全參數(shù)訓(xùn)練。

    • 適用范圍有限:當(dāng)任務(wù)的性質(zhì)高度變化或與預(yù)訓(xùn)練任務(wù)顯著不同,,高效訓(xùn)練可能無法有效遷移已有的知識(shí),。

    1. 訓(xùn)練方式:阿里云百煉支持全參訓(xùn)練高效訓(xùn)練兩種方式,以下是選擇建議:

      訓(xùn)練方式

      優(yōu)點(diǎn)

      缺點(diǎn)

      全參訓(xùn)練



      高效訓(xùn)練



      高效訓(xùn)練能較好地平衡訓(xùn)練時(shí)長和訓(xùn)練效果,,一般建議您選擇高效訓(xùn)練,。

    2. 選擇模型:阿里云百煉支持基于預(yù)置模型或自定義模型的調(diào)優(yōu)。

      如果您是第一次訓(xùn)練模型,,建議選擇預(yù)置模型,;如果您調(diào)整了訓(xùn)練策略,希望基于已訓(xùn)練的模型進(jìn)行再次訓(xùn)練,,則可選擇自定義模型,。

      阿里云百煉提供了多種可調(diào)優(yōu)的預(yù)置模型,各模型特性請參閱模型調(diào)用,。

    3. 選擇訓(xùn)練數(shù)據(jù):選擇參與訓(xùn)練的數(shù)據(jù)集,,您在已上傳的數(shù)據(jù)集列表中選擇訓(xùn)練集。

      說明

      如果清洗或增強(qiáng)了數(shù)據(jù),,您需要注意數(shù)據(jù)集的名稱和版本,,以免誤選未經(jīng)處理的數(shù)據(jù)。

    4. 選擇驗(yàn)證數(shù)據(jù):選擇參與驗(yàn)證訓(xùn)練效果的數(shù)據(jù)集,,您可以選擇自動(dòng)切分或從數(shù)據(jù)列表中選擇驗(yàn)證集,。

      如果您沒有準(zhǔn)備驗(yàn)證數(shù)據(jù)集,建議選擇自動(dòng)切分,,阿里云百煉將從選定的訓(xùn)練集中劃分一部分?jǐn)?shù)據(jù)作為驗(yàn)證集,。反之,建議從數(shù)據(jù)列表中選擇驗(yàn)證集,。

      說明

      如果您清洗或增強(qiáng)了數(shù)據(jù),,您需要注意數(shù)據(jù)集的名稱和版本,,以免誤選未經(jīng)處理的數(shù)據(jù)。

    5. 混合訓(xùn)練:為了避免基礎(chǔ)模型能力的遺失并提高訓(xùn)練效果,,阿里云百煉支持您將自備的訓(xùn)練數(shù)據(jù)與預(yù)置通用數(shù)據(jù)混合訓(xùn)練,。您可以調(diào)整自備訓(xùn)練數(shù)據(jù)與預(yù)置通用數(shù)據(jù)的比例,如果所有類型的預(yù)置通用數(shù)據(jù)的比例設(shè)置為0,,您將不使用預(yù)置數(shù)據(jù),。

    6. 超參配置:模型的超參配置決定一定程度的模型調(diào)優(yōu)效果,您可按照自己的訓(xùn)練經(jīng)驗(yàn)進(jìn)行配置,。如果您不了解超參數(shù),,阿里云百煉也提供一套基于實(shí)驗(yàn)所得的默認(rèn)配置,您可以遵循默認(rèn)配置,。

    7. 開始訓(xùn)練:這一步將展示您的所有訓(xùn)練配置,,阿里云百煉會(huì)自動(dòng)計(jì)算預(yù)估的訓(xùn)練費(fèi)用(稍后您也可以在訓(xùn)練任務(wù)列表中瀏覽預(yù)估費(fèi)用明細(xì),實(shí)際產(chǎn)生費(fèi)用以生成賬單為準(zhǔn)),。待您確認(rèn)配置和價(jià)格信息無誤后即可開始訓(xùn)練,。

  3. 開始訓(xùn)練后,您可以在模型調(diào)優(yōu)列表中查看模型的訓(xùn)練進(jìn)度,、預(yù)估費(fèi)用和其他管理操作,。有關(guān)訓(xùn)練費(fèi)用的詳細(xì)信息,請參考產(chǎn)品計(jì)費(fèi),。

說明

小貼士:模型訓(xùn)練入門指南

如果您是大語言模型訓(xùn)練的新手,,以下是一些簡單且實(shí)用的小貼士,幫您輕松入門并提高訓(xùn)練效果:

  • 優(yōu)化學(xué)習(xí)率:

    • 簡單理解:學(xué)習(xí)率決定模型每次調(diào)整的步伐大小,。開始訓(xùn)練時(shí),,可以從較小的學(xué)習(xí)率(如0.001)開始,如果訓(xùn)練速度很慢或效果不好,,可以逐步增加,。

    • 如何調(diào)整:如果驗(yàn)證集性能沒有提升,可以嘗試調(diào)整學(xué)習(xí)率,,通??s小10倍或增加10倍是一個(gè)好的做法。

  • 選擇合適的批次大?。?/p>

    • 簡單理解:批次大小是每次訓(xùn)練中用來更新模型的樣本數(shù),。更大的批次大小可以提高訓(xùn)練效率。

    • 推薦設(shè)置:常見的批次大小是8,、16或32,,默認(rèn)選擇16.

  • 學(xué)習(xí)監(jiān)控?fù)p失和準(zhǔn)確率:

    • 簡單理解:損失(Loss)表示模型在訓(xùn)練數(shù)據(jù)上的誤差,準(zhǔn)確率(Accuracy)表示模型的性能,。如果損失一直下降而準(zhǔn)確率提升,,說明訓(xùn)練進(jìn)展順利,。

    • 如何操作:您可以進(jìn)入訓(xùn)練任務(wù)詳情頁,實(shí)時(shí)監(jiān)控訓(xùn)練過程中的損失和準(zhǔn)確率變化,。驗(yàn)證集上的損失可以幫助您決定是否需要調(diào)整超參數(shù),。

  • 簡單的數(shù)據(jù)增強(qiáng)方式:

    • 簡單理解:數(shù)據(jù)增強(qiáng)可以增加數(shù)據(jù)的多樣性,提高模型的泛化能力,。例如,,同義詞替換、隨機(jī)遮蓋等,。

    • 如何操作:在數(shù)據(jù)預(yù)處理階段,,進(jìn)行簡單的同義詞替換或其他文本增強(qiáng),。

管理訓(xùn)練任務(wù)

待您啟動(dòng)訓(xùn)練后,,您新建的模型訓(xùn)練任務(wù)將出現(xiàn)在模型調(diào)優(yōu)的列表里,其訓(xùn)練狀態(tài)將變更為訓(xùn)練中,。此時(shí),,您可點(diǎn)擊訓(xùn)練任務(wù)的查看操作進(jìn)入訓(xùn)練詳情頁,瀏覽訓(xùn)練任務(wù)的配置和訓(xùn)練的過程指標(biāo),。您可以點(diǎn)擊查看預(yù)估來瀏覽本次訓(xùn)練任務(wù)預(yù)估的計(jì)費(fèi)信息,。您也可以隨時(shí)點(diǎn)擊終止訓(xùn)練來結(jié)束訓(xùn)練任務(wù)。

訓(xùn)練過程指標(biāo)主要有以下三個(gè),,大致體現(xiàn)了模型的訓(xùn)練效果,。如果您不了解這些指標(biāo)的含義,也可以等待訓(xùn)練結(jié)束后,,使用阿里云百煉的模型評測工具評價(jià)訓(xùn)練效果,。

指標(biāo)

解釋

Training Loss

Training Loss 代表針對訓(xùn)練數(shù)據(jù)學(xué)習(xí)的擬合程度,曲線一般呈現(xiàn)下降趨勢,。Loss越小,,表示訓(xùn)練數(shù)據(jù)擬合程度越高。過小的Loss易導(dǎo)致數(shù)據(jù)過擬合,,需要根據(jù)實(shí)際訓(xùn)練過程進(jìn)行判斷,。

Validation Loss

Validation Loss代表針對驗(yàn)證集學(xué)習(xí)的擬合程度,曲線一般呈現(xiàn)先下降后上升趨勢,。Loss越小,,表示驗(yàn)證數(shù)據(jù)擬合程度越高。優(yōu)秀的模型效果往往出現(xiàn)Validation Loss的最小值節(jié)點(diǎn),,此時(shí)擬合程度最佳,,訓(xùn)練效果最好。

Validation Token Accuracy

Validation Token Acc代表針對驗(yàn)證集學(xué)習(xí)的準(zhǔn)確程度,,曲線一般呈現(xiàn)上升趨勢,。訓(xùn)練過擬合后,,該曲線會(huì)呈現(xiàn)下降趨勢。優(yōu)秀的模型效果往往出現(xiàn)在Validation Token Acc的最大值節(jié)點(diǎn),,此時(shí)預(yù)測準(zhǔn)確率最高,,訓(xùn)練效果最好。

一般情況下,,千條以下的數(shù)據(jù)訓(xùn)練所需的時(shí)長為2-3個(gè)小時(shí),。由于平臺(tái)承載能力有限,可能出現(xiàn)排隊(duì)狀態(tài),,還請您諒解,。訓(xùn)練任務(wù)完成后,列表及詳情頁中模型的狀態(tài)將變更為訓(xùn)練成功,,此時(shí)您已經(jīng)獲得自定義模型,,該模型已處于等待部署狀態(tài),您可以直接點(diǎn)擊模型部署跳轉(zhuǎn)到部署頁面,。

模型部署

待您獲得自定義模型后,,您需要將該模型部署到計(jì)算資源上,方可調(diào)用該模型,。

阿里云百煉提供了多種資源配置方式,,您可以按需選擇。如果需要評測模型的訓(xùn)練效果,,您需要先部署自定義模型,,再使用模型評測評估自定義模型的訓(xùn)練效果。

新建部署任務(wù)

  1. 登錄阿里云百煉控制臺(tái),,在左側(cè)導(dǎo)航欄中,,選擇模型工具 > 模型部署您也可以在模型工具 > 模型訓(xùn)練中等待模型訓(xùn)練結(jié)束后,,直接點(diǎn)擊模型部署,。這里展示了所有模型部署任務(wù)。

  2. 點(diǎn)擊部署新模型,,您將跟隨向?qū)У闹敢瓿刹渴鹋渲茫?/p>

    1. 選擇模型:阿里云百煉提供了兩類可部署的模型,,此處請您選擇之前訓(xùn)練的自定義模型

    2. 選擇資源配置:阿里云百煉提供了兩類資源配置方式,。包月資源是按月購買計(jì)算資源的方式,,不同版本的包月資源在部署模型的能力上有差別。按量付費(fèi)是按實(shí)際使用時(shí)長購買計(jì)算資源的方式,,您可以按需購買一定數(shù)量的計(jì)算資源,,也可以隨后變更計(jì)算資源的數(shù)量。為完成后續(xù)的模型評測,對訓(xùn)練效果做進(jìn)一步評估,,此處推薦您選擇按量付費(fèi),。

    3. 開始部署:這一步將展示您的所有部署配置和預(yù)估費(fèi)用,待您確認(rèn)所有信息后即可開始部署,。

  3. 開始部署后,,您可以在模型部署列表中查看模型的部署進(jìn)度、預(yù)估費(fèi)用和其他管理操作,。有關(guān)部署費(fèi)用的詳細(xì)信息,,請參考產(chǎn)品計(jì)費(fèi)

一般情況下,,模型部署時(shí)長在幾十分鐘到幾個(gè)小時(shí)不等,,由于阿里云百煉資源限制,部署可能會(huì)產(chǎn)生隊(duì)列,,部署完成后,,狀態(tài)將變?yōu)檫\(yùn)行中,運(yùn)行中的模型可被調(diào)用,,用于模型評測及應(yīng)用調(diào)用,。

說明

小貼士:實(shí)例管理與性能優(yōu)化

什么是實(shí)例:

  • 簡單定義:實(shí)例是運(yùn)行模型和處理請求的獨(dú)立計(jì)算單元,通常對應(yīng)一臺(tái)服務(wù)器,、一塊GPU,或在容器化環(huán)境中對應(yīng)一個(gè)容器,。

  • 實(shí)例用途:實(shí)例用于將模型加載到內(nèi)存中,,接受用戶請求,執(zhí)行推理任務(wù)(如文本生成,、分類等),,并返回結(jié)果。

實(shí)例數(shù)量對性能的影響:

  • 響應(yīng)時(shí)間:增加實(shí)例數(shù)量能有效分擔(dān)負(fù)載,,降低每個(gè)實(shí)例處理請求的時(shí)間,,提高整體響應(yīng)速度。

  • 并發(fā)處理:更多實(shí)例可以并行處理更多請求,,提高系統(tǒng)的并發(fā)處理能力,。

  • 成本效益:增加實(shí)例數(shù)量能提高性能和用戶體驗(yàn),但成本可能增加,,需要權(quán)衡,。

管理部署任務(wù)

待您啟動(dòng)部署后,您新建的模型部署任務(wù)將出現(xiàn)在模型部署的列表里,,其部署狀態(tài)將變更為部署中,。此時(shí),您可點(diǎn)擊部署任務(wù)的查看操作瀏覽部署任務(wù)的配置,。您可以點(diǎn)擊擴(kuò)縮容來變更計(jì)算資源的用量,。您也可以隨時(shí)點(diǎn)擊下線來結(jié)束部署任務(wù),。

待部署完成后,其部署狀態(tài)將變更為運(yùn)行中,。此時(shí)您訓(xùn)練的自定義模型已經(jīng)具備了推理調(diào)用的能力,。您可以點(diǎn)擊去體驗(yàn),在模型體驗(yàn)頁面測試您的自定義模型推理效果,。此時(shí),,您可以使用模型評測對自定義模型的效果做評估。

模型評測

完成模型部署后,,如需測試模型的效果,,可在模型評測中進(jìn)行評測。對于本篇介紹的自定義模型,,阿里云百煉提供了基線評測方法,。基線評測預(yù)置多種常用的能力評測集及評測腳本,可自動(dòng)評測模型多種基本能力,。

新建評測任務(wù)

  1. 登錄阿里云百煉控制臺(tái),,在左側(cè)導(dǎo)航欄中,選擇模型工具 > 模型評測,。這里展示了所有模型評測任務(wù),。

  2. 點(diǎn)擊創(chuàng)建評測任務(wù),您將遵循向?qū)瓿稍u測任務(wù)的配置:

    1. 評測方式:阿里云百煉提供了多種評測方式,。對于自定義模型,,請您選擇基線評測。

    2. 選擇模型:請?jiān)谙吕蛑羞x擇已部署的目標(biāo)評測模型,。

    3. 選擇評測數(shù)據(jù):阿里云百煉預(yù)置了基線評測集(包括C-Eval/CMMLU等主流榜單評測集)對待測模型的各項(xiàng)基礎(chǔ)通用能力進(jìn)行自動(dòng)評測,。您可以任選評測數(shù)據(jù),以此構(gòu)建您的所有評測數(shù)據(jù),。

    4. 開始評測:這一步將展示您的所有評測配置和預(yù)估費(fèi)用,,待您確認(rèn)所有信息后即可開始評測。

  3. 開始評測后,,您可以在模型評測列表中查看模型的評測進(jìn)度,、預(yù)估費(fèi)用和其他管理操作。有關(guān)評測費(fèi)用的詳細(xì)信息,,請參考產(chǎn)品計(jì)費(fèi),。

管理評測任務(wù)

當(dāng)評測開始后,該評測任務(wù)的狀態(tài)將變更為執(zhí)行中隊(duì)列中,,您可以隨時(shí)點(diǎn)擊中止來結(jié)束評測,。待評測完成后,您可以點(diǎn)擊結(jié)果查看詳細(xì)的評測結(jié)果。您可以點(diǎn)擊刪除刪去一項(xiàng)評測任務(wù),。

后續(xù)操作

至此,,本篇已經(jīng)介紹了自定義模型調(diào)優(yōu)、部署與評測的全生命周期管理,。閱讀完本篇后,,您可以自行創(chuàng)建一個(gè)自定義模型,并能夠在業(yè)務(wù)場景中調(diào)用該自定義模型,。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn),。請注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多