首頁 > 後端開發 > Python教學 > 提交微調工作:組織勞動力

提交微調工作:組織勞動力

DDD
發布: 2025-01-06 16:44:40
原創
768 人瀏覽過

Submitting a Fine-Tuning Job: Organising the Workforce

六三八依靠紀律和協調來執行任務。我們將透過創建和提交微調作業來反映這一點,允許法學碩士從我們策劃的資料集中學習。

使用 OpenAI 進行微調

當您透過 client.fine_tuning.job.create() 建立微調作業時,您將設定和資料集提交給 OpenAI 進行訓練。以下是關鍵參數及其用途。


1. 參數概述

模型

  • 描述:您想要微調的預訓練 GPT 模型。
  • :「gpt-3.5-turbo」、「davinci」、「gpt-4-mini」(假設)。

訓練文件

  • 描述:包含訓練資料的已上傳 JSONL 檔案的檔案 ID。
  • 注意:透過使用檔案 API 上傳資料集並儲存 file_id 來取得此 ID。

超參數

  • 描述:指定微調超參數的字典。
  • 關鍵字段
    • batch_size:每批的範例數(預設為自動)。
    • Learning_rate_multiplier:學習率的比例因子(預設為自動)。
    • n_epochs:紀元數(穿過整個資料集)。

後綴

  • 描述:附加到微調模型名稱後的自訂字串(最多 18 個字元)。

種子

  • 描述:用於再現性的整數。
  • 用法:確保運行中具有相同的隨機化和一致的訓練結果。

驗證文件

  • 描述:包含驗證集的 JSONL 檔案的檔案 ID。
  • 可選:但建議用於追蹤過度擬合並確保良好泛化的模型。

整合

  • 描述:您希望為作業啟用的整合清單(例如權重和偏差)。
  • 欄位:通常包括類型和特定於整合的配置。

client.fine_tuning.job.create(
    model="gpt-3.5-turbo",
    training_file="train_id",
    hyperparameters={
        "n_epochs": 1
    },
    validation_file="val_id"
)
登入後複製

管理微調作業
檢索最多 10 個微調作業。

client.fine_tuning.jobs.list(limit=10)

登入後複製

檢索特定工作

client.fine_tuning.retrieve("job_id")


登入後複製

列出作業的事件

client.fine_tuning.list_events(
    fine_tuning_job_id="xxxx",
    limit=5
)
登入後複製

總結

  • 模型選擇:選擇適合的GPT模型進行微調。

  • 資料準備:上傳 JSONL 檔案並記下其 ID。

  • 超參數:調整批次大小、學習率和週期以獲得最佳效能。

  • 監控:使用驗證文件、作業擷取和事件記錄來確保您的模型有效訓練。

  • 再現性:如果一致的結果對您的工作流程很重要,請設定種子。

  • 透過執行這些步驟,您將擁有在 OpenAI 中提交和管理微調作業的清晰路徑,確保您的模型根據自訂資料進行精確訓練。

以上是提交微調工作:組織勞動力的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:dev.to
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板