首頁 > 科技週邊 > 人工智慧 > 微調GPT-4O MINI:逐步指南

微調GPT-4O MINI:逐步指南

William Shakespeare
發布: 2025-03-03 09:20:09
原創
1021 人瀏覽過

>本教程展示了對社交媒體文本中的壓力檢測的經濟高效的GPT-4O Mini大型語言模型的微調。 我們將利用OpenAI API和操場進行微調和評估,比較過程前後的性能。

Fine-tuning GPT-4o Mini: A Step-by-Step Guide

>引入gpt-4o mini: GPT-4O Mini脫穎而出,是一種高度負擔得起的通用LLM。 在MMLU基準測試中獲得82%的得分,並在聊天偏好(LMSYS排行榜)中超過Claude 3.5十四行詩,可節省大量成本(比GPT-3.5 Turbo便宜60%),每百萬個輸入令牌和60美分的每百萬分品代幣。 它接受文本和圖像輸入,具有128K令牌上下文窗口,支持多達16K的輸出令牌,其知識截止為2023年10月。由於GPT-4O令牌的兼容性,它與非英語文本的兼容性增加了其多功能性。 要更深入地了解GPT-4O Mini,請探索我們的博客文章:“什麼是GPT-4O Mini?”>

設置OpenAI API:

>

創建一個OpenAI帳戶。 微調會產生費用,因此在繼續之前,請確保至少10美元。 >

>從儀表板的“ API鍵”選項卡中生成一個OpenAI API秘密鍵。
  1. >將API密鑰配置為環境變量(此示例中使用了Datacamp的Datalab)。
  2. >
  3. 安裝OpenAi Python軟件包:
  4. >
  5. 創建一個OpenAI客戶端並使用示例提示進行測試。
  6. %pip install openai

Fine-tuning GPT-4o Mini: A Step-by-Step Guide 新的API?我們的“ GPT-4O API教程:開始使用OpenAI的API開始”提供了全面的介紹。 Fine-tuning GPT-4o Mini: A Step-by-Step Guide 用於應力檢測的微調GPT-4O mini:Fine-tuning GPT-4o Mini: A Step-by-Step Guide

我們將使用標記為“壓力”或“無壓力”的Reddit和Twitter帖子的Kaggle數據集微調GPT-4O Mini。

1。數據集創建:

加載並處理數據集(例如,Reddit Post DataSet的前200行)。

>僅保留“標題”和“標籤”列。
    >
  • 映射數值標籤(0,1)為“無壓力”和“壓力”。
  • >分為訓練和驗證集(80/20拆分)。
  • >
  • >以JSONL格式保存兩個集,確保每個條目都包含系統提示,用戶查詢(帖子標題)和“助手”響應(Label)。
  • 2。數據集上傳:
  • 使用OpenAI客戶端上傳培訓和驗證JSONL文件。

    3。微調作業啟動:

    >創建一個微調作業,指定文件ID,模型名稱(gpt-4o-mini-2024-07-18)和超參數(例如,3個時代,批處理尺寸3,學習率乘數0.3)。 通過儀表板或API監視作業的狀態。

    >

    Fine-tuning GPT-4o Mini: A Step-by-Step Guide Fine-tuning GPT-4o Mini: A Step-by-Step Guide Fine-tuning GPT-4o Mini: A Step-by-Step Guide

    >訪問微型模型:>

    >從API中檢索微調的模型名稱,並使用它通過API或OpenAI Playground生成預測。

    Fine-tuning GPT-4o Mini: A Step-by-Step Guide Fine-tuning GPT-4o Mini: A Step-by-Step Guide

    模型評估:

    >使用精度,分類報告和驗證集中的混淆矩陣比較基本和微調模型。 自定義

    函數會生成預測,predict>函數提供了性能指標。 > evaluate

    結論:

    本教程提供了微調GPT-4O mini的實用指南,展示了其在提高文本分類準確性方面的有效性。 請記住要探索鏈接的資源以獲取更多詳細信息和替代方法。 對於免費的開源替代方案,請考慮我們的“微調Llama 3.2並在本地使用它”教程。

以上是微調GPT-4O MINI:逐步指南的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板