微調在建立有價值的人工智慧工具中起著至關重要的作用。這種使用更有針對性的資料集精煉預訓練模型的過程可使用戶大大增加模型對專業內涵的理解,允許使用者為特定任務的模型增加現成知識。
雖然這個過程可能需要時間,但與從頭開始訓練模型相比,它的成本效益通常要高三倍。這一數值正如OpenAI最近宣布擴展其自訂模型程式以及為其微調API提供各種新功能所反映的那樣。
OpenAI於2023年8月首次宣布推出針對GPT-3的自助微調API,並受到了AI社群的熱烈響應。根據OpenAI報告稱,成千上萬的團體已經利用API來訓練成千上萬的模型,例如利用特定的程式語言產生程式碼,將文字總結為特定的格式,或根據使用者行為創建個人化的內容。
自從2023年8月開始,工作配對和招募平台Indeed取得了重大成功。為了將求職者與相關的空缺職位相匹配,Indeed向用戶發送個人化推薦。透過微調GPT 3.5 Turbo以產生更準確的流程解釋,並能夠將提醒中的令牌數量減少80%。這使得該公司每月發送給求職者的信息從不足100萬條增加到大約2000萬條。
新微調API特性建立在這個成功的基礎上,希望為未來的使用者改進功能:
基於epoch的檢查點創建:在每個訓練epoch自動產生一個完整的微調模型檢查點,這減少了後續再訓練的需要,特別是在過度擬合的情況下。
Comparity Playground:一個新的平行Playground UI,用於比較模型品質和效能,允許手動評估多個模型的輸出或針對單一提示進行微調快照。
第三方整合:支援與第三方平台的整合(從權限重和偏差開始),使開發人員能夠將詳細的微調資料共享給堆疊的其餘部分。
綜合驗證指標:能夠計算整個驗證資料集的損失和準確性等指標,從而更好地了解模型品質。
超級參數配置:能夠從儀表板配置可用的超級參數(而不僅僅是透過API或SDK)。
微調儀表板改進:包含配置超級參數、查看更詳細的訓練指標以及從先前的配置中重新運行作業的能力。
基於過去的成功,OpenAI相信這些新功能將使開發人員對他們的微調工作有更細粒度的控制。
OpenAI還在2023年11月在DevDay上發布的基礎上,改進了自訂模型計畫。其中一個主要變化是輔助微調的出現,這是一種利用API微調之外的有價值技術的手段,例如在更大範圍內添加額外的超級參數和各種參數有效微調(PEFT)方法。
SK電信就是充分發揮這項服務潛力的一個例子。這家電信業者在韓國擁有超過3,000萬用戶,因此他們希望客製化一種可以充當電信客戶服務專家的人工智慧模式。
透過與OpenAI合作對GPT-4進行微調,使其專注於韓國電信相關的對話,SK電信的對話摘要品質提高了35%,意圖識別準確率提高了33%。當他們的新微調模型與廣義GPT-4進行比較時,他們的滿意度得分也從3.6提高到4.5(滿分5分)。
OpenAI也引入了為需要深度微調的特定領域知識模型的公司建立客製化模型的能力。與法律人工智慧公司Harvey的合作證明了這項功能的價值。法律工作需要大量閱讀密集的文件,Harvey想用LLMs(大型語言模型)從這些文件中綜合信息,並將其提交給律師進行審查。然而,許多法律是複雜的,並且依賴上下文,Harvey希望與OpenAI合作建立一個客製化訓練的模型,該模型可以將新的知識和推理方法納入基本模型。
Harvey與OpenAI合作,增加了相當於100億代幣的資料來客製化訓練這個判例法模型。透過增加必要的背景深度來做出明智的法律判斷,結果模型的事實性回答提高了83%。
人工智慧工具從來都不是「包治百病」的解決方案。可客製化是這項技術有用性的核心,OpenAI在微調和客製化訓練模型方面的工作將有助於擴展已經從該工具中獲得的組織。
以上是OpenAI提供新的微調和自訂選項的詳細內容。更多資訊請關注PHP中文網其他相關文章!