OpenAI的最新語言模型GPT-3.5 Turbo代表了大型語言模型功能的一個重大飛躍。 GPT-3.5 Turbo建立在GPT-3模型家族的基礎上,可以產生非常類似於人類的文本,同時比以前的版本更實惠和更容易獲得。但是,GPT-3.5 Turbo的真正力量在於它通過稱為微調的過程來定制的能力。
微調使開發人員可以攜帶自己的數據以使模型適應特定的用例,並顯著提高專業任務的性能。通過微調,GPT-3.5 Turbo在某些狹窄的應用中甚至已經匹配或超過GPT-4。
>這種新的自定義級別釋放了企業和開發人員部署GPT-3.5 Turbo的潛力,以創建量身定制的高性能AI應用程序。隨著GPT-3.5 Turbo和今年晚些時候更強大的GPT-4的微調可用,我們站在Applied AI的新時代的風口浪尖。為什麼要微調語言模型?
>>微調已成為從GPT-3.5 Turbo等大型語言模型中獲得最大收益的關鍵技術。例如,我們有一個單獨的指南,以微調GPT-3。
>預先訓練的模型可以從開箱即用產生非常類似的人類文本,但通過微調來解鎖其真正的功能。該過程使開發人員可以通過對特定於域的數據進行訓練來自定義該模型,從而將其調整為專用用例,而不是通用培訓可以實現的。微調改善了模型的利基應用程序的相關性,準確性和性能。微調使開發人員可以自定義模型以創建獨特的和差異化的體驗,從而滿足特定的要求和域。通過對特定於域數據的模型訓練模型,它可以為該利基生成更相關和準確的輸出。這種自定義級別使企業能夠構建量身定制的AI應用程序。
>提高了可恢復性和可靠性
增強性能
1。增強的可指導性
2。一致的響應結構
可以使用微調來使模型的響應與公司的獨特聲音或風格更加緊密地保持一致。具有獨特品牌聲音的公司可以利用此功能來確保模型的基調與其品牌的本質相匹配。 微調
的先決條件 通過在您自己的數據上繼續培訓過程,>
接下來,您需要準備一個數據集進行微調。這涉及策劃文本提示的示例和所需的模型響應。數據應匹配您的應用程序將使用該模型的格式。清潔和格式化到所需的JSONL結構中也很重要。>一旦驗證,您就可以將數據上傳到OpenAI服務器。
>最後,您通過API啟動微調作業,選擇基本GPT-3.5>渦輪模型並傳遞培訓數據文件。微調過程可能需要數小時或幾天,具體取決於數據大小。您可以通過API監視培訓進度。
>如何微調Openai GPT 3.5-Turbo型號:逐步指南
> OpenAI最近發布了用於微調語言模型的UI接口。在本教程中,我將使用OpenAI UI創建一個微調的GPT模型。要跟隨這一部分,您必須擁有一個OpenAI帳戶和鑰匙。
>
>用於演示,我已經策劃了一個小問題答案數據集,目前將其存儲為pandas dataframe。
只是為了展示我的所作所為,我以莎士比亞風格創建了50個機器學習問題及其答案。通過這項微調工作,我個性化GPT3.5-Turbo模型的風格和音調。
>即使不是一個非常實用的用例,您可能會在提示中簡單地添加“莎士比亞風格的答案”,但GPT3.5肯定會意識到莎士比亞,並且會以所需的音調產生答案。
對於OpenAI,數據必須以JSONL格式為JSONL。 JSONL是一種格式,其中每行都是有效的JSON對象,被Newlines隔開。我寫了一個簡單的代碼將pd.dataframe轉換為jsonl。這是我的JSONL文件的樣子:
import json import pandas as pd DEFAULT_SYSTEM_PROMPT = 'You are a teaching assistant for Machine Learning. You should help the user to answer his question.' def create_dataset(question, answer): return { "messages": [ {"role": "system", "content": DEFAULT_SYSTEM_PROMPT}, {"role": "user", "content": question}, {"role": "assistant", "content": answer}, ] } if __name__ == "__main__": df = pd.read_csv("path/to/file.csv", encoding='cp1252') with open("train.jsonl", "w") as f: for _, row in df.iterrows(): example_str = json.dumps(create_dataset(row["Question"], row["Answer"])) f.write(example_str + "\n")
3。創建微調作業
選擇基本模型。截至目前,只有3種型號可用於微調(Babbage-002,Davinci-002,GPT-3.5-Turbo-0613)。
接下來,只需上傳JSONL文件,命名作業名稱,然後單擊創建。 根據數據集的大小,調整作業可能需要幾個小時甚至幾天。在我的示例中,數據集只有5,500個令牌,經過6個小時的微調。這項工作的成本微不足道(< $ 1 = 5,500/1000 x $ 0.08)。
>本教程顯示瞭如何使用UI微調GPT模型。如果您想學習如何使用API學習相同的事情,請使用DataCamp上的Zoumana Keita使用OpenAI API和Python教程查看微調GPT-3。
4。使用微調模型調整作業完成後,您現在可以通過API進行微調模型或在Platform.openai.com上使用可用的操場。
請注意,在模型下拉下,現在有一個個人3.5-Turbo可供選擇。讓我們嘗試一下。
注意響應的語氣和風格。
如果您想學習如何與OpenAi Python軟件包合作以與Chatgpt進行對話,請在Datacamp上的Python博客中使用OpenAI API查看GPT-3.5和GPT-4。
OpenAi認真對待安全性,並在發布新模型之前具有嚴格的過程,包括測試,專家反饋,改善模型行為和監視系統的技術。他們的目的是使強大的AI系統有益並最大程度地降低可預見的風險。
>微調允許自定義諸如GPT-3.5 Turbo之類的型號,同時保留重要的安全功能。 OpenAI在多個級別採用乾預措施 - 測量,模型更改,策略,監視 - 以減輕風險和對齊模型。
OpenAi從可行的培訓數據中刪除了個人信息,並製定了不針對與私人信息產生內容的政策。這可以最大程度地減少隱私風險。對於沒有敏感數據的常見用例,可以安全地利用OpenAI模型。但是,對於專有或受監管的數據,可能會優選諸如數據混淆,私人AI處理器或內部模型之類的選項。
>微調GPT 3.5-Turbo
的成本
Total = $112 per day or $3,360 per month
>在對應用程序進行微調以符合不同要求的應用程序中,指導性,響應結構和音調個性化的增強功能是顯而易見的,從而使企業能夠帶來獨特的AI驅動體驗。但是,擁有強大的力量帶來了巨大的責任。在實施生成的AI和語言模型時,了解相關成本並註意安全和隱私注意事項至關重要。
>使用數據科學的ChatGPT備忘單提示60個CHATGPT提示數據科學任務。
以上是如何微調GPT 3.5:解鎖AI的全部潛力的詳細內容。更多資訊請關注PHP中文網其他相關文章!