選擇GPT-3.5、還是微調Llama 2等開源模型？綜合比較後答案有了-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

選擇GPT-3.5、還是微調Llama 2等開源模型？綜合比較後答案有了

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Oct 16, 2023 pm 02:17 PM

ai 數據

眾所周知，對 GPT-3.5 進行微調是非常昂貴的。本文透過實驗來驗證手動微調模型是否可以接近 GPT-3.5 的效能，而成本只是 GPT-3.5 的一小部分。有趣的是，本文確實做到了。

在SQL 任務和functional representation 任務上的結果對比，本文發現：

GPT-3.5 在兩個資料集（Spider 資料集的子集以及Viggo functional representation 資料集）上都比經過Lora 微調的Code Llama 34B 表現略微好一點。
GPT-3.5 的訓練成本高出 4-6 倍，部署成本也更高。

本實驗的結論之一是微調GPT-3.5 適用於初始驗證工作，但在那之後，像Llama 2 這樣的模型可能是最佳選擇，簡單總結一下：

如果你想驗證微調是解決特定任務/ 資料集的正確方法，又或者想要一個完全託管的環境，那麼微調GPT-3.5。
如果想省錢、想從數據集中獲取最大性能、想要在訓練和部署基礎設施方面具有更大的靈活性、又或者想要保留一些私有數據，那就微調類似Llama 2 的這種開源模型。

接下來我們來看看，本文是如何實現的。

下圖為 Code Llama 34B 和 GPT-3.5 在 SQL 任務和 functional representation 任務上訓練至收斂的效能。結果表明，GPT-3.5 在這兩個任務上都取得了更好的準確率。

选择GPT-3.5、还是微调Llama 2等开源模型？综合比较后答案有了

在硬體使用上，實驗使用的是 A40 GPU，每小時約 0.475 美元。

选择GPT-3.5、还是微调Llama 2等开源模型？综合比较后答案有了

此外，實驗選取了兩個非常適合進行微調的資料集，Spider 資料集的子集以及Viggo functional representation 資料集。

為了與 GPT-3.5 模型進行公平的比較，實驗對 Llama 進行了最少超參數微調。

本文實驗的兩個關鍵選擇是使用 Code Llama 34B 和 Lora 微調，而不是全參數微調。

實驗在很大程度上遵循了有關Lora 超參數微調的規則，Lora 適配器配置如下：

选择GPT-3.5、还是微调Llama 2等开源模型？综合比较后答案有了

SQL 提示範例如下：

选择GPT-3.5、还是微调Llama 2等开源模型？综合比较后答案有了

#SQL 提示部分展示，完整提示請查看原始部落格

實驗沒有使用完整的Spider 資料集，具體形式如下

department : Department_ID [ INT ] primary_key Name [ TEXT ] Creation [ TEXT ] Ranking [ INT ] Budget_in_Billions [ INT ] Num_Employees [ INT ] head : head_ID [ INT ] primary_key name [ TEXT ] born_state [ TEXT ] age [ INT ] management : department_ID [ INT ] primary_key management.department_ID = department.Department_ID head_ID [ INT ] management.head_ID = head.head_ID temporary_acting [ TEXT ]

登入後複製

實驗選擇使用sql-create-context 資料集和Spider 資料集的交集。為模型提供的上下文是一個SQL 建立命令，如下所示：

CREATE TABLE table_name_12 (class VARCHAR, frequency_mhz VARCHAR, city_of_license VARCHAR)

登入後複製

#SQL 任務的程式碼和資料位址：https://github.com/samlhuillier/spider-sql- finetune

functional representation 提示的範例如下：

选择GPT-3.5、还是微调Llama 2等开源模型？综合比较后答案有了

##functional representation 提示部分展示，完整提示請查看原始部落格

輸出如下：

verify_attribute(name[Little Big Adventure], rating[average], has_multiplayer[no], platforms[PlayStation])

登入後複製

##評估階段，兩個實驗很快就收斂了：

选择GPT-3.5、还是微调Llama 2等开源模型？综合比较后答案有了

functional representation 任務代碼與資料位址：https://github.com/samlhuillier/viggo-finetune

#了解更多內容，請查看原始部落格。

以上是選擇GPT-3.5、還是微調Llama 2等開源模型？綜合比較後答案有了的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

Java教學

1664

CakePHP 教程

1423

Laravel 教程

1321

PHP教程

1269

C# 教程

1249

Related knowledge

C 中的chrono庫如何使用？ Apr 28, 2025 pm 10:18 PM

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔，讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分，它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說，chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性，還提供了更高的精度和靈活性。讓我們從基礎開始，chrono庫主要包括以下幾個關鍵組件：std::chrono::system_clock：表示系統時鐘，用於獲取當前時間。 std::chron

如何理解C 中的DMA操作？ Apr 28, 2025 pm 10:09 PM

DMA在C 中是指DirectMemoryAccess，直接內存訪問技術，允許硬件設備直接與內存進行數據傳輸，不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序，實現方式因係統而異。 2)直接訪問內存可能帶來安全風險，需確保代碼的正確性和安全性。 3)DMA可提高性能，但使用不當可能導致系統性能下降。通過實踐和學習，可以掌握DMA的使用技巧，在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

怎樣在C 中處理高DPI顯示？ Apr 28, 2025 pm 09:57 PM

在C 中處理高DPI顯示可以通過以下步驟實現：1)理解DPI和縮放，使用操作系統API獲取DPI信息並調整圖形輸出；2)處理跨平台兼容性，使用如SDL或Qt的跨平台圖形庫；3)進行性能優化，通過緩存、硬件加速和動態調整細節級別來提升性能；4)解決常見問題，如模糊文本和界面元素過小，通過正確應用DPI縮放來解決。

C 中的實時操作系統編程是什麼？ Apr 28, 2025 pm 10:15 PM

C 在實時操作系統（RTOS）編程中表現出色，提供了高效的執行效率和精確的時間管理。 1）C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2）利用面向對象特性，C 可以設計靈活的任務調度系統。 3）C 支持高效的中斷處理，但需避免動態內存分配和異常處理以保證實時性。 4）模板編程和內聯函數有助於性能優化。 5）實際應用中，C 可用於實現高效的日誌系統。

怎樣在C 中測量線程性能？ Apr 28, 2025 pm 10:21 PM

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析，步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析，步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能，並優化代碼。

量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 Apr 30, 2025 pm 07:24 PM

交易所內置量化工具包括：1. Binance（幣安）：提供Binance Futures量化模塊，低手續費，支持AI輔助交易。 2. OKX（歐易）：支持多賬戶管理和智能訂單路由，提供機構級風控。獨立量化策略平台有：3. 3Commas：拖拽式策略生成器，適用於多平台對沖套利。 4. Quadency：專業級算法策略庫，支持自定義風險閾值。 5. Pionex：內置16 預設策略，低交易手續費。垂直領域工具包括：6. Cryptohopper：雲端量化平台，支持150 技術指標。 7. Bitsgap：

給MySQL表添加和刪除字段的操作步驟 Apr 29, 2025 pm 04:15 PM

在MySQL中，添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column，刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時，需指定位置以優化查詢性能和數據結構；刪除字段前需確認操作不可逆；使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。

C 中的字符串流如何使用？ Apr 28, 2025 pm 09:12 PM

C 中使用字符串流的主要步驟和注意事項如下：1.創建輸出字符串流並轉換數據，如將整數轉換為字符串。 2.應用於復雜數據結構的序列化，如將vector轉換為字符串。 3.注意性能問題，避免在處理大量數據時頻繁使用字符串流，可考慮使用std::string的append方法。 4.注意內存管理，避免頻繁創建和銷毀字符串流對象，可以重用或使用std::stringstream。

See all articles

選擇GPT-3.5、還是微調Llama 2等開源模型？綜合比較後答案有了

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題