選擇GPT-3.5、還是喬丹Llama 2等開源模型？綜合比較後答案有了-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

選擇GPT-3.5、還是喬丹Llama 2等開源模型？綜合比較後答案有了

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Oct 16, 2023 pm 06:45 PM

gpt-3.5 工程 llama 2

透過對 GPT-3.5 和 Llama 2 在不同任務上的參數對比，我們可以得知在什麼情況下選擇 GPT-3.5，在什麼情況下選擇 Llama 2 或其他模型。

顯然，對 GPT-3.5 進行的扭力是非常昂貴的。本文透過實驗來驗證手動扭矩模型是否可以接近 GPT-3.5 的性能，而只是成本 GPT-3.5 的一部分。有趣的是，論文確實做到了。

在SQL任務和函數表示任務上的結果對比，論文發現：

GPT-3.5在兩個資料集（Spider資料集的子集以及Viggo函數表示資料集）上都比經過Lora的Code Llama 34B表現輕微好一點。
GPT-3.5 的訓練成本高出4-6倍，部署成本也更高。

本實驗的結論之一是GPT-3.5適用於初始驗證工作，但之後，像Llama 2這樣的模型可能是最佳選擇，簡單總結一下：

如果您希望驗證是解決特定任務/資料集的正確方法，又或想要一個完全託管的環境，那麼調整GPT-3.5。
如果想省錢、想從資料集中獲取最大效能、想要在訓練和部署基礎設施方面具有更大的靈活性、又想要或保留一些數據，那麼就消耗類似Llama 2 的這種開源模型。

接下來我們來看看，論文是如何實現的。

下圖為 Code Llama 34B 和 GPT-3.5 在 SQL 任務和函數表示任務上訓練至收斂的效能。結果表明，GPT-3.5 在這兩個任務上都取得了更好的準確率。

在硬體使用上，實驗使用的是A40 GPU，約合0.475美元。

选择GPT-3.5、还是乔丹Llama 2等开源模型？综合比较后答案有了

另外，實驗列舉了兩個非常適合進行可怕的資料集，Spider 資料集的子集 Viggo 函數表示資料集。

為了與 GPT-3.5 模型進行公平的比較，實驗對 Llama 進行了最少的超參數。

本文實驗的兩個關鍵選擇是使用 Code Llama 34B 和 Lora 參數，而不是全參數參數。

實驗中很大程度上遵循了Lora超參數配置的規則，Lora負載如下：

选择GPT-3.5、还是乔丹Llama 2等开源模型？综合比较后答案有了

SQL提示範例如下：

选择GPT-3.5、还是乔丹Llama 2等开源模型？综合比较后答案有了

^{SQL#中顯示，完整提示時請參閱原始部落格 SQL不同部分中展示，完整提示請參閱原始部落格「原文}#」#Spi#der##pder#ad#der#’形式如下

department : Department_ID [ INT ] primary_key Name [ TEXT ] Creation [ TEXT ] Ranking [ INT ] Budget_in_Billions [ INT ] Num_Employees [ INT ] head : head_ID [ INT ] primary_key name [ TEXT ] born_state [ TEXT ] age [ INT ] management : department_ID [ INT ] primary_key management.department_ID = department.Department_ID head_ID [ INT ] management.head_ID = head.head_ID temporary_acting [ TEXT ]

登入後複製

實驗選擇使用sql-create-context資料集和Spider資料集的交集。為模型提供的上下文是一個SQL建立命令，如下所示：

CREATE TABLE table_name_12 (class VARCHAR, frequency_mhz VARCHAR, city_of_license VARCHAR)

登入後複製

SQL任務的程式碼和資料位址：https://github.com/samlhuillier/spider-sql- finetune

函數表示提示的範例如下：

选择GPT-3.5、还是乔丹Llama 2等开源模型？综合比较后答案有了

^{##輸出如下：}

verify_attribute(name[Little Big Adventure], rating[average], has_multiplayer[no], platforms[PlayStation])

登入後複製

評估階段，兩個實驗很快就收斂了：

#函數表示任務程式碼和資料位址：https://github.com/samlhuillier/viggo-finetune

选择GPT-3.5、还是乔丹Llama 2等开源模型？综合比较后答案有了了解更多內容，請查看原始部落格。

原文連結：

#https://ragntune.com/blog/gpt3.5-vs-llama2 -finetuning?continueFlag=11fc7786e20d498fc4daa79c5923e198

以上是選擇GPT-3.5、還是喬丹Llama 2等開源模型？綜合比較後答案有了的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

gmail信箱登陸入口在哪裡

7814

Java教學

1646

CakePHP 教程

1402

Laravel 教程

1300

PHP教程

1237

Related knowledge

ControlNet作者又出爆款！一張圖生成繪畫全過程，兩天狂攬1.4k Star Jul 17, 2024 am 01:56 AM

同樣是圖生視頻，PaintsUndo走出了不一樣的路線。 ControlNet作者LvminZhang又開始整活了！這次瞄準繪畫領域。新項目PaintsUndo剛上線不久，就收穫1.4kstar（還在瘋狂漲）。項目地址：https://github.com/lllyasviel/Paints-UNDO透過這個項目，用戶輸入一張靜態圖像，PaintsUndo就能自動幫你生成整個繪畫的全過程視頻，從線稿到成品都有跡可循。繪製過程，線條變化多端甚是神奇，最終視頻結果和原始圖像非常相似：我們再來看一個完整的繪

登頂開源AI軟體工程師榜首，UIUC無Agent方案輕鬆解決SWE-bench真實程式設計問題 Jul 17, 2024 pm 10:02 PM

AIxiv專欄是本站發布學術、技術內容的欄位。過去數年，本站AIxiv專欄接收通報了2,000多篇內容，涵蓋全球各大專院校與企業的頂尖實驗室，有效促進了學術交流與傳播。如果您有優秀的工作想要分享，歡迎投稿或聯絡報道。投稿信箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com這篇論文的作者皆來自伊利諾大學香檳分校（UIUC）張令明老師團隊，包括：StevenXia，四年級博士生，研究方向是基於AI大模型的自動代碼修復；鄧茵琳，四年級博士生，研究方

從RLHF到DPO再到TDPO，大模型對齊演算法已經是「token-level」 Jun 24, 2024 pm 03:04 PM

AIxiv專欄是本站發布學術、技術內容的欄位。過去數年，本站AIxiv專欄接收通報了2,000多篇內容，涵蓋全球各大專院校與企業的頂尖實驗室，有效促進了學術交流與傳播。如果您有優秀的工作想要分享，歡迎投稿或聯絡報道。投稿信箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com在人工智慧領域的發展過程中，對大語言模型（LLM）的控制與指導始終是核心挑戰之一，旨在確保這些模型既強大又安全地服務人類社會。早期的努力集中在透過人類回饋的強化學習方法（RL

OpenAI超級對齊團隊遺作：兩個大模型博弈一番，輸出更好懂了 Jul 19, 2024 am 01:29 AM

如果AI模型給的答案一點也看不懂，你敢用嗎？隨著機器學習系統在更重要的領域中得到應用，證明為什麼我們可以信任它們的輸出，並明確何時不應信任它們，變得越來越重要。獲得對複雜系統輸出結果信任的一個可行方法是，要求系統對其輸出產生一種解釋，這種解釋對人類或另一個受信任的系統來說是可讀的，即可以完全理解以至於任何可能的錯誤都可以被發現。例如，為了建立對司法系統的信任，我們要求法院提供清晰易讀的書面意見，解釋並支持其決策。對於大型語言模型來說，我們也可以採用類似的方法。不過，在採用這種方法時，確保語言模型生

黎曼猜想显著突破！陶哲轩强推MIT、牛津新论文，37岁菲尔兹奖得主参与 Aug 05, 2024 pm 03:32 PM

最近，被稱為千禧年七大難題之一的黎曼猜想迎來了新突破。黎曼猜想是數學中一個非常重要的未解決問題，與素數分佈的精確性質有關（素數是那些只能被1和自身整除的數字，它們在數論中扮演著基礎性的角色）。在當今的數學文獻中，已有超過一千個數學命題以黎曼猜想（或其推廣形式）的成立為前提。也就是說，黎曼猜想及其推廣形式一旦被證明，這一千多個命題將被確立為定理，對數學領域產生深遠的影響；而如果黎曼猜想被證明是錯誤的，那麼這些命題中的一部分也將隨之失去其有效性。新的突破來自MIT數學教授LarryGuth和牛津大學

arXiv論文可以發「彈幕」了，史丹佛alphaXiv討論平台上線，LeCun按讚 Aug 01, 2024 pm 05:18 PM

乾杯！當論文討論細緻到詞句，是什麼體驗？最近，史丹佛大學的學生針對arXiv論文創建了一個開放討論論壇——alphaXiv，可以直接在任何arXiv論文之上發布問題和評論。網站連結：https://alphaxiv.org/其實不需要專門訪問這個網站，只需將任何URL中的arXiv更改為alphaXiv就可以直接在alphaXiv論壇上打開相應論文：可以精準定位到論文中的段落、句子：右側討論區，使用者可以發表問題詢問作者論文想法、細節，例如：也可以針對論文內容發表評論，例如：「給出至

首個基於Mamba的MLLM來了！模型權重、訓練程式碼等已全部開源 Jul 17, 2024 am 02:46 AM

AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com。引言近年来，多模态大型语言模型（MLLM）在各个领域的应用取得了显著的成功。然而，作为许多下游任务的基础模型，当前的MLLM由众所周知的Transformer网络构成，这种网

公理訓練讓LLM學會因果推理：6700萬參數模型比肩萬億參數級GPT-4 Jul 17, 2024 am 10:14 AM

把因果鏈展示給LLM，它就能學會公理。 AI已經在幫助數學家和科學家做研究了，例如著名數學家陶哲軒就曾多次分享自己借助GPT等AI工具研究探索的經驗。 AI要在這些領域大戰拳腳，強大可靠的因果推理能力是不可或缺的。本文要介紹的研究發現：在小圖譜的因果傳遞性公理演示上訓練的Transformer模型可以泛化用於大圖譜的傳遞性公理。也就是說，如果讓Transformer學會執行簡單的因果推理，就可能用於更複雜的因果推理。該團隊提出的公理訓練框架是一種基於被動資料來學習因果推理的新範式，只有演示

See all articles

選擇GPT-3.5、還是喬丹Llama 2等開源模型？綜合比較後答案有了

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題