社群

學習

工具庫

AI工具

休閒

繁体中文

首頁 > 科技週邊 > 人工智慧 > AI自主設計提示詞，GoogleDeepMind發現數學「深呼吸」能讓大模型漲8分！

AI自主設計提示詞，GoogleDeepMind發現數學「深呼吸」能讓大模型漲8分！

王林

發布： 2023-09-22 20:13:03

轉載

803 人瀏覽過

提示詞中加上「深呼吸」，AI大模型數學成績就能再漲8.4分！

GoogleDeepMind團隊最新發現，用這個新「咒語」（Take a deep breath）結合大家已經熟悉的「一步一步地想」 （Let's think step by step），大模型在GSM8K資料集上的成績就從71.8提高到80.2分。

而且這個最有效的提示詞，是AI自己找出來的#。

AI自主設計提示詞，GoogleDeepMind發現數學「深呼吸」能讓大模型漲8分！

有人開玩笑說，當你深呼吸後，散熱風扇的轉速就會提高

AI自主設計提示詞，GoogleDeepMind發現數學「深呼吸」能讓大模型漲8分！

有些人認為，新進職的高薪工程師們也應該冷靜下來，因為他們的工作可能不會持續太久

AI自主設計提示詞，GoogleDeepMind發現數學「深呼吸」能讓大模型漲8分！

相關論文《大語言模型是優化器》，再次引起轟動。

AI自主設計提示詞，GoogleDeepMind發現數學「深呼吸」能讓大模型漲8分！

具體來說，大模型自己設計的提示字在Big-Bench Hard資料集上最高提升50%。

AI自主設計提示詞，GoogleDeepMind發現數學「深呼吸」能讓大模型漲8分！

也有人的關注點在「不同模型的最佳提示字不一樣」# 。

AI自主設計提示詞，GoogleDeepMind發現數學「深呼吸」能讓大模型漲8分！

在論文中，不僅是提示詞設計這項任務，也測試了大模型在線性迴歸和旅行商問題等經典最佳化任務上的能力

模型不同，最佳提示詞也不同

優化問題無所不在，基於導數和梯度的演算法是強大的工具，但現實應用中也經常遇到梯度不適用的情況。

為解決這個問題，團隊發展了新方法OPRO#，也就是透過提示字優化（Optimization by PROmpting）。

不再是透過形式化定義最佳化問題並用程式求解，而是透過自然語言描述最佳化問題，並要求大型模型產生新的解決方案

一圖流總結，就是對大模型的一種遞歸呼叫。

AI自主設計提示詞，GoogleDeepMind發現數學「深呼吸」能讓大模型漲8分！

每一步優化中，以先前產生的解決方案和評分作為輸入，大模型產生新的方案並評分，再將其添加到提示詞中，供下一步優化使用。

AI自主設計提示詞，GoogleDeepMind發現數學「深呼吸」能讓大模型漲8分！

論文主要使用Google的PaLM 2和Bard中的text-bison 版本作為評測模式。

作為優化器，我們將使用四個模型，包括GPT-3.5和GPT-4

研究結果顯示，不同的模型設計出的提示詞風格以及適用的提示詞風格也各不相同

先前在GPT系列上的AI設計出的最優提示詞是“Let's work this out in a step by step way to be sure we have the right answer .”

這個提示詞使用APE方法設計，論文發表在ICLR 2023上，在GPT-3（text-davinci-002）上超過人類設計的版本“Let's think step by step」。

AI自主設計提示詞，GoogleDeepMind發現數學「深呼吸」能讓大模型漲8分！

在Google系的PaLM 2和Bard上，APE版本在這次作為基準測試中表現不如人類版本

AI自主設計提示詞，GoogleDeepMind發現數學「深呼吸」能讓大模型漲8分！

在

OPRO方法設計出來的新提示詞中，「#深呼吸」#「拆解這個問題」對PaLM來說效果最好。

對於text-bison版的Bard大模型來說，更傾向於提供更詳細的提示詞

AI自主設計提示詞，GoogleDeepMind發現數學「深呼吸」能讓大模型漲8分！

此外，論文也展示了大型模型在數學最佳化器方面的潛力

線性迴歸作為連續最佳化問題的範例。

AI自主設計提示詞，GoogleDeepMind發現數學「深呼吸」能讓大模型漲8分！

旅行商問題作為離散最佳化問題的範例。

AI自主設計提示詞，GoogleDeepMind發現數學「深呼吸」能讓大模型漲8分！

光是提示，大模型就能找到不錯的解決方案，有時甚至匹敵或超過手動設計的啟發式演算法。

然而，團隊也認為大模型還無法取代傳統基於梯度的最佳化演算法。當問題規模較大時，例如節點數量較多的旅行商問題，OPRO方法的表現並不理想

團隊提出了對未來改進方向的想法。他們認為目前的大模型還無法有效地利用錯誤案例，僅僅提供錯誤案例無法讓大模型捕捉到錯誤的原因

一個有前景的方向是結合關於錯誤案例的更豐富的反饋，並總結優化軌跡中高品質和低品質產生提示的關鍵特徵差異。

這些資訊有可能幫助優化器模型更有效地改進過去產生的提示，並有可能進一步減少進行提示優化所需的樣本數量

論文放出大量最優提示詞

論文來自Google與DeepMind合併後的部門，但作者以原谷歌大腦團隊為主，包括Quoc Le、週登勇。

共同一作為康乃爾大學博士畢業的復旦校友Chengrun Yang，和UC柏克萊博士畢業的上交大校友陳昕昀。

團隊也提供了論文中許多實驗中所得到的最佳提示詞，包括電影推薦、惡搞電影名字等實用場景。若有需要的朋友，可以自行參考

AI自主設計提示詞，GoogleDeepMind發現數學「深呼吸」能讓大模型漲8分！

論文網址：https://arxiv.org/abs/2309.03409

#

以上是AI自主設計提示詞，GoogleDeepMind發現數學「深呼吸」能讓大模型漲8分！的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

ai 模型

來源：51cto.com

上一篇：解密大規模模型的“迷思”，雲測數據發布行業AI大模型數據解決方案下一篇：全新捷象靈立庫托盤機器人：顛覆無人堆高機賽道！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

創造未來：零基礎的 Java 編程

2024-10-13 13:32:21
你並不孤單：在社群的支持下掌握 Python

2024-10-12 11:58:51
從新手到程式設計師：利用 Python 程式設計的力量

2024-10-11 20:06:51
像程式設計師一樣思考：學習 Java 基礎知識

2024-10-11 18:59:31
Java 變得簡單：程式設計能力的初學者指南

2024-10-11 18:30:51
使用 PHP 建立部落格：一個適合初學者的項目

2024-10-11 15:51:51
講系統語言：學習 C，一次一行

2024-10-11 15:42:10
C 語言的資料結構與演算法：適合初學者的方法

2024-10-11 14:41:20
不流淚編碼：輕鬆學習 C

2024-10-11 14:08:31
使用 Java 進行資料分析：資訊處理初學者指南

2024-10-11 13:42:21

最新問題

在多個路由中聲明的workerpool是否仍然可以保持其cpu使用率而不關心閾值我希望找到一個帶有workerpool的node.js系統來處理CPU密集型任務，但是對於多條路由中的cpu使用情況，我有點困惑。一個場景是這樣的：route1.js:constw...

來自於 2024-04-06 19:54:23

0

1

444

使用MySQL SQL查詢計算另一張表中欄位的總和我有一個這樣的模式：具有屬性“user_id”和“username”的用戶表以及具有屬性“customer_id”（user_id的FK）和“finalPrice”的訂單表資料庫架...

來自於 2024-04-06 19:39:29

0

1

441

無法從網站取得輸入元素所以我試圖從Twitter獲取一個輸入元素，但當我運行它時，它不斷在節點終端中給我一個這樣的錯誤，結果，由此代碼創建的瀏覽器窗口將自行關閉，因為它找不到正確的輸入選擇器。如何取得正...

來自於 2024-04-06 18:59:57

0

1

442

在模板中使用方法中定義的變數這是我第一次使用Vue（v2而不是v3），我一直在嘗試在模板內使用變數（在方法內定義）。我的簡化程式碼：<template><divclass="con...

來自於 2024-04-06 18:10:25

0

2

513

使用SCSS產生預設值和CSS變數我正在實現網站樣式。出於遺留支援的原因，我需要支援IE11，至少一段時間。出於工作流程和我的理智原因，我想盡可能使用css變數。我已經研究過這個解決方案，它會產生一些有效的東西，但...

來自於 2024-04-06 17:46:54

0

1

355

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1427618
php入門教程之一週學會PHP

4278107
JAVA 初級入門影片教學

2579149
小甲魚零基礎入門學習Python影片教學

510478
PHP 零基礎入門教學

867625

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板