目次
実験セットアップ
ホームページ テクノロジー周辺機器 AI スタンフォード大学と OpenAI がメタプロンプティングを提案し、最強のゼロサンプルプロンプティング技術が誕生しました。

スタンフォード大学と OpenAI がメタプロンプティングを提案し、最強のゼロサンプルプロンプティング技術が誕生しました。

Feb 07, 2024 pm 03:30 PM
ai データ

最新世代の言語モデル (GPT-4、PaLM、LLaMa など) は、自然言語の処理と生成において重要な進歩を遂げました。これらの大規模モデルは、シェイクスピアのソネットの執筆から複雑な医療報告書の要約、さらには競技レベルのプログラミング問題の解決に至るまで、さまざまなタスクを実行できます。これらのモデルはさまざまな問題を解決できますが、常に正しいとは限りません。場合によっては、不正確、誤解を招く、または矛盾した応答結果が生成される可能性があります。したがって、これらのモデルを使用する場合は、その出力の精度と信頼性を評価および検証するために依然として注意が必要です。

モデルの実行コストが低下するにつれて、モデル出力の精度と安定性を向上させるために、スキャフォールディング システムと多言語モデル クエリの使用を検討し始めています。このアプローチにより、モデルのパフォーマンスが最適化され、ユーザーにより良いエクスペリエンスが提供されます。

スタンフォード大学と OpenAI によるこの研究は、メタプロンプティングと呼ばれる言語モデルの能力とパフォーマンスを向上させるために使用できる新しいテクノロジを提案しています。

スタンフォード大学と OpenAI がメタプロンプティングを提案し、最強のゼロサンプルプロンプティング技術が誕生しました。


  • #論文タイトル: メタプロンプティング: タスク非依存性による言語モデルの強化足場
  • 紙のアドレス: https://arxiv.org/abs/2401.12954
  • #プロジェクトアドレス: https://github.com/suzgunmirac/meta-prompting

このテクノロジーには、高レベルの「メタ」プロンプトの構築が含まれます。この機能は、言語モデルに次のことを実行するように指示することです:

1. 複雑なタスクや問題を、解決しやすい小さなサブタスクに分解します;

2. 適切かつ詳細な自然言語命令を使用して、これらのサブタスクを特殊な「エキスパート」モデルに割り当てます。

#3. これらのエキスパート モデル間の通信を監視します。

4. このプロセスを通じて、自分自身の批判的思考、推論、検証スキルを適用します。

メタプロンプティングを使用して効果的に呼び出すことができる言語モデルの場合、モデルはクエリ時にコンダクターとして機能します。複数のエキスパート モデルからの応答で構成されるメッセージ履歴 (またはナラティブ) を出力します。この言語モデルは、まずメッセージ履歴の指揮官部分を生成する役割を果たします。これには、専門家の選択と専門家に対する特定の指示の構築が含まれます。ただし、同じ言語モデルは、それ自体が独立した専門家としても機能し、特定のクエリごとに指揮官によって選択された専門知識と情報に基づいて出力を生成します。

このアプローチにより、単一の統一言語モデルで一貫した推論を維持しながら、さまざまな専門家の役割を活用することができます。プロンプトのコンテキストを動的に選択することで、これらの専門家はプロセスに新たな視点をもたらすことができ、一方でコマンダー モデルは完全な履歴の鳥瞰図を維持し、調整を維持します。

したがって、このアプローチにより、単一のブラック ボックス言語モデルが中央の指揮官と一連のさまざまな専門家の両方として効果的に機能し、より正確で信頼性の高い一貫した応答が得られます。

ここで新しく提案されたメタプロンプティング技術は、高レベルの計画と意思決定、動的な人格割り当て、マルチプロンプトなど、最近の研究で提案されたさまざまなプロンプトアイデアを組み合わせて拡張します。 -agent 議論、自己デバッグ、自己反省。

メタプロンプトの重要な側面は、タスクに依存しないという特性です。

各タスクに合わせて調整する特定の指示や例を必要とする従来のスキャフォールディング手法とは異なり、メタプロンプトでは、複数のタスクと入力にわたって同じ高レベルの階層が使用されます。この多用途性は、特定のタスクごとに詳細な例や具体的な手順を提供する必要がなくなるため、トラブルを嫌がるユーザーにとって特に有益です。

たとえば、「自撮りについてのシェイクスピアのソネットを書いてください」のような 1 回限りのリクエストの場合、ユーザーは新古典派の詩の高品質な例でそれを補う必要はありません。

メタプロンプト手法は、言語モデルの特異性や関連性を損なうことなく、広範で柔軟なフレームワークを提供することで、言語モデルの有用性を向上させることができます。さらに、メタプロンプト方式の多用途性と統合機能を実証するために、チームは Python インタープリターを呼び出せるようにシステムも強化しました。これにより、このテクノロジーはより動的で包括的なアプリケーションをサポートできるようになり、幅広いタスクやクエリを効率的に処理できる可能性がさらに高まります。

図 2 は、メタプロンプトの会話フローの例を示しています。

スタンフォード大学と OpenAI がメタプロンプティングを提案し、最強のゼロサンプルプロンプティング技術が誕生しました。

複数の異なるプロのエキスパート モデルまたはコードからの入力と実行を使用して、メタ モデル (コマンダー モデル) を表します。出力は、独自の解釈プロセスです。出力。この構成により、メタプロンプトがほぼ普遍的なツールになります。これにより、複数の言語モデルの対話と計算を単一の一貫した物語に集約することができます。メタプロンプトは、どのプロンプトまたはどのスニペットを使用するかを言語モデル自身が決定できるという点で異なります。

チームは、GPT-4 をベース言語モデルとして使用し、メタプロンプトを他のタスクに依存しないスキャフォールディング手法と比較する包括的な実験を実施しました。

実験の結果、メタプロンプトは全体的なパフォーマンスを向上させるだけでなく、多くの場合、複数の異なるタスクで新たな最高の結果を達成できることがわかりました。その柔軟性は特に注目に値します。コマンダー モデルは、さまざまな異なる機能を実行するために、エキスパート モデル (基本的にはそれ自体であり、異なる命令を持つ) を呼び出す機能を備えています。これらの機能には、以前の出力のレビュー、特定のタスクに対する特定の AI ペルソナの選択、生成されたコンテンツの最適化、最終出力が内容と形式の両方で必要な基準を満たしていることの確認などが含まれる場合があります。

#図 1 に示すように、以前の方法と比較して、新しい方法には明らかな改善があります。

スタンフォード大学と OpenAI がメタプロンプティングを提案し、最強のゼロサンプルプロンプティング技術が誕生しました。

メタプロンプティング

直観的な知識と抽象的な概要。メタプロンプトは、モデルを使用して複数の独立したクエリを調整および実行し、それらの応答を組み合わせて最終応答をレンダリングすることによって機能します。原則として、このメカニズムは、独立した専門モデルの力と多様性を借りて、多面的なタスクや問題を協力して解決し、処理する統合的なアプローチを採用しています。

メタプロンプティング戦略の中核は、単一のモデル (メタモデルと呼ばれる) を権威のあるマスター エンティティとして使用する浅い構造です。

このプロンプト構造はオーケストラに似ており、指揮者の役割はメタモデルによって演じられ、各音楽プレーヤーは異なるドメイン固有のモデルに対応します。指揮者が複数の楽器を調整して調和のとれたメロディーを演奏できるのと同じように、メタモデルは複数のモデルからの回答と洞察を組み合わせて、複雑な質問やタスクに対して正確かつ包括的な回答を提供できます。

概念的には、このフレームワーク内で、ドメイン固有の専門家は、特定の種類のクエリを処理するために使用される、特定のタスク向けに微調整された言語モデルなどのさまざまな形式を取ることができます。専用の API。電卓などの計算ツールや、コードを実行するための Python インタプリタなどのコーディング ツールも含まれます。これらの機能的に多様な専門家は、メタモデルの監督下で指示および統合されており、相互に直接対話したり通信したりすることはできません。

アルゴリズム手順 アルゴリズム 1 は、新しく提案されたメタプロンプト手法の擬似コードを示します。

スタンフォード大学と OpenAI がメタプロンプティングを提案し、最強のゼロサンプルプロンプティング技術が誕生しました。

簡単に要約すると、最初のステップは、適切なテンプレートに準拠するように入力を変換することです。その後、次のループが実行されます。 a) メタ モデルにプロンプ​​トを送信します。(b) 必要に応じてドメイン固有のエキスパート モデルを使用します。(c) 最終応答を返します。(d) エラーを処理します。

実験でチームが使用したメタモデルとエキスパート モデルは両方とも GPT-4 であることを指摘しておく必要があります。両者の役割の違いは、それぞれが受け取る命令によって決まります。メタモデルは図 3 で提供される一連の命令に従い、エキスパート モデルは推論時にメタモデルによって動的に決定される命令に従います。

スタンフォード大学と OpenAI がメタプロンプティングを提案し、最強のゼロサンプルプロンプティング技術が誕生しました。

実験セットアップ

ベンチマーク

##チームは、メタプロンプトと次のプロンプト方法を比較しました。タスク タイプ ゼロサンプル バージョン:

    ##標準プロンプト
  • ゼロサンプル思考チェーン プロンプト
  • ##エキスパート プロンプト
  • #マルチプレイヤー プロンプト
  • ##データセットとタスク

チームは、数学的およびアルゴリズム的推論、領域固有の知識、文学的創造性など、さまざまな能力を必要とする実験でさまざまなタスクとデータセットを使用しました。これらのデータセットとタスクには以下が含まれます:

24 のゲーム: 目標は、4 つの指定された値 (それぞれ 1 回のみ使用可能) を使用して、結果が得られる算術式を構築することです。 24モードで。

  • 3 つの BIG-Bench Hard (BBH) タスク: 幾何学的図形、複数ステップ算術 2、および単語の並べ替え。BIG-Bench スイートから直接取得した推論タスクであるチェックメイトインもあります - 1つ。
  • Python プログラミング パズル (P3) は Python プログラミングの問題であり、複数の難易度が含まれています。
  • Multilingual Grade School Math は、ベンガル語、日本語、スワヒリ語を含む GSM8K データセットの多言語バージョンです。
  • シェイクスピアのソネット執筆は、チームによって作成された新しいタスクであり、「ABAB CDCD EFEF GG」と厳密に韻を踏む 10 個のソネットを書くことを目的としています。言葉はそのまま提供されました。
  • 回答抽出および評価プロトコル

図 3 に示すように、新しく提案されたメタプロンプト方式では、システム命令により、メタモデルが特定の形式で最終的な回答を与えるようになります。

#評価に関しては、タスクの性質と形式に応じて、次の 3 つの指標のいずれかが使用されます。 #完全一致 (EM)、完全一致

ソフト マッチ (SM)、ソフト マッチ

    機能的に正しい (FC)、機能的な正確さ
  • モデルと推論
  • チームの主な実験はすべて GPT-4 (gpt-4-32k) を使用しました。 )。いくつかの追加実験では GPT-3.5 (gpt-35-turbo) を使用しました。 GPT-3.5 であっても GPT-4 であっても、微調整には次の手順が使用されます。

すべての実験で、メタモデルで使用されるパラメーターとシステム命令は同じです。温度値は 0、top-p 値は 0.95、トークンの最大数は 1024 に設定されます。

主な結果と考察

表 1 は実験結果をまとめたもので、新しく提案されたメタプロンプティングの優位性が反映されています。

すべてのタスクに対するこれらのメソッドの全体的なパフォーマンスを見ると、特に When を使用する場合、メタプロンプトによって精度が大幅に向上していることがわかります。 Python インタープリタ ツールによって支援されます。

具体的には、メタプロンプト方法は、標準プロンプト方法よりも 17.1% 優れ、エキスパート (動的) プロンプトよりも 17.3% 優れており、複数人によるプロンプトよりも 15.2% 優れています。

スタンフォード大学と OpenAI がメタプロンプティングを提案し、最強のゼロサンプルプロンプティング技術が誕生しました。

さらに、図 4 と 5 から、Python インタープリターを使用しないメタプロンプトと比較して、Python インタープリターを統合すると、さまざまなタスクで全体的なパフォーマンスが得られることがわかります。 11.5%改善。

チームは、論文の中で、実験から得られた重要な洞察についても詳しく議論しています。プロンプトのパフォーマンスの優位性、ゼロサンプル分解機能、エラー検出、情報集約とコード実行など。ここでは詳しく説明しませんが、Fresh Eyes のコンセプトは紹介する価値があります。

スタンフォード大学と OpenAI がメタプロンプティングを提案し、最強のゼロサンプルプロンプティング技術が誕生しました。Fresh Eyes、つまり別の目で見ることは、言語モデルに関するよく知られた問題を軽減するのに役立ちます。つまり、間違いは最後まで続き、自信過剰を示します。

フレッシュ アイズはメタ プロンプティングとマルチプレイヤー プロンプティングの重要な違いであり、実験結果でもその利点が証明されています。メタプロンプトでは、専門家 (またはペルソナ) を使用して問題を再評価できます。このアプローチは、新たな洞察を得る機会を提供し、これまで不正確であると判明していなかった答えを明らかにする可能性があります。

認知心理学に基づいた Fresh Eyes は、より創造的な問題解決とエラー検出の結果をもたらします。

以下の例は、Fresh Eyes の実際の利点を示しています。タスクが 24 のゲームであるとします。指定される値は 6、11、12、および 13 です。結果が 24 になる算術式を作成し、各数値を 1 回だけ使用する必要があります。その歴史は次のようになります:

1. メタモデルは、数学的問題を解決するコンサルティング エキスパート モデルと Python でのプログラミングを提案します。正確さと制約の順守の必要性を強調し、必要に応じて別の専門家の関与を推奨しています。

#2. ある専門家は解決策を示しますが、別の専門家はそれが間違っていると考えるため、メタモデルは、有効な解決策を見つけるために Python プログラムを作成することを提案します。

3. プログラミングの専門家に相談して、プログラムを書いてもらいます。

4. 別のプログラミング専門家がスクリプト内のエラーを見つけて変更し、変更されたスクリプトを実行します。

5. プログラムが出力した解を検証するには、数学の専門家に相談してください。

6. 検証が完了すると、メタモデルはそれを最終的な答えとして出力します。

この例は、メタプロンプトがどのように各ステップに新しい視点を組み込んで、答えを見つけるだけでなく、効果的にエラーを特定して修正できるかを示しています。

チームは、使用された専門家の種類の分析、最終結果を得るために必要な対話のターン数、およびその方法など、メタプロンプティングに関連するその他の問題について議論して結論を​​出しました。解決できない問題などに対処するため。詳細については原著論文を参照してください。

以上がスタンフォード大学と OpenAI がメタプロンプティングを提案し、最強のゼロサンプルプロンプティング技術が誕生しました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

vue.jsのストリングをオブジェクトに変換するためにどのような方法が使用されますか? vue.jsのストリングをオブジェクトに変換するためにどのような方法が使用されますか? Apr 07, 2025 pm 09:39 PM

vue.jsのオブジェクトに文字列を変換する場合、標準のjson文字列にはjson.parse()が推奨されます。非標準のJSON文字列の場合、文字列は正規表現を使用して処理し、フォーマットまたはデコードされたURLエンコードに従ってメソッドを削減できます。文字列形式に従って適切な方法を選択し、バグを避けるためにセキュリティとエンコードの問題に注意してください。

MySQLインストール後にデータベースのパフォーマンスを最適化する方法 MySQLインストール後にデータベースのパフォーマンスを最適化する方法 Apr 08, 2025 am 11:36 AM

MySQLパフォーマンスの最適化は、インストール構成、インデックス作成、クエリの最適化、監視、チューニングの3つの側面から開始する必要があります。 1。インストール後、INNODB_BUFFER_POOL_SIZEパラメーターやclose query_cache_sizeなど、サーバーの構成に従ってmy.cnfファイルを調整する必要があります。 2。過度のインデックスを回避するための適切なインデックスを作成し、説明コマンドを使用して実行計画を分析するなど、クエリステートメントを最適化します。 3. MySQL独自の監視ツール(ShowProcessList、ShowStatus)を使用して、データベースの健康を監視し、定期的にデータベースをバックアップして整理します。これらの手順を継続的に最適化することによってのみ、MySQLデータベースのパフォーマンスを改善できます。

インストール後にMySQLの使用方法 インストール後にMySQLの使用方法 Apr 08, 2025 am 11:48 AM

この記事では、MySQLデータベースの操作を紹介します。まず、MySQLWorkBenchやコマンドラインクライアントなど、MySQLクライアントをインストールする必要があります。 1. mysql-uroot-pコマンドを使用してサーバーに接続し、ルートアカウントパスワードでログインします。 2。CreatedAtaBaseを使用してデータベースを作成し、データベースを選択します。 3. createTableを使用してテーブルを作成し、フィールドとデータ型を定義します。 4. INSERTINTOを使用してデータを挿入し、データをクエリし、更新することでデータを更新し、削除してデータを削除します。これらの手順を習得することによってのみ、一般的な問題に対処することを学び、データベースのパフォーマンスを最適化することでMySQLを効率的に使用できます。

Laravelの地理空間:インタラクティブマップと大量のデータの最適化 Laravelの地理空間:インタラクティブマップと大量のデータの最適化 Apr 08, 2025 pm 12:24 PM

700万のレコードを効率的に処理し、地理空間技術を使用したインタラクティブマップを作成します。この記事では、LaravelとMySQLを使用して700万を超えるレコードを効率的に処理し、それらをインタラクティブなマップの視覚化に変換する方法について説明します。最初の課題プロジェクトの要件:MySQLデータベースに700万のレコードを使用して貴重な洞察を抽出します。多くの人は最初に言語をプログラミングすることを検討しますが、データベース自体を無視します。ニーズを満たすことができますか?データ移行または構造調​​整は必要ですか? MySQLはこのような大きなデータ負荷に耐えることができますか?予備分析:キーフィルターとプロパティを特定する必要があります。分析後、ソリューションに関連している属性はわずかであることがわかりました。フィルターの実現可能性を確認し、検索を最適化するためにいくつかの制限を設定しました。都市に基づくマップ検索

MySQLを解決する方法は開始できません MySQLを解決する方法は開始できません Apr 08, 2025 pm 02:21 PM

MySQLの起動が失敗する理由はたくさんあり、エラーログをチェックすることで診断できます。一般的な原因には、ポートの競合(ポート占有率をチェックして構成の変更)、許可の問題(ユーザー許可を実行するサービスを確認)、構成ファイルエラー(パラメーター設定のチェック)、データディレクトリの破損(テーブルスペースの復元)、INNODBテーブルスペースの問題(IBDATA1ファイルのチェック)、プラグインロード障害(エラーログのチェック)が含まれます。問題を解決するときは、エラーログに基づいてそれらを分析し、問題の根本原因を見つけ、問題を防ぐために定期的にデータをバックアップする習慣を開発する必要があります。

MySQLの主な鍵はヌルにすることができます MySQLの主な鍵はヌルにすることができます Apr 08, 2025 pm 03:03 PM

MySQLプライマリキーは、データベース内の各行を一意に識別するキー属性であるため、空にすることはできません。主キーが空になる可能性がある場合、レコードを一意に識別することはできません。これにより、データの混乱が発生します。一次キーとして自己挿入整数列またはUUIDを使用する場合、効率やスペース占有などの要因を考慮し、適切なソリューションを選択する必要があります。

リモートシニアバックエンジニア(プラットフォーム)がサークルが必要です リモートシニアバックエンジニア(プラットフォーム)がサークルが必要です Apr 08, 2025 pm 12:27 PM

リモートシニアバックエンジニアの求人事業者:サークル場所:リモートオフィスジョブタイプ:フルタイム給与:$ 130,000- $ 140,000職務記述書サークルモバイルアプリケーションとパブリックAPI関連機能の研究開発に参加します。ソフトウェア開発ライフサイクル全体をカバーします。主な責任は、RubyonRailsに基づいて独立して開発作業を完了し、React/Redux/Relay Front-Endチームと協力しています。 Webアプリケーションのコア機能と改善を構築し、機能設計プロセス全体でデザイナーとリーダーシップと緊密に連携します。肯定的な開発プロセスを促進し、反復速度を優先します。 6年以上の複雑なWebアプリケーションバックエンドが必要です

MySQLインストール後に開始できないサービスのソリューション MySQLインストール後に開始できないサービスのソリューション Apr 08, 2025 am 11:18 AM

MySQLは開始を拒否しましたか?パニックにならないでください、チェックしてみましょう!多くの友人は、MySQLのインストール後にサービスを開始できないことを発見し、彼らはとても不安でした!心配しないでください、この記事はあなたがそれを落ち着いて対処し、その背後にある首謀者を見つけるためにあなたを連れて行きます!それを読んだ後、あなたはこの問題を解決するだけでなく、MySQLサービスの理解と問題のトラブルシューティングのためのあなたのアイデアを改善し、より強力なデータベース管理者になることができます! MySQLサービスは開始に失敗し、単純な構成エラーから複雑なシステムの問題に至るまで、多くの理由があります。最も一般的な側面から始めましょう。基本知識:サービススタートアッププロセスMYSQLサービススタートアップの簡単な説明。簡単に言えば、オペレーティングシステムはMySQL関連のファイルをロードし、MySQLデーモンを起動します。これには構成が含まれます

See all articles