目次
##近年、GPT-3 をはじめとする大規模言語モデル (Large Language Model) の研究が大きく進歩しています。 Codex、PaLM、LLaMA、ChatGPT、最近リリースされた GPT-4 など。これらのモデルは、コンテキスト内学習、コード生成、その他のさまざまな自然言語処理タスクに優れており、一般的な人工知能に向けてモデルの可能性をさらに押し上げています。
主な実験に加えて、記事の著者はツール作成の他の利点にも焦点を当てました。 -さまざまなプレゼンテーション形式のモデルツール作成機能。創作ツールである以上、ツールとしての利点の一つは再利用性でしょう。著者もこのアイデアに従って、ツールの再利用によるタスク効果の向上をさらに実証しました。
記事の主著者
ホームページ テクノロジー周辺機器 AI CREATORはLLMの「自己進化」を実現するためのツールを作り、活用する

CREATORはLLMの「自己進化」を実現するためのツールを作り、活用する

Jun 12, 2023 pm 11:34 PM
フレーム 研究

古来より、道具の使用は人間と他の種との大きな違いとみなされ、また知性の基本的な現れともみなされてきました。今日、人工知能はもはやツールの単純な使用に限定されず、問題に基づいて解決策を見つけるための独自のツールを創造的に構築することができています。これは、思考の面では現在の大型モデルがより高次の抽象的な思考と認識を習得し、それを具体的な思考と分けて問題を一緒に解決できるようになったということを意味し、能力の面ではツール作成の登場も意味する。モデルは「学習」を通じて変革し、知っていることを利用して未来への無限の可能性を「創造」することができました。

CREATORはLLMの「自己進化」を実現するためのツールを作り、活用する

  • #紙のリンク: https://arxiv.org/pdf/2305.14318.pdf
  • #研究の背景

##近年、GPT-3 をはじめとする大規模言語モデル (Large Language Model) の研究が大きく進歩しています。 Codex、PaLM、LLaMA、ChatGPT、最近リリースされた GPT-4 など。これらのモデルは、コンテキスト内学習、コード生成、その他のさまざまな自然言語処理タスクに優れており、一般的な人工知能に向けてモデルの可能性をさらに押し上げています。

大規模モデルはこれらの分野で大きな成功を収めていますが、最新のリアルタイム情報を認識または応答できないことや大規模データの難しさなど、依然として多くの欠点があります。計算精度が高く、質問文が論理的に複雑な場合などに不安定な推論能力を実現します。これらの欠点に対応して、研究者は、モデルの機能を強化するために計算機、質疑応答システム、Wikipedia、その他の外部知識ソースを導入するなど、外部リソースを利用する機能を現在のモデル アーキテクチャに導入する取り組みを開始しました。この一連の研究は、モデル

ツール学習

能力の基礎を築きました。 ただし、現在の研究で利用されている外部ツールの

数は依然として限られています

一方、潜在的な新しいタスクの種類はほぼ無限にあります。したがって、新しいタイプの問題に直面した場合、問題の解決に適した既存のツールを見つけるのは困難です。さらに、効果的な悪用可能なツールが提供されている場合でも、モデルにはツールキットのドキュメントで広範な検索、照合、および問題固有の計画が必要です。これにより、モデルに多くの認知負荷がかかり、高い学習コストが必要になります そこで、研究チームは、ツール作成(ツール作成)

という新しい研究パラダイムを提案しました。これは単に大規模なモデルを使用してツールを使用する機能ではなく、新しいツール作成モジュールが追加され、モデルがツールを作成し、モデルが直面する問題の解決策を見つけることができるようになります。

大規模なモデルを利用してツールを作成すると、特定の API の制限を超えて、ツールの遍在性、再利用性、多様性が高まります。ツール作成モジュールの設計では、大規模なモデルの認知負荷を軽減し、抽象的な推論 (一般化可能で汎用的なツールの作成) と具体的な推論 (ツールの実装の詳細とツールの使用方法の文書に基づく) を分離することもできます。 意思決定能力 。同時に、このフレームワークのモデルはツール作成の媒体としてコードを使用するため、モデルはエラーに対してより敏感になり、ツールの作成および使用時の問題に基づいて

バックトラックおよび修正

することができます。

#ツール作成パラダイムは、ツールの使用よりも柔軟であり、さまざまなシナリオへの適応性が高くなります

CREATORはLLMの「自己進化」を実現するためのツールを作り、活用する

CREATOR Research Framework

大規模なモデルを用いて問題を解決するためのツールを作成するためのフレームワークであり、CREATOR は主に以下の 4 つの段階に分かれています。

  • 作成: 大規模モデルの抽象的な推論機能を使用して問題を解決し、必要なツールとその使用手順をコードを通じて目的を絞った方法で作成します。
  • 意思決定 (意思決定) : 大規模モデルの具体的な推論能力を使用して問題を解決し、現在の問題を解決するためにツールを使用する方法を決定します。
  • 実行 : 作成したツールと決定内容に基づいて決定を実行し、実行プロセス中に出力情報を取得します。
  • 修正: 大規模モデルのエラー原因の推論機能と自己修復機能を利用して、実行フェーズで捕捉された問題を修復します。

CREATORはLLMの「自己進化」を実現するためのツールを作り、活用する

#大規模モデルを使用したツールの作成と意思決定のためのプロセス フレームワーク

大規模モデルは、まず問題に基づいて必要なツールとそれに関連する命令を作成します。その後、問題の内容とツール情報が同時に大規模モデルに返されて、決定が行われます。この問題の解決策とこれらのツールの使用方法。その後、モデルは実行に基づいてツールと意思決定を適応させて、問題によりよく適合し、答えを探します。

ツール作成フレームワーク全体は、大規模モデルのさまざまな思考能力を柔軟に使用します。抽象的な思考推論で問題の重要な情報を抽出し、具体的な思考推論でそれに基づいて意思決定を行います。タスクの実行計画 と、問題に基づいて解決策を探す 自己修復推論 です。これらの機能を分離することで、大規模モデルが通常の推論チェーン (思考連鎖、CoT) の混乱によって引き起こされる障害を回避し、タスクに対する大規模モデルの適応性とパフォーマンスを効果的に向上させることができます。

CREATOR 実験評価

著者は、CREATOR フレームワークと現在一般的な推論連鎖法 (CoT)、プログラム推論連鎖法 (Program-of-Thought、PoT) を比較します。 ) と作成なしの簡単なツールの使用を比較しました。同時に、フレームワークにおける抽象的推論と具体的推論の分離の有効性を検証するために、CREATORフレームワークの作成フェーズと意思決定フェーズを統合したTool Create - Wholeをベースラインとして導入しました。 1. 推論機能を切り離す必要はもうありません。

CREATORはLLMの「自己進化」を実現するためのツールを作り、活用する

Creation Challenge Dataset の問題、標準ツール、意思決定の例

CREATORはLLMの「自己進化」を実現するためのツールを作り、活用する

#MATH データ セットに対する CREATOR フレームワークのパフォーマンスは、他の推論方法や単純なツール アプリケーションよりも優れています

データ セットの選択に関して、著者は主な検証として MATH および TabMWP データ セットを選択しました。前者には米国の数学コンテストでの難しい数学問題が含まれ、後者には問題を豊富なデータ テーブルと組み合わせて、両方ともモデルの問題推論と解決能力をさまざまなシナリオでテストします。さらに、著者は、既存のツールやコード パッケージでは問題を直接解決できない、新しく構築された作成チャレンジ データ セットも導入し、ツールを作成するモデルの能力をテストしました。

CREATORはLLMの「自己進化」を実現するためのツールを作り、活用する

CREATORはLLMの「自己進化」を実現するためのツールを作り、活用する

#TabMWP データセットでもCreation Challenge に対する CREATOR フレームワークの効果も非常に強力です

実験結果から判断すると、CREATOR フレームワークの推論結果はすべてのベースラインよりも大幅に優れており、特に標準的な推論手法やプログラム推論手法と比較して、より良い結果が得られています。同時に、抽象的な推論機能と具体的な推論機能を分離することで、モデルの精度を効果的に向上できることも実験で証明されています。 Creation Challenge テスト セットでは、作成者はさらに、どのツールを作成するかについてのヒントがある場合、モデルが問題を解決する能力がより強力になることも検証しました。したがって、 プロンプトと思考の分離も、ツール作成において重要な影響要因となっています。

CREATORはLLMの「自己進化」を実現するためのツールを作り、活用する

#タスクの難易度に対するさまざまな方法の精度統計

CREATORはLLMの「自己進化」を実現するためのツールを作り、活用する

#修正フェーズの参加により効果が向上します

さらに、著者はタスクの難易度に対するさまざまな方法の変化曲線や、修正段階の参加ラウンド数と大規模モデルの改善との関係も検証しました。効果。その結果、

CREATOR フレームワークは困難な問題に直面しても優れた堅牢性を維持できることがわかり、修正フェーズに参加することで CREATOR フレームワークだけでなく、PoT 推論方法 さえも大幅に改善できることがわかりました。実験における補正ステージ導入の合理性と有効性を確認します。 ツール作成のその他の利点

主な実験に加えて、記事の著者はツール作成の他の利点にも焦点を当てました。 -さまざまなプレゼンテーション形式のモデルツール作成機能。創作ツールである以上、ツールとしての利点の一つは再利用性でしょう。著者もこのアイデアに従って、ツールの再利用によるタスク効果の向上をさらに実証しました。

著者は 300 の質問を設計し、それらを 3 つのグループからなる 100 のグループに分けました。各グループの 3 つの質問はシナリオが異なりますが、すべて同じ核となる知識 (Core Knowledge)、つまり類似した質問を含んでいます。著者は、1 つの問題に対して作成されたツールを一連の問題のすべてのシナリオで使用することで効果的に解決し、精度を向上できるかどうかを検証しました。

CREATORはLLMの「自己進化」を実現するためのツールを作り、活用する

#大規模モデル用に作成されたツールは他の問題に移行でき、効果的に精度を向上させることができます

実験統計によれば、モデルによって作成された適切で使用可能なツールを他の同様の問題シナリオに移行すると、問題解決の精度が効果的に向上することがわかります。これは、大規模なモデルで作成されたツールは再利用性が高く、同様の問題に対する汎用性も高いことを示しています。

さらに、著者は大規模なモデルを使用したツール作成の 3 つの側面も示しています。 既存のツールをカプセル化してさまざまな目的を達成し、さまざまなツールを組み合わせて目的の機能を達成する 、および

は階層ツールを作成します。

これらの 3 つの次元は、低位から高位まで、現在の大規模モデル ツールの機能を示しています。また、これらの機能は、大規模モデルがさまざまなシナリオにより効率的に適応するのにも役立ちます。

#大規模モデル向けツール作成の 3 つの側面CREATORはLLMの「自己進化」を実現するためのツールを作り、活用する

概要CREATOR フレームワークは、ツールの作成を通じて、大規模なモデルの抽象化と具体的な思考能力の分離を実現します。これは、ツール学習後のモデル能力の限界を探索する上でのもう 1 つの大きな進歩です。今後さらに多くの研究がこれに基づいて行われ、ツールの使用と作成におけるモデルの可能性が証明および強化され、私たちにさらなる驚きをもたらしてくれると私は信じています。

記事の主著者

Qian Cheng は清華大学の学部 3 年生で、THUNLP 研究室のメンバーであり、指導者は Liu Zhiyuan です。現在の研究の方向性には、大規模モデルの事前トレーニング、大規模モデルの効率的な微調整、ツール学習が含まれます。彼は清華大学の傑出した総合コンピューティング奨学金を受賞し、EMNLP や ACL などの国際会議で共著者として論文を発表しました。

個人ホームページ: https://qiancheng0.github.io/

以上がCREATORはLLMの「自己進化」を実現するためのツールを作り、活用するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Java フレームワークの商用サポートの費用対効果を評価する方法 Java フレームワークの商用サポートの費用対効果を評価する方法 Jun 05, 2024 pm 05:25 PM

Java フレームワークの商用サポートのコスト/パフォーマンスを評価するには、次の手順が必要です。 必要な保証レベルとサービス レベル アグリーメント (SLA) 保証を決定します。研究サポートチームの経験と専門知識。アップグレード、トラブルシューティング、パフォーマンスの最適化などの追加サービスを検討してください。ビジネス サポートのコストと、リスクの軽減と効率の向上を比較検討します。

PHP フレームワークの軽量オプションはアプリケーションのパフォーマンスにどのような影響を与えますか? PHP フレームワークの軽量オプションはアプリケーションのパフォーマンスにどのような影響を与えますか? Jun 06, 2024 am 10:53 AM

軽量の PHP フレームワークは、サイズが小さくリソース消費が少ないため、アプリケーションのパフォーマンスが向上します。その特徴には、小型、高速起動、低メモリ使用量、改善された応答速度とスループット、および削減されたリソース消費が含まれます。 実際のケース: SlimFramework は、わずか 500 KB、高い応答性と高スループットの REST API を作成します。

PHP フレームワークの学習曲線は他の言語フレームワークと比較してどうですか? PHP フレームワークの学習曲線は他の言語フレームワークと比較してどうですか? Jun 06, 2024 pm 12:41 PM

PHP フレームワークの学習曲線は、言語熟練度、フレームワークの複雑さ、ドキュメントの品質、コミュニティのサポートによって異なります。 PHP フレームワークの学習曲線は、Python フレームワークと比較すると高く、Ruby フレームワークと比較すると低くなります。 Java フレームワークと比較すると、PHP フレームワークの学習曲線は中程度ですが、開始までの時間は短くなります。

Java フレームワークのパフォーマンス比較 Java フレームワークのパフォーマンス比較 Jun 04, 2024 pm 03:56 PM

ベンチマークによると、小規模で高性能なアプリケーションの場合、Quarkus (高速起動、低メモリ) または Micronaut (TechEmpower に優れた) が理想的な選択肢です。 SpringBoot は大規模なフルスタック アプリケーションに適していますが、起動時間とメモリ使用量が若干遅くなります。

Golang フレームワークのドキュメントのベスト プラクティス Golang フレームワークのドキュメントのベスト プラクティス Jun 04, 2024 pm 05:00 PM

明確で包括的なドキュメントを作成することは、Golang フレームワークにとって非常に重要です。ベスト プラクティスには、Google の Go コーディング スタイル ガイドなど、確立されたドキュメント スタイルに従うことが含まれます。見出し、小見出し、リストなどの明確な組織構造を使用し、ナビゲーションを提供します。スタート ガイド、API リファレンス、概念など、包括的で正確な情報を提供します。コード例を使用して、概念と使用法を説明します。ドキュメントを常に最新の状態に保ち、変更を追跡し、新機能を文書化します。 GitHub の問題やフォーラムなどのサポートとコミュニティ リソースを提供します。 API ドキュメントなどの実践的なサンプルを作成します。

さまざまなアプリケーションシナリオに最適な Golang フレームワークを選択する方法 さまざまなアプリケーションシナリオに最適な Golang フレームワークを選択する方法 Jun 05, 2024 pm 04:05 PM

アプリケーションのシナリオに基づいて最適な Go フレームワークを選択します。アプリケーションの種類、言語機能、パフォーマンス要件、エコシステムを考慮します。一般的な Go フレームワーク: Jin (Web アプリケーション)、Echo (Web サービス)、Fiber (高スループット)、gorm (ORM)、fasthttp (速度)。実際のケース: REST API (Fiber) の構築とデータベース (gorm) との対話。フレームワークを選択します。主要なパフォーマンスには fasthttp、柔軟な Web アプリケーションには Jin/Echo、データベース インタラクションには gorm を選択してください。

golang フレームワーク開発の実践的な詳細な説明: 質疑応答 golang フレームワーク開発の実践的な詳細な説明: 質疑応答 Jun 06, 2024 am 10:57 AM

Go フレームワーク開発における一般的な課題とその解決策は次のとおりです。 エラー処理: 管理にはエラー パッケージを使用し、エラーを一元的に処理するにはミドルウェアを使用します。認証と認可: サードパーティのライブラリを統合し、資格情報を確認するためのカスタム ミドルウェアを作成します。同時処理: ゴルーチン、ミューテックス、チャネルを使用してリソース アクセスを制御します。単体テスト: 分離のために getest パッケージ、モック、スタブを使用し、十分性を確保するためにコード カバレッジ ツールを使用します。デプロイメントとモニタリング: Docker コンテナを使用してデプロイメントをパッケージ化し、データのバックアップをセットアップし、ログ記録およびモニタリング ツールでパフォーマンスとエラーを追跡します。

Golang フレームワークの学習プロセスでよくある誤解は何ですか? Golang フレームワークの学習プロセスでよくある誤解は何ですか? Jun 05, 2024 pm 09:59 PM

Go フレームワークの学習には、フレームワークへの過度の依存と柔軟性の制限という 5 つの誤解があります。フレームワークの規則に従わない場合、コードの保守が困難になります。古いライブラリを使用すると、セキュリティと互換性の問題が発生する可能性があります。パッケージを過度に使用すると、コード構造が難読化されます。エラー処理を無視すると、予期しない動作やクラッシュが発生します。

See all articles