ホームページ > テクノロジー周辺機器 > AI > AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

PHPz
リリース: 2023-10-17 14:29:05
転載
860 人が閲覧しました

最近、国内有数の人工知能大型モデル会社 壁面知能 が新たな大きな動きを見せ、 清華大学 NLP と共同で 大型モデルを開発、発売しました。研究室 スーパーヒーロー」——XAgent

タスクテストを通じて、実際の複雑なタスクにおける XAgent の処理能力は AutoGPT を完全に上回りました。

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携


#XAgent は、実際の複雑なタスク処理において AutoGPT を完全に上回ります

  • # は GitHub 上で正式にオープンソースになりました。アドレスは https://github.com/OpenBMB/XAgent
  • ケースの表示アドレスです。 :https://x-agent.net/
  • ブログアドレス:https://blog.x-agent.net
Xエージェント この「人」はどんな人ですか?

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

LLM をコアとする AI エージェントは人間を理解できる指示を受け、複雑な計画を策定し、自律的に行​​動を起こします。

従来のエージェントは通常、人間がカスタマイズしたルールによって制限されており、限られた範囲内でしか問題を解決できません。これらは真の「自律エージェント」というよりも人間が使用する「ツール」に近く、複雑な問題を自律的に解決することは困難です。

対照的に、XAgent には

自律的な計画と意思決定

の機能が備わっており、人間による束縛のプリセットなしで独立して動作し、新しい戦略やソリューションを発見することができます。 その機能は AutoGPT を完全に上回り、多くのシーン タスクにおいて驚くべき自律性と複雑なタスク解決能力を示し、AI エージェントの知能レベルを全く新しいレベルに引き上げました。

そして、再び疑問が生じます。それはどのように実装されるのでしょうか?

「左脳と右脳」の連携、ダブルサイクル機構

人間にも「左脳」と「右脳」があるように、複雑なタスクを処理できる 一般的には「マクロ」と「ミクロ」の2つの視点で考えられ、全体の状況を調整して計画し、実行レベルでも考慮する必要があります。

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携AutoGPT と比較して、Wall-Facing Intelligence と清華大学は、XAgent ## の設計に「

ダブル ループ メカニズム#」を革新的に導入しました。 :

    外側のループ
  • : グローバルなタスク計画を担当し、複雑なタスクを実行可能な単純なタスクに分解します。
  • 内部ループ
  • : ローカル タスクの実行を担当し、詳細に重点を置きます。 二重ループ メカニズムの連携により、XAgent は大規模モデルの分野における「スーパーヒーロー」のようなもので、複雑なモデルのさまざまな側面を扱う際にスーパー プロフェッショナル精神を発揮します。タスクと豊富なスキル。

マーベル世界の「キャプテン アメリカ」と同じように、XAgent は全体的なリーダーシップと細心の注意を払った実行力を備えています。

外側のループでは、XAgent が "PlanAgent

" としてリーダーシップを発揮し、複雑なタスクをいくつかの単純なタスクに分割し、問題解決の完全なプロセスを監督します。 。

まず、特定の複雑なタスクを、より小さく管理しやすい「サブタスク」に分解し、「初期計画

」を生成し、タスク シーケンスを形成します。

その後、解決のために各サブタスクを内部ループに渡します。このプロセス中、外側のループはタスクの進行状況とステータスを継続的に監視し、フィードバックに基づいて後続の計画に対して「反復最適化

」を実行します。

内部ループでは、XAgent はその ID をすぐに変更し、効率的な 「実行者」 (ToolAgent

) としてのプロフェッショナリズムを示し、子が外部ループを確実に通過するようにします。ループ タスクは期待どおりでした。

サブタスクの性質に応じて、外部システムからツールを取得し、サブタスクを段階的に解決できます。

サブタスクが完了すると、現在のサブタスク実行プロセスの反映が生成され、それが外側のループにフィードバックされて、現在のタスクが完了したかどうか、および潜在的な最適化ポイントがあるかどうかが示されます。タスクの実行。

図に示すように、ユーザーは、XAgent がデータを分析できるように、iris.zip ファイルを XAgent に送信しました。

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

ご覧のとおり、XAgent はまず外側のループを通じてこのタスクを 4 つのサブタスクに分解します。

  1. データを確認して理解する;
  2. #システムの Python 環境をチェックして、関連するデータ分析ライブラリが存在するかどうかを確認します;
  3. # # データを処理および分析するためのデータ分析コードを作成します。
  4. #Python コードの実行結果に基づいて分析レポートを作成します。
その後、各サブタスクを実行する際、XAgent はファイルの読み書き、シェルコマンド、Python ノートブックと対応するパンダ、sci-kit の学習、データ分析ライブラリなどを巧みに利用します。 seaborn と matplotlib はデータの視覚的な分析も実行できるためです。

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携同じタスクの実行中に AutoGPT を実行すると、そこにPython 環境や関連ライブラリを確認する予定はなく、コードを書いて直接実行し始めた結果、関連ライブラリを使用する際に失敗やエラー報告が発生し、最終的には複雑なデータ分析を完了できませんでした。

人間とコンピューターのコラボレーション: エージェント インタラクションの新しいパラダイム

AutoGPT は従来の GPT モデルの制限をある程度まで突破しますが、無限ループや不正な呼び出しなどの実行エラーの現象が依然として存在しており、解決するには手動介入が必要です。

XAgent は、設計の開始時に関連する問題を検討し、人間とマシンのコラボレーションを強化するために特別に設計された対話メカニズムを導入しました。自律的にユーザーと対話し、人間にガイダンスを提供できます。介入と指導の要請。

知的エージェントにとって、「

人間と協力できるかどうか

」も、その知性を反映する重要な指標となります。 まず第一に、XAgent には

直観的なインターフェイス

があり、ユーザーは提案を直接オーバーライドまたは変更することができ、AI の効率性と人間の直感や専門知識を効果的に組み合わせることができます。 。 第 2 に、不慣れな課題に直面したとき、XAgent には「人間に助けを求める」機能があり、ユーザーからのリアルタイムのフィードバック、提案、または指導を求めて、問題を解決できるようにします。不確実な状況では、現場では、インテリジェント エージェントも最善の役割を果たすことができます。

#写真

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携##このインタラクティブなパラダイムは、有機的に統合された AI の自律性と、これは人間の知恵であり、人々と XAgent の間の新しい協力関係を示しています。

図に示すように、ユーザーは XAgent に友人とのパーティーにおいしいレストランを勧めてもらいたいと考えていますが、具体的で詳細な情報は提供されていません。

現時点で、XAgent は、現在のユーザーから提供された情報だけでは推奨を行うのに十分ではないことを認識できるため、人間にリクエストを出し、ユーザーの希望の場所、予算の範囲を尋ねます。 、味の好み、空き状況、タブーは何かなど、ユーザーからのフィードバックをもとにおすすめレストランを提供しています。

一方、AutoGPT は、インターネット上のレストラン情報を直接検索して推奨を開始しましたが、最終的な推奨結果は間違った場所に表示され、ユーザーの予算を考慮しておらず、ユーザーのニーズを満たしていない。

効率的なコミュニケーション言語、スーパーツール呼び出し

「デュアルサイクル」動作メカニズムや「人間と機械のコラボレーション」のインタラクティブ機能に関係なく、全体の設計においてこのプロジェクトでは、Wall-Facing Intelligence チームと清華大学チームは、安定性、効率性、安全性などのインテリジェント エージェントの中核機能に焦点を当てました。

そして 構造化されたコミュニケーション方法も、強力で安定したインテリジェント エージェントを構築するための重要な要素の 1 つです。

XAgent は、内部通信言語として Function Call を使用します。これには、構造化、標準化、および統一という利点があります。

  • 構造化: 関数呼び出しには、必要なコンテンツを明確に表現する明確かつ厳密な形式があり、潜在的なエラーが最小限に抑えられます。
  • 標準化: 関数呼び出しは、外部ツールとの対話プロセスを標準化し、エージェントが使用できるように共通言語を提供できます。複数のツールを統合して複雑なタスクを解決する機能。
  • 統合: 情報の概要、タスク計画、ツールの実行などのすべてのリンクを特定の関数呼び出しフォームに変換することで、それぞれのリンクがすべての側面が統一された方法で処理されるため、システム設計が簡素化されます。

#さらに、ツールの呼び出しも、AI エージェントが複雑な問題を解決する能力を持っているかどうかを評価するための重要な能力の 1 つです。

XAgent は、その設計において独自のツール実行エンジン ToolServer を作成しました。これにより、より安全、より効率的、スケーラブルなツール実行機能を実現できます。

これは分離された Docker 環境で実行され、ツールの実行によってメイン システムの安定性やセキュリティが損なわれないようにします。

#この設計は、次のような複数の利点をもたらします:

  • ##安全性: Docker コンテナ内でツールを実行すると、メイン システムが潜在的な侵害から保護されます。
  • 効率的: システムは、需要と使用パターンに基づいてノードを起動、停止、再起動して、最適なパフォーマンスを実現します。リソースの使用。
  • 拡張性: 強力なデバッグとスケーラビリティにより、コードの管理に便利です。

ToolServer の主要コンポーネントには、ToolServerNode、ToolServerMonitor、ToolServerManager が含まれており、操作の実行、ノード検査、サイクル管理などの強力な機能を提供します。

現在、XAgent の ToolSever は、FileSystemEnv、PythonNotoBook、WebEnv、ExecuteShell、RapidAPIEnv、AskHumanforHelp およびその他のツールをサポートしています。

XAgent は、いくつかの単純なタスクの実行を支援するだけでなく、モデルのトレーニングにも役立ちます。

たとえば、ユーザーは映画のレビューを分析し、映画に対する一般の評価の質を判断したいと考えています。現時点では、XAgent はまず imdb データ セットをダウンロードして BERT モデルをトレーニングし、トレーニングされた BERT モデルを使用して映画レビューを予測します。

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

#大きなモデルをリリースする潜在的に、包括的に AutoGPT を上回る

一連のタスクでテストした後、(以下の図 a および b に示すように) GPT-4 ベースの XAgent のパフォーマンスが優れていることがわかります。すべてのベンチマークでテストでは、オリジナルの GPT-4 を上回り、AutoGPT を完全に上回りました。

これらのタスクには、エージェント推論計画と、検索エンジン (FreshQA HotpotQA) で質問に答える能力、Python プログラミング能力 (MBPP)、数学的推論などの外部ツールを使用する能力が必要です。能力(MATH)、対話型プログラミング能力(InterCode)、身体的推論能力(ALFWorld)、実際の複雑なタスクなど。

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携図 a: XAgent は実際の複雑なタスク処理において AutoGPT を総合的に上回ります

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

図 b: XAgent は 6 つの点で AutoGPTXAgent を上回りますXAgent のシステム設計は GPT-4 の基本機能を完全に解放し、非常に高いテスト結果と人間の好みを達成できることがわかります。

これは、XAgent が推論計画を必要とする従来の AI テストで優れたパフォーマンスを発揮するだけでなく、複雑な現実世界の命令を処理する際にも高いパフォーマンスを発揮することを示しています

アプリケーション境界を拡大し、技術基盤を強固にする

AI エージェントの出現により、業界全体が大規模モデル テクノロジの重要な実装方向を認識できるようになり、セット全体で次のことが可能になります。複雑なプロンプトの探索を必要とせずに実現できる ワークフロー タスクの実行。

XAgent は、無限の可能性を秘めた大型モデルの「スーパーヒーロー」として、あらゆる一般人の「パーソナル アシスタント」になれます。スケジュールを計画し、旅程を手配し、生活や仕事における時間とリソースの割り当てを管理するのに役立ちます。

また、さまざまなデータ収集、処理、分析ツールを独自に使用して、大量のデータを完全に自動的に分析し、ユーザーが重要な情報を効率的に取得できるようにレポートを作成することもできます。

さらに、XAgent は外部ツールと自律計画アルゴリズムを組み合わせて、環境情報に基づいて意思決定を行い、より効率的かつ正確なタスクの実行を実現できます。

XAgent の研究開発チームは、Wall-Facing Intelligence と清華大学 THUNLP 研究室の大規模モデル分野の多数の専門家や学者で構成されています。彼らは、大型モデルの「スーパーヒーロー」に似ています。

この革新的な成果を成功裏に打ち出すことができた理由は、チームが長期にわたる科学研究作業中に一連の最先端の革新的な大規模モデル インフラを構築し、その基盤を固めたからです。技術基盤を強化し、イノベーションと研究開発の境界を拡大します。

Wallface Intelligence は、清華大学 NLP 研究室および OpenBMB オープンソース コミュニティと協力して、「トリニティ」大規模モデル産学研究エコロジカル レイアウトを作成し、複数の大規模モデル ツールを提案およびリリースしました。使用フレームワークとエンジン:

ツール学習: 大規模モデルのツール学習パラダイムは、専門的なツールと大規模モデルの利点を統合して、問題解決と自律性のより高い精度と効率を実現します。

  • BMTools: 大規模モデル学習エンジンは、言語モデルで拡張ツールを使用できるようにするオープン ソース ウェアハウスであり、オープン ソース コミュニティの構築および共有ツール プラットフォームでもあります。
  • 大規模モデル ツール学習フレームワークである ToolLLM は、大規模モデルを 16,000 の実際の API に接続し、大規模モデルが外部ツールを呼び出してより複雑なユーザー コマンド タスクを完了できるようにします。
  • WebCPM は、インターネット検索をサポートする中国分野初のモデル フレームワークであり、国内の大規模モデルの分野におけるギャップを埋め、大規模モデルが実際の Web ページ上で答えを検索できるようにします。人間と同じように時間をかけ、AIGC のリアルタイム性と精度を向上させます。

以上がAutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:51cto.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート