最近、国内有数の人工知能大型モデル会社 壁面知能 が新たな大きな動きを見せ、 清華大学 NLP と共同で 大型モデルを開発、発売しました。研究室 スーパーヒーロー」——XAgent。
タスクテストを通じて、実際の複雑なタスクにおける XAgent の処理能力は AutoGPT を完全に上回りました。
#XAgent は、実際の複雑なタスク処理において AutoGPT を完全に上回ります
LLM をコアとする AI エージェントは人間を理解できる指示を受け、複雑な計画を策定し、自律的に行動を起こします。
従来のエージェントは通常、人間がカスタマイズしたルールによって制限されており、限られた範囲内でしか問題を解決できません。これらは真の「自律エージェント」というよりも人間が使用する「ツール」に近く、複雑な問題を自律的に解決することは困難です。
対照的に、XAgent には
自律的な計画と意思決定の機能が備わっており、人間による束縛のプリセットなしで独立して動作し、新しい戦略やソリューションを発見することができます。 その機能は AutoGPT を完全に上回り、多くのシーン タスクにおいて驚くべき自律性と複雑なタスク解決能力を示し、AI エージェントの知能レベルを全く新しいレベルに引き上げました。
そして、再び疑問が生じます。それはどのように実装されるのでしょうか?
「左脳と右脳」の連携、ダブルサイクル機構
AutoGPT と比較して、Wall-Facing Intelligence と清華大学は、XAgent ## の設計に「
ダブル ループ メカニズム#」を革新的に導入しました。 :
マーベル世界の「キャプテン アメリカ」と同じように、XAgent は全体的なリーダーシップと細心の注意を払った実行力を備えています。
外側のループでは、XAgent が "PlanAgent
" としてリーダーシップを発揮し、複雑なタスクをいくつかの単純なタスクに分割し、問題解決の完全なプロセスを監督します。 。まず、特定の複雑なタスクを、より小さく管理しやすい「サブタスク」に分解し、「初期計画
」を生成し、タスク シーケンスを形成します。その後、解決のために各サブタスクを内部ループに渡します。このプロセス中、外側のループはタスクの進行状況とステータスを継続的に監視し、フィードバックに基づいて後続の計画に対して「反復最適化
」を実行します。内部ループでは、XAgent はその ID をすぐに変更し、効率的な 「実行者」 (ToolAgent
) としてのプロフェッショナリズムを示し、子が外部ループを確実に通過するようにします。ループ タスクは期待どおりでした。サブタスクの性質に応じて、外部システムからツールを取得し、サブタスクを段階的に解決できます。 サブタスクが完了すると、現在のサブタスク実行プロセスの反映が生成され、それが外側のループにフィードバックされて、現在のタスクが完了したかどうか、および潜在的な最適化ポイントがあるかどうかが示されます。タスクの実行。 図に示すように、ユーザーは、XAgent がデータを分析できるように、iris.zip ファイルを XAgent に送信しました。 ご覧のとおり、XAgent はまず外側のループを通じてこのタスクを 4 つのサブタスクに分解します。
同じタスクの実行中に AutoGPT を実行すると、そこにPython 環境や関連ライブラリを確認する予定はなく、コードを書いて直接実行し始めた結果、関連ライブラリを使用する際に失敗やエラー報告が発生し、最終的には複雑なデータ分析を完了できませんでした。 人間とコンピューターのコラボレーション: エージェント インタラクションの新しいパラダイム XAgent は、設計の開始時に関連する問題を検討し、人間とマシンのコラボレーションを強化するために特別に設計された対話メカニズムを導入しました。自律的にユーザーと対話し、人間にガイダンスを提供できます。介入と指導の要請。 知的エージェントにとって、「 」も、その知性を反映する重要な指標となります。 まず第一に、XAgent には があり、ユーザーは提案を直接オーバーライドまたは変更することができ、AI の効率性と人間の直感や専門知識を効果的に組み合わせることができます。 。 第 2 に、不慣れな課題に直面したとき、XAgent には「人間に助けを求める」機能があり、ユーザーからのリアルタイムのフィードバック、提案、または指導を求めて、問題を解決できるようにします。不確実な状況では、現場では、インテリジェント エージェントも最善の役割を果たすことができます。
#写真 ##このインタラクティブなパラダイムは、有機的に統合された AI の自律性と、これは人間の知恵であり、人々と XAgent の間の新しい協力関係を示しています。 図に示すように、ユーザーは XAgent に友人とのパーティーにおいしいレストランを勧めてもらいたいと考えていますが、具体的で詳細な情報は提供されていません。 現時点で、XAgent は、現在のユーザーから提供された情報だけでは推奨を行うのに十分ではないことを認識できるため、人間にリクエストを出し、ユーザーの希望の場所、予算の範囲を尋ねます。 、味の好み、空き状況、タブーは何かなど、ユーザーからのフィードバックをもとにおすすめレストランを提供しています。 一方、AutoGPT は、インターネット上のレストラン情報を直接検索して推奨を開始しましたが、最終的な推奨結果は間違った場所に表示され、ユーザーの予算を考慮しておらず、ユーザーのニーズを満たしていない。 「デュアルサイクル」動作メカニズムや「人間と機械のコラボレーション」のインタラクティブ機能に関係なく、全体の設計においてこのプロジェクトでは、Wall-Facing Intelligence チームと清華大学チームは、安定性、効率性、安全性などのインテリジェント エージェントの中核機能に焦点を当てました。 そして 構造化されたコミュニケーション方法も、強力で安定したインテリジェント エージェントを構築するための重要な要素の 1 つです。 XAgent は、内部通信言語として Function Call を使用します。これには、構造化、標準化、および統一という利点があります。 #さらに、ツールの呼び出しも、AI エージェントが複雑な問題を解決する能力を持っているかどうかを評価するための重要な能力の 1 つです。 XAgent は、その設計において独自のツール実行エンジン ToolServer を作成しました。これにより、より安全、より効率的、スケーラブルなツール実行機能を実現できます。 これは分離された Docker 環境で実行され、ツールの実行によってメイン システムの安定性やセキュリティが損なわれないようにします。 #この設計は、次のような複数の利点をもたらします: ToolServer の主要コンポーネントには、ToolServerNode、ToolServerMonitor、ToolServerManager が含まれており、操作の実行、ノード検査、サイクル管理などの強力な機能を提供します。 現在、XAgent の ToolSever は、FileSystemEnv、PythonNotoBook、WebEnv、ExecuteShell、RapidAPIEnv、AskHumanforHelp およびその他のツールをサポートしています。 XAgent は、いくつかの単純なタスクの実行を支援するだけでなく、モデルのトレーニングにも役立ちます。 たとえば、ユーザーは映画のレビューを分析し、映画に対する一般の評価の質を判断したいと考えています。現時点では、XAgent はまず imdb データ セットをダウンロードして BERT モデルをトレーニングし、トレーニングされた BERT モデルを使用して映画レビューを予測します。 これらのタスクには、エージェント推論計画と、検索エンジン (FreshQA HotpotQA) で質問に答える能力、Python プログラミング能力 (MBPP)、数学的推論などの外部ツールを使用する能力が必要です。能力(MATH)、対話型プログラミング能力(InterCode)、身体的推論能力(ALFWorld)、実際の複雑なタスクなど。 図 a: XAgent は実際の複雑なタスク処理において AutoGPT を総合的に上回ります 図 b: XAgent は 6 つの点で AutoGPTXAgent を上回りますXAgent のシステム設計は GPT-4 の基本機能を完全に解放し、非常に高いテスト結果と人間の好みを達成できることがわかります。 これは、XAgent が推論計画を必要とする従来の AI テストで優れたパフォーマンスを発揮するだけでなく、複雑な現実世界の命令を処理する際にも高いパフォーマンスを発揮することを示しています アプリケーション境界を拡大し、技術基盤を強固にする XAgent は、無限の可能性を秘めた大型モデルの「スーパーヒーロー」として、あらゆる一般人の「パーソナル アシスタント」になれます。スケジュールを計画し、旅程を手配し、生活や仕事における時間とリソースの割り当てを管理するのに役立ちます。 また、さまざまなデータ収集、処理、分析ツールを独自に使用して、大量のデータを完全に自動的に分析し、ユーザーが重要な情報を効率的に取得できるようにレポートを作成することもできます。 さらに、XAgent は外部ツールと自律計画アルゴリズムを組み合わせて、環境情報に基づいて意思決定を行い、より効率的かつ正確なタスクの実行を実現できます。 XAgent の研究開発チームは、Wall-Facing Intelligence と清華大学 THUNLP 研究室の大規模モデル分野の多数の専門家や学者で構成されています。彼らは、大型モデルの「スーパーヒーロー」に似ています。 この革新的な成果を成功裏に打ち出すことができた理由は、チームが長期にわたる科学研究作業中に一連の最先端の革新的な大規模モデル インフラを構築し、その基盤を固めたからです。技術基盤を強化し、イノベーションと研究開発の境界を拡大します。 Wallface Intelligence は、清華大学 NLP 研究室および OpenBMB オープンソース コミュニティと協力して、「トリニティ」大規模モデル産学研究エコロジカル レイアウトを作成し、複数の大規模モデル ツールを提案およびリリースしました。使用フレームワークとエンジン: ツール学習: 大規模モデルのツール学習パラダイムは、専門的なツールと大規模モデルの利点を統合して、問題解決と自律性のより高い精度と効率を実現します。
その後、各サブタスクを実行する際、XAgent はファイルの読み書き、シェルコマンド、Python ノートブックと対応するパンダ、sci-kit の学習、データ分析ライブラリなどを巧みに利用します。 seaborn と matplotlib はデータの視覚的な分析も実行できるためです。
AutoGPT は従来の GPT モデルの制限をある程度まで突破しますが、無限ループや不正な呼び出しなどの実行エラーの現象が依然として存在しており、解決するには手動介入が必要です。
効率的なコミュニケーション言語、スーパーツール呼び出し
一連のタスクでテストした後、(以下の図 a および b に示すように) GPT-4 ベースの XAgent のパフォーマンスが優れていることがわかります。すべてのベンチマークでテストでは、オリジナルの GPT-4 を上回り、AutoGPT を完全に上回りました。
AI エージェントの出現により、業界全体が大規模モデル テクノロジの重要な実装方向を認識できるようになり、セット全体で次のことが可能になります。複雑なプロンプトの探索を必要とせずに実現できる ワークフロー タスクの実行。
以上がAutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。