目次
効率的なコミュニケーション言語、スーパーツール呼び出し
AI エージェントの出現により、業界全体が大規模モデル テクノロジの重要な実装方向を認識できるようになり、セット全体で次のことが可能になります。複雑なプロンプトの探索を必要とせずに実現できる ワークフロー タスクの実行。
ホームページ テクノロジー周辺機器 AI AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

Oct 17, 2023 pm 02:29 PM
ai モデル

最近、国内有数の人工知能大型モデル会社 壁面知能 が新たな大きな動きを見せ、 清華大学 NLP と共同で 大型モデルを開発、発売しました。研究室 スーパーヒーロー」——XAgent

タスクテストを通じて、実際の複雑なタスクにおける XAgent の処理能力は AutoGPT を完全に上回りました。

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携


#XAgent は、実際の複雑なタスク処理において AutoGPT を完全に上回ります

  • # は GitHub 上で正式にオープンソースになりました。アドレスは https://github.com/OpenBMB/XAgent
  • ケースの表示アドレスです。 :https://x-agent.net/
  • ブログアドレス:https://blog.x-agent.net
Xエージェント この「人」はどんな人ですか?

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

LLM をコアとする AI エージェントは人間を理解できる指示を受け、複雑な計画を策定し、自律的に行​​動を起こします。

従来のエージェントは通常、人間がカスタマイズしたルールによって制限されており、限られた範囲内でしか問題を解決できません。これらは真の「自律エージェント」というよりも人間が使用する「ツール」に近く、複雑な問題を自律的に解決することは困難です。

対照的に、XAgent には

自律的な計画と意思決定

の機能が備わっており、人間による束縛のプリセットなしで独立して動作し、新しい戦略やソリューションを発見することができます。 その機能は AutoGPT を完全に上回り、多くのシーン タスクにおいて驚くべき自律性と複雑なタスク解決能力を示し、AI エージェントの知能レベルを全く新しいレベルに引き上げました。

そして、再び疑問が生じます。それはどのように実装されるのでしょうか?

「左脳と右脳」の連携、ダブルサイクル機構

人間にも「左脳」と「右脳」があるように、複雑なタスクを処理できる 一般的には「マクロ」と「ミクロ」の2つの視点で考えられ、全体の状況を調整して計画し、実行レベルでも考慮する必要があります。

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携AutoGPT と比較して、Wall-Facing Intelligence と清華大学は、XAgent ## の設計に「

ダブル ループ メカニズム#」を革新的に導入しました。 :

    外側のループ
  • : グローバルなタスク計画を担当し、複雑なタスクを実行可能な単純なタスクに分解します。
  • 内部ループ
  • : ローカル タスクの実行を担当し、詳細に重点を置きます。 二重ループ メカニズムの連携により、XAgent は大規模モデルの分野における「スーパーヒーロー」のようなもので、複雑なモデルのさまざまな側面を扱う際にスーパー プロフェッショナル精神を発揮します。タスクと豊富なスキル。

マーベル世界の「キャプテン アメリカ」と同じように、XAgent は全体的なリーダーシップと細心の注意を払った実行力を備えています。

外側のループでは、XAgent が "PlanAgent

" としてリーダーシップを発揮し、複雑なタスクをいくつかの単純なタスクに分割し、問題解決の完全なプロセスを監督します。 。

まず、特定の複雑なタスクを、より小さく管理しやすい「サブタスク」に分解し、「初期計画

」を生成し、タスク シーケンスを形成します。

その後、解決のために各サブタスクを内部ループに渡します。このプロセス中、外側のループはタスクの進行状況とステータスを継続的に監視し、フィードバックに基づいて後続の計画に対して「反復最適化

」を実行します。

内部ループでは、XAgent はその ID をすぐに変更し、効率的な 「実行者」 (ToolAgent

) としてのプロフェッショナリズムを示し、子が外部ループを確実に通過するようにします。ループ タスクは期待どおりでした。

サブタスクの性質に応じて、外部システムからツールを取得し、サブタスクを段階的に解決できます。

サブタスクが完了すると、現在のサブタスク実行プロセスの反映が生成され、それが外側のループにフィードバックされて、現在のタスクが完了したかどうか、および潜在的な最適化ポイントがあるかどうかが示されます。タスクの実行。

図に示すように、ユーザーは、XAgent がデータを分析できるように、iris.zip ファイルを XAgent に送信しました。

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

ご覧のとおり、XAgent はまず外側のループを通じてこのタスクを 4 つのサブタスクに分解します。

  1. データを確認して理解する;
  2. #システムの Python 環境をチェックして、関連するデータ分析ライブラリが存在するかどうかを確認します;
  3. # # データを処理および分析するためのデータ分析コードを作成します。
  4. #Python コードの実行結果に基づいて分析レポートを作成します。
その後、各サブタスクを実行する際、XAgent はファイルの読み書き、シェルコマンド、Python ノートブックと対応するパンダ、sci-kit の学習、データ分析ライブラリなどを巧みに利用します。 seaborn と matplotlib はデータの視覚的な分析も実行できるためです。

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携同じタスクの実行中に AutoGPT を実行すると、そこにPython 環境や関連ライブラリを確認する予定はなく、コードを書いて直接実行し始めた結果、関連ライブラリを使用する際に失敗やエラー報告が発生し、最終的には複雑なデータ分析を完了できませんでした。

人間とコンピューターのコラボレーション: エージェント インタラクションの新しいパラダイム

AutoGPT は従来の GPT モデルの制限をある程度まで突破しますが、無限ループや不正な呼び出しなどの実行エラーの現象が依然として存在しており、解決するには手動介入が必要です。

XAgent は、設計の開始時に関連する問題を検討し、人間とマシンのコラボレーションを強化するために特別に設計された対話メカニズムを導入しました。自律的にユーザーと対話し、人間にガイダンスを提供できます。介入と指導の要請。

知的エージェントにとって、「

人間と協力できるかどうか

」も、その知性を反映する重要な指標となります。 まず第一に、XAgent には

直観的なインターフェイス

があり、ユーザーは提案を直接オーバーライドまたは変更することができ、AI の効率性と人間の直感や専門知識を効果的に組み合わせることができます。 。 第 2 に、不慣れな課題に直面したとき、XAgent には「人間に助けを求める」機能があり、ユーザーからのリアルタイムのフィードバック、提案、または指導を求めて、問題を解決できるようにします。不確実な状況では、現場では、インテリジェント エージェントも最善の役割を果たすことができます。

#写真

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携##このインタラクティブなパラダイムは、有機的に統合された AI の自律性と、これは人間の知恵であり、人々と XAgent の間の新しい協力関係を示しています。

図に示すように、ユーザーは XAgent に友人とのパーティーにおいしいレストランを勧めてもらいたいと考えていますが、具体的で詳細な情報は提供されていません。

現時点で、XAgent は、現在のユーザーから提供された情報だけでは推奨を行うのに十分ではないことを認識できるため、人間にリクエストを出し、ユーザーの希望の場所、予算の範囲を尋ねます。 、味の好み、空き状況、タブーは何かなど、ユーザーからのフィードバックをもとにおすすめレストランを提供しています。

一方、AutoGPT は、インターネット上のレストラン情報を直接検索して推奨を開始しましたが、最終的な推奨結果は間違った場所に表示され、ユーザーの予算を考慮しておらず、ユーザーのニーズを満たしていない。

効率的なコミュニケーション言語、スーパーツール呼び出し

「デュアルサイクル」動作メカニズムや「人間と機械のコラボレーション」のインタラクティブ機能に関係なく、全体の設計においてこのプロジェクトでは、Wall-Facing Intelligence チームと清華大学チームは、安定性、効率性、安全性などのインテリジェント エージェントの中核機能に焦点を当てました。

そして 構造化されたコミュニケーション方法も、強力で安定したインテリジェント エージェントを構築するための重要な要素の 1 つです。

XAgent は、内部通信言語として Function Call を使用します。これには、構造化、標準化、および統一という利点があります。

  • 構造化: 関数呼び出しには、必要なコンテンツを明確に表現する明確かつ厳密な形式があり、潜在的なエラーが最小限に抑えられます。
  • 標準化: 関数呼び出しは、外部ツールとの対話プロセスを標準化し、エージェントが使用できるように共通言語を提供できます。複数のツールを統合して複雑なタスクを解決する機能。
  • 統合: 情報の概要、タスク計画、ツールの実行などのすべてのリンクを特定の関数呼び出しフォームに変換することで、それぞれのリンクがすべての側面が統一された方法で処理されるため、システム設計が簡素化されます。

#さらに、ツールの呼び出しも、AI エージェントが複雑な問題を解決する能力を持っているかどうかを評価するための重要な能力の 1 つです。

XAgent は、その設計において独自のツール実行エンジン ToolServer を作成しました。これにより、より安全、より効率的、スケーラブルなツール実行機能を実現できます。

これは分離された Docker 環境で実行され、ツールの実行によってメイン システムの安定性やセキュリティが損なわれないようにします。

#この設計は、次のような複数の利点をもたらします:

  • ##安全性: Docker コンテナ内でツールを実行すると、メイン システムが潜在的な侵害から保護されます。
  • 効率的: システムは、需要と使用パターンに基づいてノードを起動、停止、再起動して、最適なパフォーマンスを実現します。リソースの使用。
  • 拡張性: 強力なデバッグとスケーラビリティにより、コードの管理に便利です。

ToolServer の主要コンポーネントには、ToolServerNode、ToolServerMonitor、ToolServerManager が含まれており、操作の実行、ノード検査、サイクル管理などの強力な機能を提供します。

現在、XAgent の ToolSever は、FileSystemEnv、PythonNotoBook、WebEnv、ExecuteShell、RapidAPIEnv、AskHumanforHelp およびその他のツールをサポートしています。

XAgent は、いくつかの単純なタスクの実行を支援するだけでなく、モデルのトレーニングにも役立ちます。

たとえば、ユーザーは映画のレビューを分析し、映画に対する一般の評価の質を判断したいと考えています。現時点では、XAgent はまず imdb データ セットをダウンロードして BERT モデルをトレーニングし、トレーニングされた BERT モデルを使用して映画レビューを予測します。

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

#大きなモデルをリリースする潜在的に、包括的に AutoGPT を上回る

一連のタスクでテストした後、(以下の図 a および b に示すように) GPT-4 ベースの XAgent のパフォーマンスが優れていることがわかります。すべてのベンチマークでテストでは、オリジナルの GPT-4 を上回り、AutoGPT を完全に上回りました。

これらのタスクには、エージェント推論計画と、検索エンジン (FreshQA HotpotQA) で質問に答える能力、Python プログラミング能力 (MBPP)、数学的推論などの外部ツールを使用する能力が必要です。能力(MATH)、対話型プログラミング能力(InterCode)、身体的推論能力(ALFWorld)、実際の複雑なタスクなど。

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携図 a: XAgent は実際の複雑なタスク処理において AutoGPT を総合的に上回ります

AutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携

図 b: XAgent は 6 つの点で AutoGPTXAgent を上回りますXAgent のシステム設計は GPT-4 の基本機能を完全に解放し、非常に高いテスト結果と人間の好みを達成できることがわかります。

これは、XAgent が推論計画を必要とする従来の AI テストで優れたパフォーマンスを発揮するだけでなく、複雑な現実世界の命令を処理する際にも高いパフォーマンスを発揮することを示しています

アプリケーション境界を拡大し、技術基盤を強固にする

AI エージェントの出現により、業界全体が大規模モデル テクノロジの重要な実装方向を認識できるようになり、セット全体で次のことが可能になります。複雑なプロンプトの探索を必要とせずに実現できる ワークフロー タスクの実行。

XAgent は、無限の可能性を秘めた大型モデルの「スーパーヒーロー」として、あらゆる一般人の「パーソナル アシスタント」になれます。スケジュールを計画し、旅程を手配し、生活や仕事における時間とリソースの割り当てを管理するのに役立ちます。

また、さまざまなデータ収集、処理、分析ツールを独自に使用して、大量のデータを完全に自動的に分析し、ユーザーが重要な情報を効率的に取得できるようにレポートを作成することもできます。

さらに、XAgent は外部ツールと自律計画アルゴリズムを組み合わせて、環境情報に基づいて意思決定を行い、より効率的かつ正確なタスクの実行を実現できます。

XAgent の研究開発チームは、Wall-Facing Intelligence と清華大学 THUNLP 研究室の大規模モデル分野の多数の専門家や学者で構成されています。彼らは、大型モデルの「スーパーヒーロー」に似ています。

この革新的な成果を成功裏に打ち出すことができた理由は、チームが長期にわたる科学研究作業中に一連の最先端の革新的な大規模モデル インフラを構築し、その基盤を固めたからです。技術基盤を強化し、イノベーションと研究開発の境界を拡大します。

Wallface Intelligence は、清華大学 NLP 研究室および OpenBMB オープンソース コミュニティと協力して、「トリニティ」大規模モデル産学研究エコロジカル レイアウトを作成し、複数の大規模モデル ツールを提案およびリリースしました。使用フレームワークとエンジン:

ツール学習: 大規模モデルのツール学習パラダイムは、専門的なツールと大規模モデルの利点を統合して、問題解決と自律性のより高い精度と効率を実現します。

  • BMTools: 大規模モデル学習エンジンは、言語モデルで拡張ツールを使用できるようにするオープン ソース ウェアハウスであり、オープン ソース コミュニティの構築および共有ツール プラットフォームでもあります。
  • 大規模モデル ツール学習フレームワークである ToolLLM は、大規模モデルを 16,000 の実際の API に接続し、大規模モデルが外部ツールを呼び出してより複雑なユーザー コマンド タスクを完了できるようにします。
  • WebCPM は、インターネット検索をサポートする中国分野初のモデル フレームワークであり、国内の大規模モデルの分野におけるギャップを埋め、大規模モデルが実際の Web ページ上で答えを検索できるようにします。人間と同じように時間をかけ、AIGC のリアルタイム性と精度を向上させます。

以上がAutoGPTを総合的に超え、Wall-Facing Intelligenceが清華NLP研究所のオープンソース大型モデル「Superhero」XAgentと連携の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Laravelの地理空間:インタラクティブマップと大量のデータの最適化 Laravelの地理空間:インタラクティブマップと大量のデータの最適化 Apr 08, 2025 pm 12:24 PM

700万のレコードを効率的に処理し、地理空間技術を使用したインタラクティブマップを作成します。この記事では、LaravelとMySQLを使用して700万を超えるレコードを効率的に処理し、それらをインタラクティブなマップの視覚化に変換する方法について説明します。最初の課題プロジェクトの要件:MySQLデータベースに700万のレコードを使用して貴重な洞察を抽出します。多くの人は最初に言語をプログラミングすることを検討しますが、データベース自体を無視します。ニーズを満たすことができますか?データ移行または構造調​​整は必要ですか? MySQLはこのような大きなデータ負荷に耐えることができますか?予備分析:キーフィルターとプロパティを特定する必要があります。分析後、ソリューションに関連している属性はわずかであることがわかりました。フィルターの実現可能性を確認し、検索を最適化するためにいくつかの制限を設定しました。都市に基づくマップ検索

MySQLを解決する方法は開始できません MySQLを解決する方法は開始できません Apr 08, 2025 pm 02:21 PM

MySQLの起動が失敗する理由はたくさんあり、エラーログをチェックすることで診断できます。一般的な原因には、ポートの競合(ポート占有率をチェックして構成の変更)、許可の問題(ユーザー許可を実行するサービスを確認)、構成ファイルエラー(パラメーター設定のチェック)、データディレクトリの破損(テーブルスペースの復元)、INNODBテーブルスペースの問題(IBDATA1ファイルのチェック)、プラグインロード障害(エラーログのチェック)が含まれます。問題を解決するときは、エラーログに基づいてそれらを分析し、問題の根本原因を見つけ、問題を防ぐために定期的にデータをバックアップする習慣を開発する必要があります。

インストール後にMySQLの使用方法 インストール後にMySQLの使用方法 Apr 08, 2025 am 11:48 AM

この記事では、MySQLデータベースの操作を紹介します。まず、MySQLWorkBenchやコマンドラインクライアントなど、MySQLクライアントをインストールする必要があります。 1. mysql-uroot-pコマンドを使用してサーバーに接続し、ルートアカウントパスワードでログインします。 2。CreatedAtaBaseを使用してデータベースを作成し、データベースを選択します。 3. createTableを使用してテーブルを作成し、フィールドとデータ型を定義します。 4. INSERTINTOを使用してデータを挿入し、データをクエリし、更新することでデータを更新し、削除してデータを削除します。これらの手順を習得することによってのみ、一般的な問題に対処することを学び、データベースのパフォーマンスを最適化することでMySQLを効率的に使用できます。

酸性特性を理解する:信頼できるデータベースの柱 酸性特性を理解する:信頼できるデータベースの柱 Apr 08, 2025 pm 06:33 PM

データベース酸属性の詳細な説明酸属性は、データベーストランザクションの信頼性と一貫性を確保するための一連のルールです。データベースシステムがトランザクションを処理する方法を定義し、システムのクラッシュ、停電、または複数のユーザーの同時アクセスの場合でも、データの整合性と精度を確保します。酸属性の概要原子性:トランザクションは不可分な単位と見なされます。どの部分も失敗し、トランザクション全体がロールバックされ、データベースは変更を保持しません。たとえば、銀行の譲渡が1つのアカウントから控除されているが別のア​​カウントに増加しない場合、操作全体が取り消されます。 TRANSACTION; updateaccountssetbalance = balance-100wh

mysqlはjsonを返すことができますか mysqlはjsonを返すことができますか Apr 08, 2025 pm 03:09 PM

MySQLはJSONデータを返すことができます。 json_extract関数はフィールド値を抽出します。複雑なクエリについては、Where句を使用してJSONデータをフィルタリングすることを検討できますが、そのパフォーマンスへの影響に注意してください。 JSONに対するMySQLのサポートは絶えず増加しており、最新バージョンと機能に注意を払うことをお勧めします。

リモートシニアバックエンジニア(プラットフォーム)がサークルが必要です リモートシニアバックエンジニア(プラットフォーム)がサークルが必要です Apr 08, 2025 pm 12:27 PM

リモートシニアバックエンジニアの求人事業者:サークル場所:リモートオフィスジョブタイプ:フルタイム給与:$ 130,000- $ 140,000職務記述書サークルモバイルアプリケーションとパブリックAPI関連機能の研究開発に参加します。ソフトウェア開発ライフサイクル全体をカバーします。主な責任は、RubyonRailsに基づいて独立して開発作業を完了し、React/Redux/Relay Front-Endチームと協力しています。 Webアプリケーションのコア機能と改善を構築し、機能設計プロセス全体でデザイナーとリーダーシップと緊密に連携します。肯定的な開発プロセスを促進し、反復速度を優先します。 6年以上の複雑なWebアプリケーションバックエンドが必要です

MySQLはダウンロード後にインストールできません MySQLはダウンロード後にインストールできません Apr 08, 2025 am 11:24 AM

MySQLのインストール障害の主な理由は次のとおりです。1。許可の問題、管理者として実行するか、SUDOコマンドを使用する必要があります。 2。依存関係が欠落しており、関連する開発パッケージをインストールする必要があります。 3.ポート競合では、ポート3306を占めるプログラムを閉じるか、構成ファイルを変更する必要があります。 4.インストールパッケージが破損しているため、整合性をダウンロードして検証する必要があります。 5.環境変数は誤って構成されており、環境変数はオペレーティングシステムに従って正しく構成する必要があります。これらの問題を解決し、各ステップを慎重に確認して、MySQLを正常にインストールします。

バングラ部分モデル検索のlaravelEloquent orm) バングラ部分モデル検索のlaravelEloquent orm) Apr 08, 2025 pm 02:06 PM

LaravelEloquentモデルの検索:データベースデータを簡単に取得するEloquentormは、データベースを操作するための簡潔で理解しやすい方法を提供します。この記事では、さまざまな雄弁なモデル検索手法を詳細に紹介して、データベースからのデータを効率的に取得するのに役立ちます。 1.すべてのレコードを取得します。 ALL()メソッドを使用して、データベーステーブルですべてのレコードを取得します:useapp \ models \ post; $ post = post :: all();これにより、コレクションが返されます。 Foreach Loopまたはその他の収集方法を使用してデータにアクセスできます。

See all articles