つい最近、スタンフォード大学教授のアンドリュー・ン氏が講演の中でインテリジェント・エージェントの大きな可能性について言及し、これも多くの議論を引き起こしました。その中で、Ng Enda 氏は、GPT-3.5 に基づいて構築されたエージェント ワークフローは、アプリケーションで GPT-4 よりも優れたパフォーマンスを発揮すると述べました。これは、対象を大規模なモデルに限定することが必ずしも賢明ではなく、エージェントが使用する基本モデルよりも優れている可能性があることを示しています。
ソフトウェア開発の分野では、これらのエージェントは、効率的に連携し、プログラミングにおける複雑な問題を処理し、さらには自動コード生成を実行する独自の能力を実証してきました。最新の技術トレンドは、AI スマート コミュニケーションがソフトウェア開発において大きな可能性を示していることを示しています。デビンを覚えていますか?世界初のAIソフトウェアエンジニアとして知られるが、1人のエージェントがこれほどの体験をもたらすことができ、複数のエージェントが連携すれば経験値を直接的に最大化できるのだろうかと驚かされた。
複数のエージェントからなるチームを想像してください。各メンバーはコード レビュー、エラー検出、新機能の実装などの特定のタスクを専門としています。これらのインテリジェントなエンティティは、互いの機能を補完し、ソフトウェア プロジェクトの進行を共同で促進できます。これでプログラマーの手が解放され、腱鞘炎を心配する必要もなくなるのではないでしょうか?
Wu Enda は、この分野を深く掘り下げ、インテリジェント システムの最新の開発を調査する記事を書きました。このような背景から、記事内で言及されている AutoGen や LangGraph などのツールが登場しました。これらのツールは、開発者が AI エージェントをより簡単に展開および管理し、その可能性を最大限に発揮できるように設計されています。その能力を利用すれば、プログラミングの専門知識がない人でも AI エージェントを活用してソフトウェア開発プロセスを最適化および自動化できます。以下は、「Heart of the Machine」を原文の意味を変えずに編集・翻訳したものです。
#元のリンク: https://www.deeplearning.ai/the-batch/issue-245/エージェントのコラボレーションは、最近の手紙で説明した 4 つの主要な AI エージェント設計パターンの最後のものです。ソフトウェアの作成などの複雑なタスクの場合、マルチエージェント アプローチでは、タスクをさまざまな役割 (ソフトウェア エンジニア、プロダクト マネージャー、デザイナー、QA エンジニアなど) が実行するサブタスクに分割し、異なるエージェントが異なるタスクを完了できるようにします。
LLM (または複数の LLM) を提供して、さまざまなタスクを実行するさまざまなエージェントを構築できます。たとえば、ソフトウェア エンジニア エージェントを構築するには、LLM を提供します。「あなたは明確で効率的なコードを書くのが専門です。タスクを実行するコードを書いてください...」。
同じ大規模言語モデル (LLM) を複数回呼び出しますが、マルチエージェント プログラミングの抽象化アプローチを採用しています。これは直感に反するように思えるかもしれませんが、これをサポートする理由はいくつかあります。 ###############それは動作します!多くのチームがこのアプローチを使用して効果を上げており、その結果ほど説得力のあるものはありません。さらに、アブレーション研究 (AutoGen の論文など) では、複数の薬剤が単一の薬剤よりも優れたパフォーマンスを発揮することが示されています。
現在の LLM の中には非常に長い入力コンテキストを受け入れることができるものもありますが (たとえば、Gemini 1.5 Pro は 100 万個のトークンを受け入れることができます)、長くて複雑な入力を真に理解する能力は異なります。エージェントのワークフローを採用し、LLM が一度に 1 つのことに集中してパフォーマンスを向上できるようにします。
人材の管理は難しいですが、これは私たちにとって非常に馴染みのあることであり、AI エージェントを「雇用」し、タスクを割り当てる方法に関する精神的な枠組みを提供します。幸いなことに、AI エージェントの誤った管理による損害は、人間の誤った管理よりもはるかに小さいです。
AutoGen、Crew AI、LangGraph などの新しいフレームワークは、問題を解決するための豊富なマルチエージェント ソリューションを提供します。楽しいマルチエージェント システムで遊ぶことに興味がある場合は、仮想ソフトウェア会社を運営するエージェントのコレクションのオープン ソース実装である ChatDev をチェックしてください。 GitHub リポジトリをチェックアウトして、リポジトリをクローンして自分でシステムを実行することもできます。必ずしも期待どおりの結果が得られるとは限りませんが、そのパフォーマンスの良さに驚かれるかもしれません。
この設計パターンを計画するときと同様に、特にエージェントに自由な対話を許可し、エージェントに複数のツールを提供する場合、マルチエージェント コラボレーションの出力の品質を予測するのは難しいことがわかりました。反映とツールの使用のより成熟したパターンは、より信頼性が高くなります。これらのエージェント設計パターンを楽しんで遊んでいただき、素晴らしい結果が得られることを願っています。さらに詳しく知りたい場合は、次の記事をご覧ください:
論文タイトル: METAGPT: マルチエージェント連携フレームワークのためのメタ プログラミング
この記事を読んだ後、ネチズンは大いに刺激を受けましたが、同じまたは類似のタスクを実行する際のマルチエージェント システムの安定性と予測可能性がまだ不十分であると指摘する人もいます。検討する必要があります。マルチエージェントのコラボレーションの長所と短所は何だと思いますか?
以上がAndrew Ng: マルチエージェントのコラボレーションが新たな鍵となり、ソフトウェア開発などのタスクがより効率化されるでしょうの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。