人間の発達においてテクノロジー 歴史を通じて、自動化は主な原動力であり、人間が複雑で危険で退屈な労働環境から解放されるのを助けてきました。初期の農業時代の水車灌漑から工業時代の蒸気機関に至るまで、人類は重労働から解放されるために、より高度な自動化技術を絶えず追求してきました。
情報化時代の到来とともに情報処理、ストレージ、通信の基盤としてのソフトウェアは、人間の生産と生活に切り離せない部分となっており、ロボット プロセス オートメーション (RPA) テクノロジーの形成を促進しています。手動でコンパイルされたルールを通じて複数のソフトウェアを統合されたワークフロー (ワークフロー) に調整し、ソフトウェアと対話して人間の対話をシミュレートすることで効率的な実行を実現します。
#この図では、ロボティック プロセス オートメーション (RPA) とエージェント プロセス オートメーション (APA) を比較します。
RPA (ロボティック プロセス オートメーション) は、ソフトウェア ロボットまたは「BOT」を使用して、反復的かつ定期的なタスクをシミュレートして実行し、人的リソースを解放し、作業効率を向上させます。 RPAの適用範囲は非常に広いです。多くの企業 (銀行、保険会社、製造業、小売業、その他の業界を含む) は通常、RPA ロボットを使用して、データ入力、データ抽出、データ処理などの日常的で退屈なタスクを自動化します。タスクを自動化することで、RPA はエラー率を大幅に削減し、24 時間年中無休でタスクを実行できるため、ビジネスの信頼性と応答性が向上します。
#市場調査によると、RPA 市場は急速に成長しており、大きな成功を収めること。 Gartner は、世界の RPA 市場の収益は 2023 年までに 33 億米ドルに達し、成長率は 17.5% になると予測しています。これは、企業が RPA に対して非常に高い需要と認識を持っていることを示していますただし、RPA が代替できるのは単純で機械的な人間の作業のみであり、一部の複雑なプロセスは依然として手作業に依存しています:
幸いなことに、 AI 分野における大規模言語モデル エージェント テクノロジ (大規模言語モデル ベースのエージェント、LLM ベースのエージェント) の最近の出現は、自動化テクノロジの新たな可能性を生み出す可能性があります。
エージェント テクノロジーの柔軟性を RPA 分野に導入して、人間の関与をさらに減らすことは可能ですか?
チームの研究では、大規模モデル エージェント時代の新しい自動化パラダイム「エージェント プロセス オートメーション」(APA) を調査しています。従来の RPA と比較して、APA パラダイムでは、エージェントは人間のニーズに応じて自律的にワークフローの構築を完了することができ、同時に人間のニーズのうち動的な意思決定が必要な部分を特定し、それらを自動的にワークフローに統合し、この部分はワークフローの実行を積極的に引き継ぎ、対応する複雑な決定を完了します。APA の可能性を探るため、この研究作業では自動エージェント ProAgent を実装しました。ProAgent は人間の指示を受け取り、ワークフロー DataAgent および ControlAgent 内にありながらコードを生成することでワークフローを構築できます。ワークフローにおける複雑なデータ処理と論理制御を実現するために導入されています。 ProAgent の研究は、大規模モデル エージェントの時代における APA の実現可能性を実証し、LLM 時代における自動化テクノロジーの新たな可能性も明らかにしています。
メソッドの紹介
#図 3 エージェント ワークフロー記述言語の例 ProAgent では、LLM 自体がコード データで事前にトレーニングされているため、強力なコーディング能力を習得したため、この研究はコードベースのエージェント ワークフロー記述言語に基づいています。この言語は、JSON を使用してワークフロー内のデータを整理および管理し、Python 構文を使用してワークフローの論理制御を実装します。制御フロー内のジャンプ、ループなどは Python 構文を通じて直接表現されますが、ワークフロー内のツールはcall は Python 関数としてカプセル化されます。そのため、ProAgent では、ワークフロー構築タスクがコード生成タスクに変換されます。 ProAgentは人間の指示を受けると、対応するAgentic Workflow description Languageを記述することでワークフロー構築の自動化を実現します。 複雑な現実のタスクには通常、次のようなものが含まれます。動的な意思決定、単純な Python スタイルのロジック制御ルールや JSON スタイルのデータ編成は、柔軟なニーズに対応する場合には役に立たないため、現時点ではエージェントを導入する必要があります。したがって、この研究作業では、2 つのエージェント操作をさらに定義します: 1. DataAgent: 複雑なデータ処理要件の場合、ワークフローの構築時に自然言語を使用して処理を記述します。次に、実行時に DataAgent を初期化し、自然言語記述に基づいてデータ処理タスクを自律的に処理して完了します。
2. ControlAgent: ルールで表現するのが難しい論理的な制御ルールについては、ワークフローを構築するときに自然言語を使用して制御ロジックを記述します。その後、実行時に ControlAgent が初期化され、自然言語記述に基づいてワークフローの後半で実行する必要があるブランチを自律的に選択します。
#ProAgent は ReACT モードを使用してワークフローを段階的に構築します。これには 4 つのワークフロー構築ステップが含まれます: Action_Define: ワークフローに追加するツールを決定します。 #この例では、ProAgent ワークフロー構築プロセスの図 5 を示しています。 さらに、 ProAgent の効果を最適化するために、いくつかの最適化テクニックが導入されています。 1.建設時のテスト: 建設プロセス中、ProAgent はテスト後にワークフローを変更します。ワークフローが正確であることを確認します。 Agentic Process Automationの実現可能性を検証するために、本研究ではOpenAI GPT-4を基本モデルとして、オープンソースRPAプラットフォームn8nを基本モデルとして使用しています。通信事業者は、前述の ProAgent を実装します。同時に、柔軟性と効率性の両方が必要なタスクを設計しました。これは、Google スプレッドシートからさまざまな事業分野の利益データを抽出し、ビジネスが 2B か 2C かに基づいてその後のアクションを決定する必要がある典型的なビジネス シナリオです。事業分野が 2C であると判断されると、メッセージが Slack チャネルに送信されます。 2B の事業分野の場合、事業分野の評価と簡単な収益性の概要を含む電子メールが各マネージャーに送信されます。 #図 6 タスク指示の表示 書き換える必要がある内容は次のとおりです。 , まず第一に、これは繰り返しの作業であり、複数の製品ラインに同じプロセスを採用する必要があります。第二に、事業ラインが 2C か 2B かを区別することは非常に困難であり、その後のワークフローを決定するにはエージェントによる動的な意思決定が必要です。最後に、ビジネスラインの評価メールを書くには、ある程度の知性が必要なので、エージェントの介入が必要です。 ProAgent 世代では、このタスクのために、4 つのプログラムが含まれています。アトミック操作が記述され、DataAgent と ControlAgent のワークフローが作成されました。全体的なプロセスは大まかに以下の図に示すとおりです。 図 7 ProAgent ワークフロー構築プロセスの表示 それがわかります。 ProAgent が自動的にコードを記述する方法により、手動介入なしでワークフロー構築プロセスが自動的に完了します。事業内容が2Bか2Cかを判断する必要がある場合、ProAgentはControlAgentを導入して判断するため、ControlAgentのプロンプトを「事業内容がtoCかtoBかを決定する」に設定します。事業分野が 2B の場合、ProAgent は DataAgent も導入します。そのタスクは、「利益の事業分野について提案を添えてメールを作成する」というタスクに設定されており、エージェントの知性を利用して実際の状況に基づいてメールを作成します。さまざまなビジネス分野のメール。 ワークフローを作成して固定すると、ワークフローは、効率的なデータ処理のために、さまざまなデータに応じてさまざまなロジックに自動的に分岐します。 2C ビジネス ライン データを処理する場合、ControlAgent は次のことができます。事業分野の説明に基づいて現在の事業分野のタイプを判断し、コミュニケーションに Slack ツールを使用することを選択します。 2B ビジネスラインデータを処理する場合、DataAgent は電子メールを作成し、対応するマネージャーのメールボックスに送信できます。 概要 チーム関連の研究
実現可能性検証
この調査では、新しいことを提案しています。自動化パラダイム - 大規模モデルの時代に適したエージェントティック プロセス オートメーションが開発されています。従来のロボティック プロセス オートメーション テクノロジーと比較して、エージェントティック プロセス オートメーションはワークフローの構築を自動化し、ワークフロー実行中の動的な意思決定の自動化を実現できます。この研究では、ProAgent もさらに開発され、自動化における大規模モデル エージェントの実現可能性と可能性が実験的に実証されました。将来的には、大型モデル エージェント テクノロジーが人間をより高いレベルの自動化を達成し、重労働から解放するのに役立つと私は信じています
現在、研究チームは、次のような大規模なモデル エージェントの方向で多くの研究を実施しています。 XAgent: 複雑な要素を解体できる超強力なモデル エージェント アプリケーション フレームワークタスクが自動的に実行され、効率的に実行されます。
以上がProAgent: OpenAI が主導するインテリジェントエージェントが人的資源を解放、清華大学などの大学がリリースの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。