ホームページ テクノロジー周辺機器 AI 「人間 + RPA」から「人間 + 生成 AI + RPA」へ、LLM は RPA と人間とコンピューターのインタラクションにどのような影響を与えるのでしょうか?

「人間 + RPA」から「人間 + 生成 AI + RPA」へ、LLM は RPA と人間とコンピューターのインタラクションにどのような影響を与えるのでしょうか?

Jun 05, 2023 pm 12:30 PM
rpa llm 生成AI

「人間 + RPA」から「人間 + 生成 AI + RPA」へ、LLM は RPA と人間とコンピューターのインタラクションにどのような影響を与えるのでしょうか?

画像出典@visualChina

文 | 王継偉

「人間による RPA」から「人間が生成する AI RPA」へ、LLM は RPA と人間とコンピューターのインタラクションにどのような影響を及ぼしますか?

別の観点から見ると、人間とコンピューターの相互作用の観点から、LLM は RPA にどのような影響を及ぼしますか?

プログラム開発やプロセス自動化における人間とコンピューターの対話に影響を与える RPA も、LLM によって変更される予定ですか?

LLM は人間とコンピューターの相互作用にどのような影響を与えますか?生成 AI は RPA と人間とコンピューターのインタラクションをどのように変えるのでしょうか?理解すべき 1 つの記事:

  • 大規模モデルの時代が到来し、LLM に基づく生成 AI が RPA の人間とコンピューターのインタラクションを急速に変革しています;
  • 生成 AI は人間とコンピューターの対話を再定義し、LLM は RPA ソフトウェア アーキテクチャの変化に影響を与えています。

RPA がプログラム開発と自動化にどのような貢献をしているかを尋ねると、答えの 1 つは、人間とコンピューターの相互作用 (HCI、人間とコンピューターの相互作用) を変えることです。

従来のワークフロー自動化ツールでは、ソフトウェア開発者はアクションのリストを生成し、タスクを自動化し、内部アプリケーション プログラミング インターフェイス (API) または特殊なスクリプト言語を使用してバックエンド システムとインターフェイスする必要がありました。

RPA システムは、ユーザーがアプリケーションのグラフィカル ユーザー インターフェイス (GUI) でそのタスクを実行するのを観察してアクション リストを作成し、これらのタスクを GUI で直接繰り返すことで自動化を実行し、複数のアプリケーションにわたって自動化を提供できます。

「プラグイン」と呼ばれるこの一見単純な形式は、製品で自動化を使用する際の障壁を効果的に軽減し、より多くの組織でエンドツーエンドの自動化をさらに可能にします。

デジタル ワーカーの働き方を変えるビジネス プロセス自動化テクノロジとして、20 年以上にわたって人材を単純な反復作業から解放するだけでなく、プログラム開発も容易にしてきました。同時に、「ヒューマン RPA」人間とコンピューターの対話モデルも作成され、組織が人間とコンピューターのコラボレーションをより簡単に実現できるようになります。

特に近年、十分に成熟し、柔軟でスケーラブルで信頼性の高い RPA プラットフォームが出現して以来、多くの大規模組織は RPA を使用してビジネス プロセスと開発モデルを改善および最適化し、効率の向上とコスト削減を達成できます。

上記の実現は、RPA によるビジネス プロセスの自動化とプログラム開発における人間とコンピューターの対話の継続的な改善と最適化によるものです。

はい、多くのテクノロジーに支えられてきた RPA は、より多くの業界に浸透し続けており、さまざまな分野のさまざまなビジネス シナリオにおいて、人間とコンピューターのインタラクションを変化させ続けています。

特に近年、RPA が再び人気を博しているのは、まさに AI テクノロジーを深く統合しているからです。 RPA を中核としたハイパーオートメーション テクノロジーのコレクションには、すべてのオートメーション関連テクノロジーが含まれており、エンドツーエンドの自動化された人間とコンピューターのインタラクション エクスペリエンスが継続的に強化され、より多くの組織に支持されるようになります。

現在、大規模な AI モデルの時代が到来し、進化する RPA にも生成 AI テクノロジーが統合されています。 LLM(Large Language Model、大規模言語モデル)を統合した現在の RPA は、人間とコンピュータのインタラクションにおける大きな進歩であり、以前の RPA モデルを覆すものであるとさえ言えます。

私たちは RPA の人間とコンピューターの対話に対する LLM の影響について話したいので、当然のことながら人間とコンピューターの対話から始める必要があります。 LLM は人間とコンピューターの相互作用にどのような影響を与えますか? RPA は人間とコンピューターのインタラクションをどのように改善するのでしょうか? LLM は RPA にどのような影響を与えますか?

この記事では、Wang Jiwei Channel がこれらについてお話しします。

人間とコンピューターの対話について話しましょう

1970 年代、ほとんどのオフィスでは依然として金属ファイル、タイプライター、大量の紙を使用して業務を行っていました。また、かさばるコンピューターは、数人しか操作できない冷蔵室にしか保管できません。

これらの問題を解決するために、いくつかの企業がパーソナル コンピュータの開発を始めました。ゼロックスは 1973 年に Xerox Alto を開発しました。この製品は高コストやその他の問題により発売されませんでしたが、GUI の最初のスケッチとなり、Macintosh と Windows のインスピレーションの源となりました。

一連の研究とそれに対応する研究開発、および当時の小型コンピュータに対する市場の強い需要の影響を受けて、コンピュータをより使いやすくする方法とその理由を研究する手段として、人間とコンピュータのインタラクションの概念が誕生しました。そして、1970 年代後半から 1980 年代前半にかけて、新しい分野が登場しました。

それ以来、HCI の分野は発展を続け、主に社会の最も複雑な問題を解決するために人間の行動を分析し、人々がどのようにコンピューターと対話するか、そしてユーザーがどの程度までコンピューターと対話できるかを研究するという目標を達成するために使用されてきました。コンピュータとユーザーの関係を改善するために、相互に適切な対話を行い、より適切な開発が必要な分野を探ります。

当時の社会生産性の深刻な矛盾を解決する能力により、HCI の研究分野は短期間に IT 分野全体に広がりました。

同時に研究者たちは、コンピューターとの対話を情報技術の専門家だけでなく、あらゆる人々に拡張する必要があることに気づきました。その結果、数年以内に、HCI は情報テクノロジ設計のほぼすべての変更を組み込むまでに急速に拡大しました。

スティーブ ジョブズらの努力のおかげで、Apple は 1984 年に Macintosh パーソナル コンピュータを発売し、人間とコンピュータの相互作用の形を完全に変えました。これにより、コンピュータの使用が容易になり、コミュニケーションがより簡単になり、キーボード、マウス、およびアイコンベースのユーザー インターフェイスが普及しました。

その後、Apple がパーソナル PC の先駆者となり、Microsoft が Windows システムを発売し、これらの製品とソフトウェアは世界的なビジネス プロセスとオフィスの人間とコンピュータの対話形式を完全に変え、破壊しました。

これらは誰もがよく知っているので、ここで紹介する必要はありません。

今日に至るまで、IoT はネットワーク接続の基礎となり、人工知能はユビキタスになり、人間とコンピューターの対話は依然としてさまざまなテクノロジー、製品、ソリューションの焦点となっています。

これまでの簡単な開発の歴史を通じて、誰もがすでに人間とコンピューターの相互作用について一般的な理解を持っているはずだと思います。では、人間とコンピュータの相互作用とは一体何でしょうか?次のセクションを見てみましょう。

人間とコンピューターの相互作用の 4 つの要素、6 つの目標、および 7 つの原則

一般的な定義では、ヒューマン・コンピュータ・インタラクション技術(ヒューマン・コンピュータ・インタラクション技術)とは、コンピュータの入出力装置を介して人間とコンピュータとの間の対話を効果的な方法で実現する技術を指すと考えられています。

ヒューマン・コンピュータ・インタラクション技術には、出力装置または表示装置を介して大量の関連情報と指示のプロンプトを提供する機械と、入力装置を介して人間が関連情報を機械に入力し、質問に答え、指示を求めるなどが含まれます。したがって、人間とコンピュータのインタラクション技術は、コンピュータのユーザーインターフェイス設計における重要な内容の一つです。

学術的には、ヒューマン コンピュータ インタラクションは、人間が使用する対話型コンピューティング システムの設計、評価、実装、およびそれらを取り巻く主要な現象の研究に関係する分野です。

ヒューマン コンピューター インタラクションは、人間 (ユーザー) とコンピューターの間のインターフェイス (対話インターフェイス)、およびコンピューター テクノロジの設計と使用に焦点を当てています。人間とコンピューターのインタラクションは、コンピューター科学、心理学、社会学、グラフィック デザイン、工業デザインなどを含む多くの分野をカバーしており、非常に包括的な現代科学です。

Wikipedia は、人間とコンピューターの間のインターフェースがこの相互作用を促進するために重要であると考えています。デスクトップ アプリケーション、インターネット ブラウザ、ハンドヘルド コンピュータなどは、今日の一般的な GUI を利用しています。音声認識および合成システムは、音声ユーザー インターフェイス (VUI) を利用します。

新しいマルチモーダルおよびグラフィカル ユーザー インターフェイスにより、人々は他のインターフェイスではできない方法で特定のキャラクターやエージェントと対話できるようになります。

つまり、人間とコンピューターのインタラクション分野の発展により、インタラクションの質が向上し、多くの新しい研究分野が生まれました。従来のインターフェイスを設計する代わりに、さまざまな分野の研究が、単峰性の代わりに多峰性、コマンド/操作ベースのインターフェイスの代わりにスマート適応型インターフェイス、および受動的なインターフェイスの代わりにアクティブなインターフェイスの概念に焦点を当てています。

人間とコンピューターの対話という名前から、それは 3 つの部分、つまりユーザー、コンピューター自体、およびそれらが連携する方法で構成されていることが推測できます。

その後、これら 3 つの部分は、ユーザー、タスク、ツール/インターフェイス、および背景という 4 つの基本要素に拡張されました。

  • ユーザー、つまりプロジェクトで共同作業する個人または個人のグループは、ユーザー コンポーネントと呼ばれます。 HCI はユーザーのニーズ、目標、インタラクション スタイルを研究しています。
  • タスク、つまり目標指向のタスク コンピュータを使用するとき、ユーザーは常に目的や目標を持っています。これを達成するために、コンピューターは物事をデジタル表現で表現します。
  • インターフェイス、つまり、ユーザー インタラクションの品質を向上させることができる基本的な HCI 要素はインターフェイスです。インタラクションの種類、画面解像度、ディスプレイ サイズ、さらには色のコントラストなど、考慮すべきインターフェイス関連の要素が数多くあります。
  • 背景、HCI はユーザーとコンピューター間の通信を改善するだけでなく、システムがアクセスされるコンテキストや環境も考慮に入れます。

同時に、HCI には、効率的な使用 (efficiency)、安全な使用 (security)、優れた実用性 (practicalability)、学びやすさ (learnability)、および使用方法を覚えやすい (memorability) という 6 つの目標があります。

これに基づいて、HCI の 7 つの設計原則も次のように導き出されます。

原則 1: フェアユース;

原則 2: 柔軟な使用;

原則 3: シンプルで直感的な使用法;

原則 4: 知覚可能な情報;

原則 5: フォールトトレランス;

原則 6: 肉体労働が少ない;

原則 7: サイズとスペースにアプローチして使用します。

特定のアプリケーションでは、モノのインターネット、視線追跡技術、音声認識技術、AR/VR およびクラウド コンピューティングの使用はすべて、人間とコンピューターの対話の非常に典型的なケースです。

HCI の開発の歴史と多数の意見や事例は、テクノロジーが HCI を大幅に改善できることを証明しています。

通信および情報テクノロジーの画期的な進歩と発展により、HCI に大きな影響と改善をもたらし続けています。たとえば、近年 AI テクノロジーの助けを借りて普及している RPA は、ビジネス プロセスの自動化やオフィスのビジネス シナリオに、人間とコンピューターのインタラクションとエクスペリエンスを大幅に向上させました。

人間とコンピューターのインタラクションと RPA

人間とコンピューターの対話の目標は、コンピューターが人間のニーズによりよく適応し、音声認識、画像認識、自然言語処理、ジェスチャーなどの、よりフレンドリーでスマート、より自然な対話方法を提供できるようにすることであると前述しました。 .コントロールなど

RPA は、ソフトウェア ロボットを使用して人間の操作をシミュレートするテクノロジーであり、ユーザー インターフェイスを通じてエンタープライズ アプリケーション システムと対話し、予想されるタスクを実行できます。

現代の RPA には、人工知能 (AI) と機械学習 (ML) も組み込まれており、インテリジェント プロセス オートメーション (IPA) を実現し、自然言語処理 (NLP)、コンピューター ビジョン (CV)、データ分析などのより複雑なユースケースを処理します。等

RPA は、反復的なルールベースのワークフローを自動化し、作業効率、正確性、コンプライアンスを向上させ、人件費を削減し、エラー率を削減し、コストと時間を節約することができ、さまざまな反復的で標準化されたタスクに適しています。 、人材、サプライチェーン、情報技術など。

Wang Jiwei Channel はかつて、「デジタル変革の時代において、RPA AI は人間と機械のコラボレーションを可能にする最良の方法である」という記事の中で、現代の企業管理ソフトウェア システムやさまざまな自動化ツールにおいて、運用の観点から述べました。難易度、導入サイクル、投資 コストの観点から見ると、RPA は組織が人間とマシンのコラボレーションを適用する最良の方法であると考えられます。

中でもRPAの最大のメリットは、プログラム開発の難易度を下げ、簡単なアプリケーション開発に第一線のビジネスマンが参加できるようになり、国家発展をより現実のものにすることです。

RPA でこれができる理由は、プログラム開発における人間とコンピューターの対話モデルを変えるからです。これにより、プログラミングができない一般社員でもRPAツールを利用して、プログラマーと同様に必要な自動化プログラムやソフトウェアロボットを開発できるようになります。

RPA を使用すると、コードの作成からさまざまな機能コンポーネントの「ドラッグ アンド ドロップ」に至るまで、プログラムの開発が容易になる一方で、より多くのビジネス プロセスを自動化し、人的労力を必要としなくなります。 。 RPA は、プログラム開発とビジネス実行における人間とコンピューターの相互作用を同時に変えたと言えます。

つまり、RPA は人間とコンピューターの対話と密接に関係しています。 RPA は本質的に人間と機械の共同作業モデルであるため、人間がルールを定義し、実行を監督し、最適化して改善する必要があるのに対し、機械はルールの実行、フィードバックの提供、学習と改善を担当します。

RPA は人間の操作をシミュレートするだけでなく、AI テクノロジーを組み合わせて人間の理解と意思決定を実現します。たとえば、OCR (光学文字認識) テクノロジーは画像内のテキストを識別するために使用され、NLP テクノロジーは言語の意図を理解するために使用され、インテリジェントな意思決定テクノロジーは最適なソリューションを策定するために使用されます。

AIなどの技術を融合したRPAには以下のようなメリットがあります。

1. 仕事の負担を効果的に軽減し、人々を退屈なバックグラウンドタスクから解放し、より価値のあるイノベーションと戦略的な仕事に集中させます;

2. 人間とコンピューターの対話の速度と品質を向上します。ソフトウェア ロボットは、時間、場所、感情に影響されず、24 時間稼働することができ、間違いや省略を犯しません。

3. 人間とコンピューターの対話の範囲と深さを拡大する ソフトウェア ロボットは、関連性のない複数のソフトウェア システムにアクセスして統合し、大量の構造化データと非構造化データを処理し、学習と最適化に AI と ML の機能を使用できます。

このように、RPA は人間とコンピューターのインタラクションを最適化するための効果的かつ代表的なテクノロジーです。プロセスの自動化、インテリジェンス、最適化を実現し、企業に効率、品質、価値の向上をもたらします。

人間とコンピューターの相互作用に対する LLM の影響

LLM は、ニューラル ネットワークを使用して、大量のラベルなしテキストに対して自己教師あり学習または半教師あり学習を実行する言語モデルです。 LLM には膨大な数のパラメータ (通常は数十億以上) があり、さまざまなタスクで優れたパフォーマンスを発揮します。

さまざまな分野での現在のアプリケーションから判断すると、LLM に基づく生成 AI テクノロジーの出現は、人間とコンピューターの対話に破壊的な変化をもたらしました。

生成 AI が人々に与える最も直接的な感覚は、元のワークフローにおけるさまざまなソフトウェア操作やソフトウェア間操作の多くが、生成 AI とのわずか数回の対話で完了できるようになるということです。

たとえば、Midjourney を使用して画像を生成したり、ChatGPT Plus を使用してソフトウェア アプリケーション コードを生成したりする場合、描画ソフトウェアやプログラミング ソフトウェアを使用する必要はまったくありません。また、ChatGPTのプラグインエコシステムは急速に向上しており、将来的には対話だけで完結するアプリケーションシナリオでの業務も増えてくるでしょう。

これはインタラクション方法の変更であり、さまざまなソフトウェア UI を使用した人間とコンピューターの本来のインタラクションを、チャット ウィンドウとのインタラクションに直接変更し、前例のないインタラクティブなエクスペリエンスを実現します。

要約すると、LLM または生成 AI は、人間とコンピューターの対話に次のような影響を与えます:

まず第一に、人間とコンピューターの対話の効率、品質、利便性が向上します。 生成 AI を通じて、ユーザーは多くの時間とエネルギーを費やすことなく、必要な情報やサービスを迅速に入手できます。同時に、LLM はユーザー入力とコンテキストに基づいて適切な応答を生成できるため、ユーザー入力の負担が軽減され、対話の流暢さと自然さが向上します。さらに、生成 AI は、ユーザーのフィードバックや好みに基づいて出力を動的に調整し、より優れたインタラクティブ効果を実現できます。

たとえば、ChatGPT は、ユーザーが執筆、デザイン、プログラミングなどの複雑なタスクを完了するのを支援したり、パーソナライズされた推奨事項、相談、エンターテイメント、その他のコンテンツをユーザーに提供したりできます。

第二に、人間とコンピューターの対話の多様性と創造性を高めます。 LLM は、ユーザーのニーズや好みに基づいてさまざまなスタイルのテキスト、オーディオ、ビデオ、その他のコンテンツを生成し、ユーザーのパーソナライズされた多様なニーズを満たすことができます。生成 AI を通じて、ユーザーはより多くのコンテンツにアクセスして選択できるため、視野と思考が広がります。もちろん、生成 AI は、ユーザーとより深く柔軟な会話をして、ユーザーのさまざまな感情的ニーズや感情的ニーズを満たすこともできます。

たとえば、生成 AI を使用して、さまざまなスタイルやテーマのテキスト、画像、音楽などをユーザーに提供したり、詩、物語、ジョークなどの斬新で興味深いコンテンツをユーザーに生成したりできます。

第三に、人間とコンピューターの相互作用の関係と意味を変えます。 生成 AI を通じて、ユーザーは人工知能とのより密接で信頼できるつながりを確立し、共創や協力の感覚を生み出すことさえできます。

LLM に基づくチャットボットは、ユーザーにさらに多くのフィードバックや提案を提供したり、考えや感情をユーザーと共有したりできます。生成 AI は、ユーザーが自分自身の知能と人工知能の長所と限界、そしてそれらをより良く活用し開発する方法をより認識させることもできます。

第 4 に、人間とコンピューターの相互作用の分野とシナリオを拡大します。 ChatGPT などの生成 AI アプリケーションは、高い適応性と汎用性を備えており、教育、エンターテイメント、医療、ビジネスなどのさまざまな分野やシナリオに適用できます。ユーザーは、学びたい、遊びたい、相談したい、買い物したいなど、ChatGPT などのアプリケーションと通信することで目的を達成できます。

5 番目に、人間とコンピューターの対話の楽しさと親密さを強化します。 LLM に基づく生成 AI アプリケーションは豊富な知識と個性を備えており、ユーザーの興味や感情に応じて言語スタイルやトピックを調整したり、ユーザーを楽しませるためにユーモア、詩、物語、その他の創造的なコンテンツを生成することもできます。

これにより、ユーザーはロボットとのコミュニケーションを退屈なものと感じることなく、ロボットとのコミュニケーションが面白くて温かいものであると感じるようになります。

LLM は人間とコンピューターの相互作用に重要かつ複雑な影響を与え、さまざまな分野で大きな開発の可能性と業界への応用価値をもたらします。組織は、人間とコンピューターの相互作用のレベルとエクスペリエンスを向上させ、人間とコンピューターの相互作用の効率と品質を向上させ、人間とコンピューターの相互作用関係を強化し、人間とコンピューターの分野とシナリオを拡大するために、LLM と生成 AI を積極的に探索および活用する必要があります。交流。

もちろん、それがもたらすリスクと課題、そしてそれを合理的に使用および監督する方法にも注意を払う必要があります。

大規模な言語モデルに基づく生成 AI は、RPA と急速に統合されつつあることに注意してください。生成 AI は、RPA の人間とコンピューターのインタラクションに質的な飛躍をもたらすでしょう。

LLM は RPA と人間とコンピューターのインタラクションを変える

RPA は、反復的で定期的な価値の低いビジネス プロセスを自動化できるため、効率が向上し、コストが削減され、エラーが削減されます。しかし、複雑で変化する高価値のビジネス シナリオを処理することの難しさ、ビジネス プロセスの変化に適応することの難しさ、継続的なメンテナンスと更新の必要性、複雑で非構造化されたビジネス シナリオを処理することの難しさなど、いくつかの課題と制限にも直面しています。創造力や判断力を必要とする仕事など。

超自動化アーキテクチャにより、RPA の動作は十分に安定しましたが、複雑なプロセスの安定した動作には隠れた危険も存在します。

これまで各メーカーはこれらの問題を解決するためにさまざまな工夫をしてきましたが、根本的に解決することはできませんでした。 LLM に基づく生成 AI が登場するまで、それまで RPA が直面していた複数の問題が突然解決されました。

LLMがRPAに与える影響については、すでにWang Jiweiチャンネル(id:jiwei1122)の記事「 GPTなどのビッグAIモデルが登場、RPAベースのスーパーオートメーションは依然として最良の実装キャリア 」で詳しく紹介されています。

ここでは、LLM が RPA の人間とコンピューターの対話をどのように変えるかについて簡単に説明しましょう。

LLM は、より強力な自然言語処理機能、より強力な知識の取得と推論機能、およびより強力な生成と作成機能を RPA に提供できます。

具体的には、LLM が RPA と人間とコンピューターの対話に及ぼす影響は、次の側面に反映されます。

RPA のインテリジェンス レベルを向上させます。 LLM を適用すると、ユーザーの自然言語入力をより適切に識別して理解し、ユーザーのニーズと意図をより適切に満たす自然言語を生成できます。また、コンテキストと目標に基づいて適切な操作ステップを生成し、複数ラウンドの対話と推論を実行し、より複雑で多様なビジネス シナリオを処理し、より複雑で柔軟なビジネス プロセスの自動化を実現することもできます。

ユーザーは、複雑なプログラミングやドラッグ アンド ドロップ コンポーネントを使用してプロセスを設計する必要がなく、音声またはテキストを通じて RPA に話しかけ、実行するタスクを指示できます。

さらに、LLM は RPA による知識の抽出と推論の実行を支援し、より価値のある情報と提案を提供します。

RPAの適用範囲を拡大します。 LLM は RPA の適用範囲を効果的に拡張し、ソフトウェア ロボットがテキスト分類、テキスト要約、テキスト生成、機械翻訳、質疑応答システムなどの自然言語を含むより多くのタスクを処理できるようにします。また、画像、音声、ビデオなどの他の形式のデータと対話して、より豊かで多次元のビジネス プロセスを実現することもできます。

LLM を使用すると、ソフトウェア ロボットが OCR、NLP、ローコード、プロセス マイニング、チャットボットなどの他の AI テクノロジーと統合および連携して、超自動化を実現することもできます。

LLM を使用することで、RPA は言語や文化の壁を越え、より広範囲で多様な顧客や市場にサービスを提供できます。

RPA のイノベーションの可能性を高めます。 LLM は RPA の創造性と柔軟性を強化し、さまざまなシナリオやデータに基づいてレポート、概要、推奨事項などの適切なテキストを生成できるようにします。たとえば、RPA はユーザーが指定したキーワードやトピックに基づいてブログ記事を自動的に生成し、関連する写真、ビデオ、リンクなどを記事に挿入できます。

LLM を使用することで、RPA はより柔軟で適応的な学習と生成を実行し、より斬新で興味深いコンテンツとソリューションを生成できます。 LLM はまた、人間とより効果的かつ友好的にコラボレーションおよびコミュニケーションを行うことができ、より多くの創造性とインスピレーションを刺激します。

RPA開発効率を向上します。 Generative AI を使用すると、ユーザーは複雑なコードを記述したりグラフィカル インターフェイスを使用したりすることなく、単純な言語記述を通じてビジネス プロセスを定義および変更できます。また、ユーザーのフィードバックとデータ分析に基づいてビジネス プロセスを最適化および調整して、継続的な改善を達成できます。

RPA インタラクション エクスペリエンスとユーザー満足度を最適化します。 LLM と統合された RPA は、ユーザーとより自然でフレンドリーで興味深い会話を行うことができ、ユーザーの信頼と参加を高めます。 RPA は、ユーザーの感情や興味に応じてトーンやスタイルを調整したり、ユーモアを伝えたり、有名な名言を引用して雰囲気を調整したりすることもできます。

詳細な資料: ChatGPT は RPA と統合され、生成 AI 自動化プロセスにより AIGC の価値が 2 倍になります

もちろん、LLM が RPA の人間とコンピューターの相互作用に及ぼす影響は、インテリジェンス、効率、イノベーションのレベルだけでなく、RPA ソフトウェア アーキテクチャの変化にも直接影響します。

追記: LLMの影響でRPAのアーキテクチャが変更されました

LLM が登場する前は、RPA によってプログラム開発とプロセス自動化における人間とコンピューターの対話が大幅に改善されました。また、すでに多くのメーカーが「誰もが利用できるRPA」というコンセプトを打ち出しています。このコンセプトの背景には、RPA がますます使いやすくなり、それを使用したプログラムの開発やプロセスの自動化の実装が容易になっているという点があります。

使いやすさの点で、メーカーは CV から画面キャプチャ、AI モデルに至るまで、多くの探求と試みを行ってきました。 RPAプログラムの開発プロセスでは、AIやゼロコードなどの技術をベースに、当初の「ドラッグ&ドロップ」形式を徐々に廃止し、「クリックして使用」や会話型(音声を含む)プロセス作成に移行しつつあります。方法。

人間とコンピューターの対話という観点から見ると、会話型プロセスの作成は RPA、さらにはハイパーオートメーションの究極の状態であると言えます。将来的には、システムに数行入力したり、一言発言したりするだけで、さまざまなソフトウェア ロボットや自動プログラムを作成できるハイパーオートメーションが使用されます。

しかし、以前の会話形式の作成は、単純な事前設定プロセスにのみ適しています。わずかに複雑なプロセスは非効率的であるか、達成するためにより多くのプロセスをトリガーして動員するためにより多くのプロセス ステップが必要になります。プロセスの堅牢性をテストするのは難しく、ユーザーは対応する構文とその使用手順を熟知している必要があります。

アプリケーションのエクスペリエンスに関しては、まだいくつかの欠点や改善の余地があります。

LLM の登場後、生成 AI を組み込んだ RPA 製品では、ユーザーは RPA を駆動して自然言語を使用したプロセスを作成できるようになりました。

そして、生成 AI は、感情認識や非構造化データ処理などにおける RPA の欠点を生成されたコンテンツの形で補い、誰でも多くの学習を必要とせずに RPA を駆動してさまざまな種類の開発をより簡単、迅速、効率的に行うことができます。この手順により、真に誰でも RPA を利用できるようになります。

これまで RPA を使用する場合、RPA を直接操作して、ビルディング ブロックをドラッグ アンド プルすることでさまざまなプログラムを構築していました。 GPTなどの生成AIと自然言語でコミュニケーションをとり、人間の操作意図を理解した上でマルチモーダルAIがRPAをさらに推進し、企業管理ソフトウェアと連携してさまざまな業務プロセスを自動化するようになりました。

GPT などの AI 大型モデルは、人々と RPA などのシステムをさらに結び付け、人々の意図を上向きに結び付け、RPA ロボットを下向きに導き、人と RPA などの自動化システムの間のリンクとなり、プログラム開発と自動化プロセスの運用を簡素化します。 。

GPT は人と RPA ベースのハイパーオートメーションを結び付けます。これは、人間とコンピューターの対話エクスペリエンスにおいて大きな進歩です。

Wang Jiwei Channel によると、過去の「人間による RPA」から現在の「人間が生成する AI RPA」に至るまで、LLM と統合生成 AI の導入により、RPA 製品の人間とコンピューターのインタラクションは大幅に改善されましたが、本質的には以上は、LLM が RPA のアーキテクチャ変更に影響を与えるということです。

現在、ほぼすべてのメーカーが LLM、RPA、ハイパーオートメーションの包括的な統合について熱心に研究しており、RPA は製品アーキテクチャにモデル層を追加しています。

これは、サードパーティ モデルであっても、自社開発モデルであっても、RPA がモデル層の標準アプリケーションになったことを意味します。

LLM が RPA の標準構成になるにつれて、大規模モデルの時代の RPA にも包括的な革命が起こると予測できます。

以上が「人間 + RPA」から「人間 + 生成 AI + RPA」へ、LLM は RPA と人間とコンピューターのインタラクションにどのような影響を与えるのでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Groq Llama 3 70B をローカルで使用するためのステップバイステップ ガイド Groq Llama 3 70B をローカルで使用するためのステップバイステップ ガイド Jun 10, 2024 am 09:16 AM

翻訳者 | Bugatti レビュー | Chonglou この記事では、GroqLPU 推論エンジンを使用して JanAI と VSCode で超高速応答を生成する方法について説明します。 Groq は AI のインフラストラクチャ側に焦点を当てているなど、誰もがより優れた大規模言語モデル (LLM) の構築に取り組んでいます。これらの大型モデルがより迅速に応答するためには、これらの大型モデルからの迅速な応答が鍵となります。このチュートリアルでは、GroqLPU 解析エンジンと、API と JanAI を使用してラップトップ上でローカルにアクセスする方法を紹介します。この記事では、これを VSCode に統合して、コードの生成、コードのリファクタリング、ドキュメントの入力、テスト ユニットの生成を支援します。この記事では、独自の人工知能プログラミングアシスタントを無料で作成します。 GroqLPU 推論エンジン Groq の概要

カリフォルニア工科大学の中国人がAIを使って数学的証明を覆す!タオ・ゼシュアンの衝撃を5倍にスピードアップ、数学的ステップの80%が完全に自動化 カリフォルニア工科大学の中国人がAIを使って数学的証明を覆す!タオ・ゼシュアンの衝撃を5倍にスピードアップ、数学的ステップの80%が完全に自動化 Apr 23, 2024 pm 03:01 PM

テレンス・タオなど多くの数学者に賞賛されたこの正式な数学ツール、LeanCopilot が再び進化しました。ちょうど今、カリフォルニア工科大学のアニマ・アナンドクマール教授が、チームが LeanCopilot 論文の拡張版をリリースし、コードベースを更新したと発表しました。イメージペーパーのアドレス: https://arxiv.org/pdf/2404.12534.pdf 最新の実験では、この Copilot ツールが数学的証明ステップの 80% 以上を自動化できることが示されています。この記録は、以前のベースラインのイソップよりも 2.3 倍優れています。そして、以前と同様に、MIT ライセンスの下でオープンソースです。写真の彼は中国人の少年、ソン・ペイヤンです。

なぜ生成 AI はさまざまな業界で求められているのでしょうか? なぜ生成 AI はさまざまな業界で求められているのでしょうか? Mar 30, 2024 pm 07:36 PM

生成 AI は、テキスト、画像、音声、合成データなどのさまざまな種類のコンテンツを生成できる人間の人工知能テクノロジーの一種です。では、人工知能とは何でしょうか?人工知能と機械学習の違いは何ですか?人工知能は、コンピューター サイエンスの一分野であり、自律的に推論し、学習し、アクションを実行できるシステムであるインテリジェント エージェントの作成を研究する学問です。人工知能の核心は、人間のように考え、人間のように行動する機械を構築する理論と方法に関係しています。この分野では、機械学習 ML は人工知能の分野です。入力データに基づいてモデルをトレーニングするプログラムまたはシステムです。トレーニングされたモデルは、モデルがトレーニングされた統合データから派生した新しいデータまたは未確認のデータから有用な予測を行うことができます。

Plaud、NotePin AI ウェアラブル レコーダーを 169 ドルで発売 Plaud、NotePin AI ウェアラブル レコーダーを 169 ドルで発売 Aug 29, 2024 pm 02:37 PM

Plaud Note AI ボイスレコーダー (Amazon で 159 ドルで購入可能) を開発した企業 Plaud が新製品を発表しました。 NotePin と呼ばれるこのデバイスは AI メモリ カプセルとして説明されており、Humane AI Pin と同様にウェアラブルです。ノートピンは

GenAI および LLM の技術面接に関する 7 つのクールな質問 GenAI および LLM の技術面接に関する 7 つのクールな質問 Jun 07, 2024 am 10:06 AM

AIGC について詳しくは、51CTOAI.x コミュニティ https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou を参照してください。これらの質問は、インターネット上のどこでも見られる従来の質問バンクとは異なります。既成概念にとらわれずに考える必要があります。大規模言語モデル (LLM) は、データ サイエンス、生成人工知能 (GenAI)、および人工知能の分野でますます重要になっています。これらの複雑なアルゴリズムは人間のスキルを向上させ、多くの業界で効率とイノベーションを推進し、企業が競争力を維持するための鍵となります。 LLM は、自然言語処理、テキスト生成、音声認識、推奨システムなどの分野で幅広い用途に使用できます。 LLM は大量のデータから学習することでテキストを生成できます。

ナレッジグラフ検索用に強化された GraphRAG (Neo4j コードに基づいて実装) ナレッジグラフ検索用に強化された GraphRAG (Neo4j コードに基づいて実装) Jun 12, 2024 am 10:32 AM

Graph Retrieval Enhanced Generation (GraphRAG) は徐々に普及しており、従来のベクトル検索方法を強力に補完するものとなっています。この方法では、グラフ データベースの構造的特徴を利用してデータをノードと関係の形式で編成し、それによって取得された情報の深さと文脈の関連性が強化されます。グラフには、相互に関連する多様な情報を表現および保存するという自然な利点があり、異なるデータ型間の複雑な関係やプロパティを簡単に把握できます。ベクトル データベースはこの種の構造化情報を処理できず、高次元ベクトルで表される非構造化データの処理に重点を置いています。 RAG アプリケーションでは、構造化グラフ データと非構造化テキスト ベクトル検索を組み合わせることで、両方の利点を同時に享受できます。これについてこの記事で説明します。構造

FAISS ベクトル空間を視覚化し、RAG パラメータを調整して結果の精度を向上させます FAISS ベクトル空間を視覚化し、RAG パラメータを調整して結果の精度を向上させます Mar 01, 2024 pm 09:16 PM

オープンソースの大規模言語モデルのパフォーマンスが向上し続けるにつれて、コードの作成と分析、推奨事項、テキストの要約、および質問と回答 (QA) ペアのパフォーマンスがすべて向上しました。しかし、QA に関しては、LLM はトレーニングされていないデータに関連する問題に対応していないことが多く、多くの内部文書はコンプライアンス、企業秘密、またはプライバシーを確​​保するために社内に保管されています。これらの文書がクエリされると、LLM は幻覚を起こし、無関係なコンテンツ、捏造されたコンテンツ、または矛盾したコンテンツを生成する可能性があります。この課題に対処するために考えられる手法の 1 つは、検索拡張生成 (RAG) です。これには、生成の品質と精度を向上させるために、トレーニング データ ソースを超えた信頼できるナレッジ ベースを参照して応答を強化するプロセスが含まれます。 RAG システムには、コーパスから関連する文書断片を取得するための検索システムが含まれています。

Google AI、開発者向けに Gemini 1.5 Pro と Gemma 2 を発表 Google AI、開発者向けに Gemini 1.5 Pro と Gemma 2 を発表 Jul 01, 2024 am 07:22 AM

Google AI は、Gemini 1.5 Pro 大規模言語モデル (LLM) を皮切りに、拡張コンテキスト ウィンドウとコスト削減機能へのアクセスを開発者に提供し始めました。以前は待機リストを通じて利用可能でしたが、完全な 200 万トークンのコンテキストウィンドウが利用可能になりました

See all articles