ChatGPT と生成 AI がデジタル変革において何を意味するか

PHPz
リリース: 2023-05-15 10:19:12
転載
1153 人が閲覧しました

ChatGPT と生成 AI がデジタル変革において何を意味するか

ChatGPT を開発した会社である OpenAI は、モルガン スタンレーが実施したケーススタディを Web サイトで紹介しています。テーマは、「モルガン・スタンレー・ウェルス・マネジメントは、膨大な知識ベースを整理するために GPT-4 を導入しています。」ケーススタディでは、モルガン・スタンレーの分析、データ、イノベーション部門の責任者であるジェフ・マクミラン氏の言葉を引用しています。このチャットボットは、資産管理コンテンツの包括的な検索を実行し、モルガン・スタンレー・ウェルス・マネジメントの蓄積された知識を効果的に解き放ちます。」

マクミラン氏はさらに次のように強調しました:「GPT-4を使用すると、基本的に資産管理において最も知識のある人の知識がすぐに得られます...当社のチーフ投資ストラテジスト、チーフ世界経済専門家、グローバル株式ストラテジストと考えてください。 、および世界中の他のアナリスト全員が毎日待機しています。私たちは、これが当社にとって変革をもたらす能力であると信じています。」

これがナレッジ マネジメントです 最終的な目標は、組織の知識と情報を具体化する能力です。顧客とやり取りするシステム、プロセス、ツールに関する専門知識。

それでは、この目標は本当に達成されたのでしょうか? 生成 AI は知識へのアクセス、検索、応用に対する答えなのでしょうか? 情報の混乱に対する勝利を宣言する前に、いくつかの基本的な要素と考慮事項を考慮することが重要です。

まず、生成型 AI がナレッジ マネジメントの課題を克服できるという認識の背後には、ナレッジが明示的に文書化された形式で存在するという前提があります。しかし、ほとんどの企業では、知識は従業員の頭の中に閉じ込められており、デジタル形式で保存されている場合、部門、テクノロジー、リポジトリのエコシステム内のサイロに分散されています。 OpenAIはさらにウェブサイトで、モルガン・スタンレーが資本市場、資産クラス、業界分析、世界経済地域をカバーする論文を毎年何千本も出版していると指摘している...この豊富な知識がモルガン・スタンレーにとって独自の豊富な知識を生み出している。 GPT-4 を使用して処理および解析できるライブラリであり、内部的に制御されます。モルガン・スタンレーは、ChatGPT の大規模言語モデルを使用するための基礎を形成できる知識を持っています。企業のコンテンツやナレッジ リソースにアクセスできない場合、品質が低い場合、または顧客や従業員のニーズと一致しない場合、ChatGPT はそれらのニーズに対応する特定のナレッジにアクセスできません。

2 つ目は、生成型人工知能がコンテンツを作成することです。これは検索メカニズムではありません。では、元のナレッジ ベースはどのように使用されるのでしょうか? これは難しい分野です。 ChatGPT は、プロンプトに基づいてどのテキストを表示すべきかを予測できるように、コンテンツと概念の関係のパターンを探します。検索語がシグナルであるのと同様に、プロンプトもシグナルです。検索エンジンは、用語だけでなく、業界や検索者の役割など、クエリ シナリオに関連する他のシグナルにも基づいて、どのような情報が表示されるべきかを予測します。シナリオは、プロンプト内の事実またはドキュメントの形式で、または応答の基礎となる特定の情報を指定することによってプログラム的に ChatGPT に提供できます。

大規模言語モデル - シソーラス

大規模言語モデルは、情報本体に含まれる用語、概念、関係を数学的に表現したものです。大規模な言語モデルの力は、ユーザーの意図 (リクエストの表現方法に関係なくユーザーが探しているもの) を理解し、ユーザーの意図に応答する可能性が最も高い単語パターンを予測する能力にあります。モデルはユーザーのリクエストを「理解し」、何を返すべきかを予測します。検索エンジンも、メカニズムは異なりますが、ユーザーのクエリに基づいて予測を行います。検索エンジンは、人工知能シナリオで検索を生成するために使用できます。セマンティック検索エンジンまたはニューラル検索エンジンを使用してコンテンツを取得し、大規模な言語モデルを使用してユーザーへの応答をフォーマットします。

シソーラスは、非優先用語を優先用語にマップします (たとえば、「SOW」と「作業明細書」は、ドキュメントにタグを付ける優先用語である「提案」にマップされます)。大規模な言語モデルの一側面を「シソーラス」と考えてください。これには単語だけではなく、語句や概念も含まれます。ユーザーはさまざまな方法で同じ質問をすることができます。この意図の分類は新しいものではなく、フレーズの変更を特定のアクションに解析するチャットボットの基礎となります。言語モデルは、意図の解析および分類機能の基礎です。

大規模な言語モデルは、プロンプトに続く単語パターンも理解できます。これは、ChatGPT セッションの流暢性を有効にする方法です。企業にとって有用なものにするための鍵は、特定のコンテンツや知識体系に合わせてモデルを調整し (ChatGPT の実装時にモルガン スタンレーが行ったのはこれです)、企業に固有の用語を組み込むことです。

特定のコンテンツで大規模な言語モデルを使用する方法を説明するサンプル コードを含むチュートリアルが多数あります。たとえば、同社のビデオでは、GPT-4 などの言語モデルを使用し、チャットボットに特定の知識やコンテンツを指示するプロセスを開発者に説明しています。

企業向けの知識特化型ボット

これらのチュートリアルを確認した後、いくつかの観察結果が得られます:

カスタマイズされた知識特化型チャットボットは、大規模な言語モデルを使用してユーザーのリクエストを理解し、結果を返すことができます。指定された知識源から。開発者は、コンテンツを「意味的に意味のある」セクションに「チャンク」する必要があると指摘しました。特定の質問に答えるために設計されたコンポーネント化されたコンテンツは、完全かつ状況に応じたものである必要があります。通常、この状態では知識は存在しないことに注意することが重要です。コンポーネント化するには、大きなドキュメントとテキスト本文をいくつかのチャンクに分割する必要があります。たとえば、ユーザー マニュアルは、章、セクション、段落、文ごとに部分に分割できます。技術文書の世界では、これはすでに行われています。DITA (ダーウィン情報分類アーキテクチャ) などの標準では、質問に答えるのに理想的なトピックベースのアプローチが使用されています。

開発者は「セマンティクス」とセマンティクスの重要性について話します。これは何を意味するのでしょうか? セマンティクスとは意味に関するものです。意味的に豊富なコンテンツには、必要な情報と情報のコンテキストの正確な検索を容易にするメタデータがタグ付けされています。たとえば、ユーザーが特定のモデルのルーターを使用しており、そのルーターがエラー コードを発行した場合、サポート ボットにヘルプを要求するときに、それらの識別子でタグ付けされたコンテンツを取得できます。このプロセスは、チャットボットの世界では「補間」とも呼ばれます。

カスタム コンテンツは、「ベクトル空間」と呼ばれるものに取り込まれます。これは、文書を多次元空間 (数学的構造) に配置する別の情報の数学的モデルであり、類似した文書をクラスター化して取得できるようにします。これを「埋め込み」といいます。埋め込みには、特定の回答がユーザーに提供された理由を文書化するのに役立つメタデータと識別子 (参照ソースなど) を含めることができます。これは、法的責任と規制の目的だけでなく、正確で最も信頼できる情報がユーザーに提供されることを保証するためにも重要です。

人工知能のトレーニングの定義

「トレーニング」についてはいくつかの考え方があります。 ChatGPT と大規模な言語モデルは、大量のコンテンツでトレーニングされているため、ユーザーのクエリを理解し、適切にフォーマットされた会話型の最適な回答で応答することができます。ツールをトレーニングする 1 つの方法は、プロンプトに「次の情報に基づいてこの質問に答えてください...」を含めることです。

しかし、ここには 2 つの問題があります。

まず、ChatGPT のみです。一定量のコンテンツはプロンプト内で処理できますが、この種の質問は非常に限定されます。コンテンツをツールに取り込むことができ、追加のトレーニングをサポートします。ただし、ChatGPT にコンテンツを追加すると、そのコンテンツもパブリック モデルにマージされます。その結果、企業の知的財産権が侵害されることになります。このリスクにより、多くの企業は、企業秘密の不用意なアップロードにより知的財産を失った ChatGPT やその他の AI ツールの使用を禁止するようになりました。

また、コンテンツをトレーニングする別の方法もあります。大規模な言語モデルでは、トレーニング コーパスの一部として企業固有の知識を使用できますが、これにはファイアウォールの背後にあるバージョンを提供する必要があります。幸いなことに、大規模な言語モデルは急速にコモディティ化されており、ラップトップ上でネイティブに実行できるものもあります。このタイプのトレーニングは計算コストも高くなります。もう 1 つのメカニズムは、大規模な言語モデルを使用してユーザーの目標 (ユーザーの意図) を解釈し、ベクトル埋め込みを使用して特定のデータまたはコンテンツ ソースからシナリオをプログラム的に提供することです。

言語モデルは、応答を処理してフォーマットし、会話型で完全なものにします。このようにして、企業の企業秘密や知的財産が侵害されないように、知識が大規模な言語モデルから分離されます。

これらすべての要素は、ユーザーが特定の質問に対する答えを得ることができるように、情報をコンポーネントに整理するためのナレッジ マネジメントとナレッジ アーキテクチャの必要性を示しています。 ChatGPT の大規模な言語モデルと革新的な性質により、人間に近いレベルの対話でポジティブな顧客エクスペリエンスをサポートするために必要な流暢な会話が実現します。重要な要素は、企業内で適切に構造化された知識にアクセスできることです。 ChatGPT は素晴らしく見えますが、情報の統計処理とパターン予測に基づいています。情報が正しく整理され統合されていれば、ビジネスのデジタル変革の重要な部分となり得ます。

以上がChatGPT と生成 AI がデジタル変革において何を意味するかの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:51cto.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート