ビジネス AI をマスターする: RAG と CRAG を使用してエンタープライズグレードの AI プラットフォームを構築する-AI-php.cn

AI テクノロジーをビジネスに最大限に活用する方法については、ガイドを参照してください。 RAG と CRAG の統合、ベクトル埋め込み、LLM、プロンプトエンジニアリングなどについて学び、責任を持って人工知能を適用しようとしている企業にとって有益です。

#エンタープライズ向け AI 対応プラットフォームを構築

##エンタープライズ

at生成AIの導入には、戦略的な管理が必要なビジネスリスクが数多くあります。これらのリスクは相互に関連していることが多く、コンプライアンス問題につながる潜在的な偏見からドメイン知識の欠如まで多岐にわたります。主な問題には、風評被害、法律および規制基準の遵守 (特に顧客とのやり取りに関連する)、知的財産権の侵害、倫理的問題、プライバシーの問題 (特に個人データまたは識別可能なデータを処理する場合) が含まれます。

#これらの課題に対処するために、検索拡張生成 (RAG) などのハイブリッド戦略が提案されています。 RAG テクノロジーは、人工知能によって生成されたコンテンツの品質を向上させ、企業の人工知能計画をより安全で信頼性の高いものにすることができます。この戦略は、知識不足や誤った情報などの問題に効果的に対処すると同時に、法的および倫理的なガイドラインの遵守を確保し、風評被害や法令違反を防止します。

掌握商业人工智能：使用 RAG 和 CRAG 构建企业级人工智能平台

#検索拡張生成 (RAG) を理解する

検索拡張生成 (RAG) は、エンタープライズナレッジベースからの情報を統合することで、人工知能コンテンツ作成の精度と精度を向上させる高度な手法です。 RAG は、料理の基本の徹底した理解に裏打ちされた、生来の才能、徹底した訓練、創造的な才能に頼るマスターシェフだと考えてください。珍しいスパイスを使用したり、斬新な料理のリクエストに応えたりするとき、シェフは信頼できる料理の参考文献を参照して、食材を最大限に活用します。

#シェフがさまざまな料理を作れるのと同じように、GPT や LLaMA-2 などの人工知能システムもさまざまなトピックに関するコンテンツを生成できます。しかし、詳細かつ正確な情報を提供する必要があるとき、特に斬新な料理を扱ったり、大量の企業データを閲覧したりするときは、情報の正確さと深さを確保するために特別なツールを利用します。

RAG の取得フェーズが不十分な場合はどうなりますか?
CRAG は、RAG 設定の安定性を高めるために設計された修正介入です。 CRAG は T5 を利用して、取得したドキュメントの関連性を評価します。企業が提供する文書が無関係であるとみなされる場合、情報のギャップを埋めるために Web 検索が使用される場合があります。

エンタープライズレベルで人工知能ソリューションを構築するためのアーキテクチャの考慮事項

企業レベルでのアーキテクチャこれは、データの取り込み、クエリとインテリジェントな取得、プロンプトエンジニアリングの生成、大規模言語モデル

という 3 つの核となる柱を中心に構築されています。＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃データ＃ ##PhotographInput:

最初のステップは、会社文書の内容をクエリしやすい形式に変換することです。この変換は、次の一連の操作に従って、埋め込みモデルを使用して行われます。

掌握商业人工智能：使用 RAG 和 CRAG 构建企业级人工智能平台

##データセグメンテーション:

Confluence、Jira、PDF などのエンタープライズナレッジソースからのさまざまなドキュメントが抽出され、システムに組み込まれます。このステップでは、ドキュメントを管理可能な部分 (多くの場合「チャンク」と呼ばれます) に分割します。埋め込みモデル: これらのドキュメントチャンクは、埋め込みモデルに渡されます。埋め込みモデルは、テキストを、テキストのセマンティクスを表す数値形式 (ベクトル) に変換して、機械が理解できるようにするニューラルネットワークです。

インデックスブロック: 埋め込みモデルによって生成されたベクトルにはインデックスが付けられます。インデックス作成は、効率的な検索を容易にする方法でデータを整理するプロセスです。
すべてのベクトル埋め込みをベクトルデータベースに保存します。そして、各埋め込みで表されるテキストを別のファイルに保存し、対応する埋め込みへの参照を必ず含めてください。
#
クエリとスマート検索: 推論サーバーはユーザーの質問を受信すると、埋め込みドキュメント内の同じモデルを使用する埋め込みプロセスを通じて、質問をベクトルに変換します。ナレッジベースで。次に、ベクトルデータベースが検索されて、ユーザーの意図に密接に関連するベクトルが特定され、大規模言語モデル (LLM) に供給されてコンテキストが強化されます。

5.クエリ: アプリケーション層と API 層からのクエリ。クエリは、ユーザーまたは他のアプリケーションが情報を検索するときに入力するものです。

6.埋め込みクエリの取得: 生成された Vector.Embedding をVector データベースインデックスで検索を開始します。ベクトルデータベースから取得するベクトルの数を選択します。この数は、問題を解決するためにコンパイルして使用する予定のコンテキストの数に比例します。

7.ベクトル (類似ベクトル): このプロセスでは、類似ベクトルを識別します。これらのベクトルは、クエリコンテキストに関連するドキュメントのチャンクを表します。

8.関連ベクトルの取得:
ベクターデータベースから関連するベクターを取得します。たとえば、シェフのコンテキストでは、レシピと準備ステップという 2 つの関連するベクトルに相当する可能性があります。対応するフラグメントが収集され、プロンプトとともに提供されます。

9.関連ブロックの取得: システムは、クエリ関連するベクトルが文書部分と一致します。情報の関連性が評価されると、システムは次のステップを決定します。情報が完全に一致している場合は、重要度に応じてランク付けされます。情報が間違っている場合、システムはその情報を破棄し、オンラインでより適切な情報を探します。＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃生成する＃ ##ヒントエンジンと

LLMs
:
ビルドのヒント大規模言語をガイドするためのエンジンモデルが正しい答えを与えることが重要です。これには、データのギャップを考慮した明確で正確な質問を作成することが含まれます。このプロセスは進行中ですが、より良い応答を得るには定期的な調整が必要です。質問が倫理的で偏見がないことを確認し、デリケートな話題を避けることも重要です。

10. プロンプトエンジニアリング: 取得されたチャンクは、元のクエリで使用されてプロンプトが作成されます。このヒントは、クエリコンテキストを言語モデルに効果的に伝えるように設計されています。 11. LLM (大規模言語モデル): エンジニアリングのヒントは大規模言語モデルによって処理されます。これらのモデルは、受け取った入力に基づいて人間のようなテキストを生成できます。

12. 回答: 最後に、言語モデルは、ヒントと取得したチャンクによって提供されるコンテキストを使用します。クエリに対する回答を生成します。その答えは、アプリケーション層と API 層を通じてユーザーに返されます。

#結論

このブログでは、人工物の使用について調査します。インテリジェンスソフトウェア開発への統合の複雑なプロセスは、CRAG からインスピレーションを得たエンタープライズ生成 AI プラットフォーム構築の変革の可能性を浮き彫りにします。ジャストインタイムエンジニアリング、データ管理、革新的な検索拡張生成 (RAG) アプローチの複雑さに対処することで、AI テクノロジーをビジネス運営の中核に組み込む方法の概要を示します。今後の議論では、インテリジェント開発のための生成 AI フレームワークをさらに掘り下げ、AI を最大限に活用してよりスマートな開発を実現するための具体的なツール、技術、戦略を検討します。、より効率的な開発環境。

出典| https://www.php.cn/link/1f3e9145ab192941f32098750221c602

著者|ヴェンカット・ランガサミー