動作中の是正布(岩石)
検索された生成(RAG)は、情報検索を組み込むことにより、大規模な言語モデル(LLM)を強化します。これにより、LLMは外部の知識ベースにアクセスできるようになり、より正確で最新の、および文脈的に適切な応答が得られます。高度なぼろきれの手法である是正ぼろきれ(CRAG)は、取得された文書の自己反省と自己評価メカニズムを導入することにより、精度をさらに強化します。
主要な学習目標
この記事では:
- CRAGのコアメカニズムとWeb検索との統合。
- バイナリスコアリングとクエリの書き換えを使用したCRAGのドキュメント関連評価。
- 岩山と伝統的なぼろきれの重要な区別。
- Python、Langchain、およびTavilyを使用した実践的なクラッグの実装。
- 検索と応答の精度を最適化するために、評価者、クエリライター、およびWeb検索ツールを構成する実用的なスキル。
Data Science Blogathonの一部として公開されています。
目次
- クラッグの根本的なメカニズム
- クラッグ対伝統的なぼろきれ
- 実用的な岩山の実装
- クラッグの課題
- 結論
- よくある質問
クラッグの根本的なメカニズム
CRAGは、Web検索を検索プロセスと生成プロセスに統合することにより、LLM出力の信頼性を高めます(図1を参照)。
ドキュメント取得:
- データの摂取:関連するデータはインデックス化されており、Web検索ツール(Tavily AIなど)がリアルタイムデータ取得のために構成されています。
- 初期検索:ユーザーのクエリに基づいて、ドキュメントは静的な知識ベースから取得されます。
関連性評価:
評価者は、取得されたドキュメントの関連性を評価します。文書の70%以上が無関係であるとみなされる場合、是正措置が開始されます。それ以外の場合、応答生成が進行します。
Web検索統合:
ドキュメントの関連性が不十分な場合、CragはWeb検索を使用します。
- クエリの改良:元のクエリは、Web検索結果を最適化するように変更されています。
- Web検索の実行: Tavily AIなどのツールは追加データを取得し、現在および多様な情報へのアクセスを保証します。
応答生成:
CRAGは、初期検索とWeb検索の両方からのデータを合成して、コヒーレントで正確な応答を作成します。
クラッグ対伝統的なぼろきれ
CRAGは、検証なしで検索されたドキュメントに依存している従来のぼろとは異なり、取得した情報を積極的に検証および改良します。 CRAGは、多くの場合、リアルタイムのWeb検索を組み込んでおり、静的な知識ベースへの従来のRagの依存とは異なり、最新情報へのアクセスを提供します。これにより、高精度とリアルタイムのデータ統合が必要なアプリケーションにCragが理想的になります。
実用的な岩山の実装
このセクションでは、Python、Langchain、およびTavilyを使用した岩山の実装について詳しく説明しています。
ステップ1:ライブラリのインストール
必要なライブラリをインストールする:
!ピップインストールTiktoken Langchain-Openai Langchainhub Chromadb Langchain Langgraph tavily-python !PIPインストール-QuPypdf langchain_community
ステップ2:APIキー構成
APIキーを設定します:
OSをインポートします os.environ ["tavily_api_key"] = "" os.environ ["openai_api_key"] = ""
ステップ3:ライブラリの輸入
必要なライブラリをインポートします(Brevityのために省略されていますが、元の例と同様)。
ステップ4:チャンクおよびレトリーバーの作成を文書化します
(Brevityのためにコードは省略されていますが、PYPDFLOADER、recursIveCharacterTextSplitter、OpenAiemBedings、およびChromaを使用して、元の例と同様)。
ステップ5:ラグチェーンのセットアップ
(Brevityのためにコードは省略されていますが、元の例と同様に、 hub.pull("rlm/rag-prompt")
およびChatOpenAI
使用しています)。
ステップ6:評価者のセットアップ
(Brevityのためにコードは省略されていますが、元の例と同様に、 Evaluator
クラスを定義し、評価のためにChatOpenAI
使用しています)。
ステップ7:クエリライターのセットアップ
(Brevityのためにコードは省略されていますが、元の例と同様に、 ChatOpenAI
を使用してクエリの書き換えに)。
ステップ8:Web検索セットアップ
langchain_community.tools.tools.tavily_search Import tavilysearchresultsから web_search_tool = tavilysearchresults(k = 3)
ステップ9-12:ランググラフワークフローのセットアップと実行
(Brevityのために省略されたコードですが、概念的には元の例と類似して、 GraphState
、Function Nodes( retrieve
、 generate
、 evaluate_documents
、 transform_query
、 web_search
)を定義し、 StateGraph
を使用して接続します。)従来のRAGとの最終出力と比較も概念的に似ています。
クラッグの課題
Cragの有効性は、評価者の精度に大きく依存します。弱い評価者はエラーを導入できます。スケーラビリティと適応性も懸念事項であり、継続的な更新とトレーニングが必要です。 Web検索統合は、偏った情報または信頼できない情報のリスクを導入し、堅牢なフィルタリングメカニズムを必要とします。
結論
クラッグにより、LLM出力の精度と信頼性が大幅に向上します。リアルタイムのWebデータで取得した情報を評価および補足する能力により、高精度と最新の情報を要求するアプリケーションにとって価値があります。ただし、評価者の精度とWebデータの信頼性に関連する課題に対処するには、継続的な改良が重要です。
キーテイクアウト(オリジナルに似ていますが、簡潔さのために言い換えられます)
- CRAGは、現在の関連情報のWeb検索を使用してLLM応答を強化します。
- その評価者は、応答生成のための高品質の情報を保証します。
- クエリ変換は、Web検索結果を最適化します。
- RAGとは異なり、RAGはリアルタイムのWebデータを動的に統合します。
- クラッグは情報を積極的に検証し、エラーを減らします。
- CRAGは、高精度とリアルタイムデータを必要とするアプリケーションに有益です。
よくある質問(オリジナルに似ていますが、簡潔さのために言い換えられます)
- Q1:岩山とは何ですか? A:正確性と信頼性の向上のためにWeb検索を統合する高度なRAGフレームワーク。
- Q2:クラッグ対伝統的なぼろきれ? A:CRAGは、取得した情報を積極的に検証および改良します。
- Q3:評価者の役割? A:ドキュメントの関連性の評価と修正のトリガー。
- Q4:文書が不十分ですか? A:Web検索付きのCrag Supplements。
- Q5:信頼できないWebコンテンツの処理? A:高度なフィルタリング方法が必要です。
(注:画像は変更されておらず、元の入力のように含まれています。)
以上が動作中の是正布(岩石)の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











この記事では、トップAIアートジェネレーターをレビューし、その機能、創造的なプロジェクトへの適合性、価値について説明します。 Midjourneyを専門家にとって最高の価値として強調し、高品質でカスタマイズ可能なアートにDall-E 2を推奨しています。

メタのラマ3.2:マルチモーダルとモバイルAIの前進 メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。 成功に基づいてo

この記事では、ChatGpt、Gemini、ClaudeなどのトップAIチャットボットを比較し、自然言語の処理と信頼性における独自の機能、カスタマイズオプション、パフォーマンスに焦点を当てています。

ねえ、忍者をコーディング!その日はどのようなコーディング関連のタスクを計画していますか?このブログにさらに飛び込む前に、コーディング関連のすべての問題について考えてほしいです。 終わり? - &#8217を見てみましょう

この記事では、Grammarly、Jasper、Copy.ai、Writesonic、RytrなどのトップAIライティングアシスタントについて説明し、コンテンツ作成のためのユニークな機能に焦点を当てています。 JasperがSEOの最適化に優れているのに対し、AIツールはトーンの維持に役立つと主張します

Shopify CEOのTobiLütkeの最近のメモは、AIの能力がすべての従業員にとって基本的な期待であると大胆に宣言し、会社内の重大な文化的変化を示しています。 これはつかの間の傾向ではありません。これは、pに統合された新しい運用パラダイムです

今週のAIの風景:進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

この記事では、Google Cloud、Amazon Polly、Microsoft Azure、IBM Watson、DecriptなどのトップAI音声ジェネレーターをレビューし、機能、音声品質、さまざまなニーズへの適合性に焦点を当てています。
