ホームページ > テクノロジー周辺機器 > AI > AutORAG:オープンソースAutomlでRAGパイプラインを最適化します

AutORAG:オープンソースAutomlでRAGパイプラインを最適化します

William Shakespeare
リリース: 2025-03-07 09:09:12
オリジナル
300 人が閲覧しました

ここ数か月で、検索された世代(RAG)は、大規模な言語モデルと外部の知識を組み合わせるための強力な手法として人気が急上昇しています。ただし、適切なRAGパイプライン(インデックス化、埋め込みモデル、チャンキング方法、質問回答アプローチ)を選択することは困難です。数え切れないほどの構成があれば、どのパイプラインがデータとユースケースに最適であるかを確認するにはどうすればよいですか?それがAutoragが入ってくる場所です

学習目標

    Autoragの基礎と、それがRAGパイプラインの最適化を自動化する方法を理解してください。
  • データのさまざまなRAG構成をautoragがどのように体系的に評価するかを学びます。
  • データ作成、パイプライン実験、展開など、Autoragの主要な機能を探索します。
  • Autoragのセットアップと使用のステップバイステップのウォークスルーで実践的なエクスペリエンスを獲得します。
  • AutORAGの自動化されたワークフローを使用して、最高のパフォーマンスのあるRAGパイプラインを展開する方法を発見してください。
  • この記事は、

データサイエンスブログの一部として公開されました。 目次autoragとは何ですか?autoragがラグパイプラインを最適化する方法autorag

結論

    よくある質問
  • autoragとは?
  • Autoragは、ぼろきれに焦点を当てたオープンソースの自動機械学習(Automl)ツールです。独自のデータセット上のさまざまなRAGパイプラインコンポーネントを体系的にテストおよび評価して、ユースケースに最適な構成を決定します。実験を自動的に実行する(およびデータ作成、チャンキング、QAデータセット生成、パイプラインの展開などのタスクを処理することで、Autoragは時間と手間を節約します。

    なぜautorag?

    • 多数のRAGパイプラインとモジュール:RAGシステムを構成する多くの可能な方法があります。
    • 時間のかかる実験:すべてのパイプラインを自分のデータで手動でテストするのは面倒です。ほとんどの人は決してそれをしません。つまり、パフォーマンスの向上や推論を逃している可能性があります。 データとユースケースに合わせて調整された
    • :汎用ベンチマークは、ユニークなコーパスでパイプラインがどれだけうまく機能するかを反映していない場合があります。 Autoragは、独自のデータから派生した実際のQAペアまたは合成QAペアで評価できるようにすることにより、当て推量を削除します。
    • キー機能

    データ作成

    :Autoragでは、独自の生文書、PDFファイル、またはその他のテキストソースからRAG評価データを作成できます。ファイルをアップロードして、raw.parquetに解析し、それらをcorpus.parquetにchunkし、qaデータセットを自動的に生成します。
    • 最適化:Autoragは、データに最適なラグパイプラインを発見するために、実行中の実験(ハイパーパラメーターチューニング、パイプライン選択など)を自動化します。 QAデータセットに対する精度、関連性、事実上の正確性などのメトリックを測定して、最高のパフォーマンスのセットアップを特定します。
    • 展開
    • :最高のパイプラインを特定したら、Autoragは展開を簡単にします。単一のYAML構成では、最適なパイプラインをフラスコサーバーまたは選択した別の環境に展開できます。 顔のスペースを抱きしめてグラデーションで構築されています
    • Autoragのユーザーフレンドリーなインターフェイスは、Gradioを使用して構築されており、フェイススペースを抱き締めるのは簡単です。インタラクティブなGUIは、これらの実験を実行するために深い技術的専門知識を必要としないことを意味します。データをアップロードし、パラメーターを選択し、結果を生成する手順に従ってください。 autoragがragパイプラインを最適化する方法
    • QAデータセットを手にすると、AutORAGは自動的に:
    を使用できます

    複数のレトリバータイプ

    (例えば、ベクトルベース、キーワード、ハイブリッド)をテストします。

    さまざまなチャンクサイズを探索し、戦略をオーバーラップします。

    • 埋め込みモデルを評価(たとえば、Openai Embeddings、Hugging Face Transformers)。
    • プロンプトテンプレートを調整最も正確または関連する回答を生成するかを確認します。
    • 正確な一致、F1スコア、カスタムドメイン固有のメトリックなどのメトリックを使用して、QAデータセットに対するパフォーマンスを測定します。
    • 実験が完了したら、になります
      • パイプライン構成のランク付けされたリストパフォーマンスメトリックでソートされました。
      • モジュールまたはパラメーターがデータに最適な結果をもたらす明確な洞察
      • Autoragから直接展開できるという自動化された最高のパイプライン
      • 最高のragパイプラインの展開
      ライブの準備ができたら、autoragは展開を合理化します:

      シングルYAML構成
        :パイプラインコンポーネント(レトリーバー、エンバダー、ジェネレーターモデルなど)を説明するYAMLファイルを生成します。
      • Flask Serverで実行:既存のソフトウェアスタックと簡単に統合できるように、ローカルまたはクラウドベースのフラスコアプリで最高のパイプラインをホストします。
      • gradio/huggingフェイススペース:あるいは、パイプラインの no fuss、インタラクティブなデモ>のグラデーションインターフェイスを備えたフェイススペースに展開します。
      • なぜautorag?を使用するのか ここで、なぜautoragを試すべきなのか見てみましょう:
      時間を節約

      autoragに、複数のRAG構成を評価する重い持ち上げを処理させることにより。

      一意のデータとニーズに合わせて最適化されたパイプラインでパフォーマンスを向上させます。

        シームレスな統合
      • Quick DemosまたはProduction Deploymentsのために、フェイススペースを抱きしめるグレードを備えています。 オープンソース
      • およびコミュニティ主導型であるため、正確な要件に合わせてカスタマイズまたは拡張できます。
      • autoragはすでにGithubでトレンドを掲載しています。コミュニティに参加して、このツールがRAGワークフローにどのように革命をもたらすかを確認してください。 始めましょう
      • githubでautoragをご覧ください:
      • ソースコード、ドキュメント、コミュニティの例を調べてください。
      • フェイススペースを抱き締めるautoragデモを試してください:グラデーションベースのデモを使用できます。ファイルをアップロードし、QAデータを作成し、さまざまなパイプライン構成を実験してください。
      貢献

      :オープンソースプロジェクトとして、AutoragはPRS、発行レポート、および機能の提案を歓迎します。

      Autoragは、データの作成、パイプラインの実験、展開を自動化することにより、RAGシステムの構築から当て推量を削除します。データに最適なぼろきれの構成を見つけるための迅速で信頼できる方法が必要な場合は、Autoragをスピンして、結果を自分で話させてください。

      autoragのステップバイステップウォークスルー
      • データ作成ワークフロー、共有したスクリーンショットが組み込まれています。このガイドは、PDFSを解析し、データをチャンクし、QAデータセットを生成し、さらにぼろぼろの実験のために準備するのに役立ちます。

        ステップ1:OpenAI APIキーを入力

        • autoragインターフェイスを開きます。
        • 「Autorag Data作成」セクション(スクリーンショット#1)では、Openai APIキーを求めるプロンプトが表示されます。
        • テキストボックスにAPIキーを貼り付けて、Enterを押します。
        • 入力したら、ステータスは「設定されていない」から「有効」(または類似)に変更され、キーが認識されていることを確認する必要があります。
        • 注:AutORAGはAPIキーを保存またはログに記録しません。
        • 右側からお好みの言語(英語、한국어、日本語)を選択することもできます。

        ステップ2:PDFファイルを解析します

        下にスクロールして、「1.PDFファイルのパース」(スクリーンショット#2)。

        [ファイルのアップロード]をクリックして、コンピューターから1つ以上のPDFドキュメントを選択します。例のスクリーンショットには、66EB856E019Eという名前の2.1 MB PDFファイルが表示されます。
          ドロップダウンから解析方法を選択します。
        • 一般的なオプションには、pdfminer、pdfplumber、およびpymupdf。
        • が含まれます
        • 各パーサーには長所と制限があるため、解析の問題に遭遇した場合は複数の方法をテストすることを検討してください。
        • [解析](または同等のアクションボタン)をクリックします。 AutORAGはPDFを読み取り、単一のraw.Parquetファイルに変換します。
        • 進行状況の更新については、テキストボックスを監視します。
        • 解析が完了したら、[raw.parquetをダウンロード]をクリックして、結果をローカルまたはワークスペースに保存します。
        • ヒント:
        • raw.parquetファイルは、解析されたテキストデータです。必要に応じて寄木細工をサポートするツールで検査することができます。
        ステップ3:raw.parquet

        をchunkします 「2」に移動します。 raw.parquet」(スクリーンショット#3)をchunkします。

        前の手順を使用した場合、「以前のraw.parquetを使用」を選択してファイルを自動的に読み込むことができます。それ以外の場合は、[アップロード]をクリックして、自分の.Parquetファイルを持ち込みます。 AutORAG:オープンソースAutomlでRAGパイプラインを最適化します

        チャンキング方法を選択してください:

        • token
        • :指定された数のトークンによるチャンク。

        :文の境界でテキストを分割します。

        • セマンティック:セマンティックに類似したテキストへのチャンクへの埋め込みベースのアプローチを使用する可能性があります。
        • 再帰
        • :より多くの粒状セグメントのために複数のレベルでチャンクすることができます。 スライダー(例:256トークン)でチャンクサイズを設定し、オーバーラップ(32トークンなど)。オーバーラップは、塊の境界を越えてコンテキストを維持するのに役立ちます
        • run chunking」をクリックします 確認またはステータスの更新については、
        • textbox
        • をご覧ください。 完了後、「
        • corpus.parquetをダウンロード
        」を取得して、新しく充電したデータセットを取得します。

          なぜチャンキング?
        • ​​

          チャンキングは、検索方法が効率的に処理できる管理可能なピースにテキストを分割します。コンテキストと関連性のバランスをとるので、ぼろきシステムがトークンの制限を超えたり、トピックの焦点を希釈したりしないようにします。

          AutORAG:オープンソースAutomlでRAGパイプラインを最適化します

          ステップ4:corpus.parquet

          からQAデータセットを作成します 「3」。 corpus.parquetからQAデータセットを作成します。セクション(スクリーンショット#4)、corpus.parquetをアップロードまたは選択します。

          QAメソッドを選択します:

            デフォルト
          • :Q&Aペアを生成するベースラインアプローチ。
          • fast
          • :速度に優先順位を付け、おそらくより豊かな詳細を犠牲にしてコストを削減します。 Advanced
          • :より徹底的でコンテキストが豊富なQ&Aペアを生成する可能性がありますが、より高価または遅くなる可能性があります。
          • データ作成のモデルを選択します:

          例のオプションには、GPT-4O-MINIまたはGPT-4O(インターフェイスが追加のモデルをリストする可能性があります)が含まれます。 選択されたモデルは、質問と回答の品質とスタイルを決定します。

          • QAペアの数:
          スライダーは通常20から150になります。最初の実行では、コストを制限するために小さくして(20または30)に保ちます。

          Openaiモデルへのバッチサイズ:

          • デフォルトは16になります。つまり、バッチ要求ごとに16 Q&Aペアを意味します。レート制限エラーが表示されている場合は、下げます。

          qa creation

          」をクリックします。テキストボックスにステータスの更新が表示されます。
            が完了した場合、
          • ダウンロード
          qa.parquet

          自動的に作成されたQ&Aデータセットを取得します。 コスト警告:Q&Aデータの生成は、使用料が発生するOpenai APIを呼び出します。大型バッチを実行する予定がある場合は、Openai請求ページで使用法を監視してください。

          ステップ5:QAデータセットの使用 今:

          corpus.parquet(あなたのチャンクされたドキュメントデータ)

          qa.parquet(自動的に生成されたQ&Aペア)AutORAG:オープンソースAutomlでRAGパイプラインを最適化します

          これらをAutoragの評価と最適化ワークフローに送ることができます:

            複数のRAG構成を評価
          • - さまざまなレトリーバー、チャンクサイズ、埋め込みモデルをテストして、どの組み合わせがqa.parquetの質問に最もよく答えるかを確認します。
          • 最適なパイプラインを識別するためのパフォーマンスメトリックをレビューしてください(正確な一致、F1、またはドメイン固有の基準)。
          デプロイ単一のYAML構成ファイルを介して最高のパイプライン - Autoragはフラスコサーバーまたはその他のエンドポイントをスピンアップできます。
          • ステップ6:データ作成Studio Waitlist(オプション)

            に参加します

            自動的に生成されたQAデータセットをカスタマイズする場合(質問の編集、特定のトピックのフィルタリング、ドメイン固有のガイドラインの追加)Autoragはデータ作成スタジオを提供します。 「データ作成スタジオウェイトリストに参加する」をクリックして、インターフェイスにウェイトリストに直接サインアップしてください。

            結論

            Autoragは、検索された生成(RAG)パイプラインを最適化するための合理化された自動化されたアプローチを提供し、特定のデータセットに合わせたさまざまな構成をテストすることにより、貴重な時間と労力を節約します。データの作成、チャンキング、QAデータセット生成、およびパイプラインの展開を簡素化することにより、AutORAGは、ユースケースの最も効果的なRAGセットアップをすばやく特定できるようにします。 OpenAIのモデルとのユーザーフレンドリーなインターフェイスと統合により、AutORAGは初心者と経験豊富なユーザーの両方に、RAGシステムのパフォーマンスを効率的に改善するための信頼できるツールを提供します。

            キーテイクアウト

            autoragは、パフォーマンスを向上させるためにラグパイプラインを最適化するプロセスを自動化します。
              ユーザーは、データのニーズに合わせたカスタムデータセットを作成および評価できます。
            • このツールは、単一のYAML構成で最高のパイプラインを展開することを簡素化します。
            • Autoragのオープンソースの自然は、コミュニティ主導の改善とカスタマイズを促進します
            • よくある質問
            • q1。 Autoragとは何ですか、そしてなぜそれが役立つのですか? Autoragは、構成実験を自動化することにより、検索された生成(RAG)パイプラインを最適化するためのオープンソースの自動車ツールです。なぜOpenAI APIキーを提供する必要があるのですか? AutoragはOpenAIモデルを使用して合成Q&Aペアを生成します。これは、RAGパイプラインのパフォーマンスを評価するために不可欠です。 raw.parquetファイルとは何ですか?また、どのように作成されますか? PDFSをアップロードすると、AutORAGはテキストを抽出して、効率的な処理のためにコンパクトな寄木細工ファイルに抽出します。解析されたテキストをチャンクする必要があるのはなぜですか、そしてcorpus.parquetとは?
            • a。チャンキングは、大きなテキストファイルを小さく、取得可能なセグメントに分割します。出力はcorpus.parquetに保存され、ラグのパフォーマンスが向上します。私のPDFがパスワード保護またはスキャンされている場合はどうなりますか?暗号化または画像ベースのPDFは、AutORAGで使用する前に、パスワードの削除またはOCR処理が必要です。 Q&Aペアを生成するのにどれくらいの費用がかかりますか?コストは、コーパスサイズ、Q&Aペアの数、およびOpenaiモデルの選択に依存します。費用を見積もるために小さなバッチから始めます

            この記事に示されているメディアは、Analytics Vidhyaが所有しておらず、著者の裁量で使用されています。

以上がAutORAG:オープンソースAutomlでRAGパイプラインを最適化しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート