独自の AI RAG チャットボットを作成する: LangChain を使用した Python ガイド-Python チュートリアル-php.cn

ホームページ

バックエンド開発

Python チュートリアル

独自の AI RAG チャットボットを作成する: LangChain を使用した Python ガイド

Patricia Arquette

Oct 20, 2024 pm 02:15 PM

文書から即座に回答が得られることを望まない人はいないでしょうか?それはまさに RAG チャットボットが行うことです。検索と AI 生成を組み合わせて、迅速かつ正確な応答を実現します。

このガイドでは、検索拡張生成 (RAG) と LangChain および Streamlit を使用してチャットボットを作成する方法を説明します。このチャットボットはナレッジベースから関連情報を取得し、言語モデルを使用して応答を生成します。

OpenAI、Gemini、または Fireworks のいずれを使用するかに関係なく、応答生成のための複数のオプションを提供しながら、各ステップを順を追って説明します。コスト効率の高いソリューションです。

検索拡張生成 (RAG) とは何ですか?

RAG は、取得と生成を組み合わせて、より正確でコンテキストを認識したチャットボット応答を提供する方法です。取得プロセスではナレッジベースから関連ドキュメントを取得し、生成プロセスでは言語モデルを使用して、取得したコンテンツに基づいて一貫した応答を作成します。これにより、言語モデル自体がその情報に基づいて特別にトレーニングされていない場合でも、チャットボットは最新のデータを使用して質問に回答できるようになります。

質問に対する答えを常に知っているわけではないパーソナルアシスタントがいると想像してください。ですから、あなたが質問すると、彼らは本を読んで関連する情報を見つけ出し（検索）、その情報を要約して自分の言葉で教えてくれます（生成）。これは基本的に RAG の仕組みであり、両方の長所を組み合わせたものです。

フローチャートでは、RAG プロセスは次のようになります。

Create Your Own AI RAG Chatbot: A Python Guide with LangChain

それでは、独自のチャットボットを取得してみましょう!

プロジェクト環境のセットアップ

このチュートリアルでは主に Python を使用します。JS の知識がある場合は、説明に従って langchain js のドキュメントを読むことができます。

まず、プロジェクト環境をセットアップする必要があります。これには、プロジェクトディレクトリの作成、依存関係のインストール、さまざまな言語モデルの API キーの設定が含まれます。

1. プロジェクトフォルダーと仮想環境の作成

まず、プロジェクトフォルダーと仮想環境を作成します。

mkdir rag-chatbot
cd rag-chatbot
python -m venv venv
source venv/bin/activate

ログイン後にコピー

2. 依存関係をインストールする

次に、requirements.txt ファイルを作成して、必要な依存関係をすべてリストします。

langchain==0.0.329
streamlit==1.27.2
faiss-cpu==1.7.4
python-dotenv==1.0.0
tiktoken==0.5.1
openai==0.27.10
gemini==0.3.1
fireworks==0.4.0
sentence_transformers==2.2.2

ログイン後にコピー

次に、これらの依存関係をインストールします。

pip install -r requirements.txt

ログイン後にコピー

3. APIキーの設定

チャットボットの応答生成には、OpenAI、Gemini、または Fireworks を使用します。好みに応じてこれらのいずれかを選択できます。

実験中であっても心配する必要はありません。Fireworks は 1 ドル相当の API キーを無料で提供しており、gemini-1.5-フラッシュモデルもある程度は無料です。

優先モデルの API キーを保存する .env ファイルを設定します。

mkdir rag-chatbot
cd rag-chatbot
python -m venv venv
source venv/bin/activate

ログイン後にコピー

これらのサービスにサインアップして API キーを取得してください。 Gemini と Fireworks は両方とも無料枠を提供していますが、OpenAI は使用量に応じて課金されます。

ドキュメントの処理とチャンク化

チャットボットにコンテキストを与えるには、ドキュメントを処理し、管理可能なチャンクに分割する必要があります。大きなテキストは埋め込みとインデックス作成のために分割する必要があるため、これは重要です。

1. document_processor.pyを作成する

ドキュメント処理を処理するために document_processor.py という新しい Python スクリプトを作成します。

langchain==0.0.329
streamlit==1.27.2
faiss-cpu==1.7.4
python-dotenv==1.0.0
tiktoken==0.5.1
openai==0.27.10
gemini==0.3.1
fireworks==0.4.0
sentence_transformers==2.2.2

ログイン後にコピー

このスクリプトはテキストファイルをロードし、チャンク間でコンテキストが失われないように、小さな重複を含む約 1000 文字の小さなチャンクに分割します。処理が完了すると、ドキュメントを埋め込んでインデックスを作成する準備が整います。

埋め込みとインデックス作成の作成

ドキュメントがチャンク化されたので、次のステップは、ドキュメントを 埋め込み (テキストの数値表現) に変換し、高速に取得できるようにインデックスを付けることです。 (機械は言葉より数字を理解しやすいため)

1.embedding_indexer.pyを作成する

embedding_indexer.py という名前の別のスクリプトを作成します:

pip install -r requirements.txt

ログイン後にコピー

このスクリプトでは、Hugging Face モデル (all-MiniLM-L6-v2) を使用して埋め込みが作成されます。次に、これらの埋め込みを FAISS ベクターストアに保存します。これにより、クエリに基づいて同様のテキストチャンクを迅速に取得できます。

取得と応答生成の実装

ここからがエキサイティングな部分です。検索と言語生成を組み合わせるのです。次に、ベクターストアから関連するチャンクを取得し、言語モデルを使用して応答を生成する RAG チェーン を作成します。 (vectorstore は、数値に変換されたデータをベクトルとして保存したデータベースです)

1. rag_chain.pyを作成する

ファイル rag_chain.py を作成しましょう:

# Uncomment your API key
# OPENAI_API_KEY=your_openai_api_key_here
# GEMINI_API_KEY=your_gemini_api_key_here
# FIREWORKS_API_KEY=your_fireworks_api_key_here

ログイン後にコピー

ここでは、指定した API キーに基づいて、OpenAI、Gemini、または Fireworks のいずれかを選択します。 RAG チェーンは、最も関連性の高い上位 3 つのドキュメントを取得し、言語モデルを使用して応答を生成します。

予算や使用方法の好みに応じてモデルを切り替えることができます。Gemini と Fireworks は無料ですが、OpenAI は使用量に応じて課金されます。

チャットボットインターフェイスの構築

次に、RAG チェーンを使用してユーザー入力を受け取り、応答を生成するシンプルなチャットボットインターフェイスを構築します。

1.chatbot.pyを作成する

chatbot.py という名前の新しいファイルを作成します:

mkdir rag-chatbot
cd rag-chatbot
python -m venv venv
source venv/bin/activate

ログイン後にコピー

このスクリプトは、ユーザー入力を継続的にリッスンし、RAG チェーンを通じて処理して、生成された応答を返すコマンドラインチャットボットインターフェイスを作成します。

Streamlit UI の作成

Streamlit を使用して Web インターフェイスを構築し、チャットボットをさらに使いやすくしましょう。これにより、ユーザーはブラウザを通じてチャットボットと対話できるようになります。

1.app.pyを作成する

app.py を作成します:

langchain==0.0.329
streamlit==1.27.2
faiss-cpu==1.7.4
python-dotenv==1.0.0
tiktoken==0.5.1
openai==0.27.10
gemini==0.3.1
fireworks==0.4.0
sentence_transformers==2.2.2

ログイン後にコピー

2.Streamlitアプリを実行する

Streamlit アプリを実行するには、以下を使用します:

pip install -r requirements.txt

ログイン後にコピー

これにより、テキストファイルをアップロードし、質問し、チャットボットから回答を受け取ることができる Web インターフェイスが起動します。

パフォーマンスの最適化

パフォーマンスを向上させるために、テキストを分割するときにチャンクサイズとオーバーラップを試してみることができます。チャンクが大きいほど、より多くのコンテキストが提供されますが、チャンクが小さいほど、検索が高速になる可能性があります。 Streamlit キャッシュを使用して、埋め込みの生成などの高価な操作の繰り返しを避けることもできます。

コストを最適化したい場合は、クエリの複雑さに応じて OpenAI、Gemini、または Fireworks を切り替えることができます。OpenAI を使用し、コストを削減するための簡単な質問には Gemini または Fireworks を使用します。

まとめ

おめでとうございます!独自の RAG ベースのチャットボットが正常に作成されました。可能性は無限大です:

旅はここから始まり、可能性は無限大です!

GitHub で私の作品をフォローできます。お気軽にご連絡ください。私の DM は常に X と LinkedIn でオープンしています。

以上が独自の AI RAG チャットボットを作成する: LangChain を使用した Python ガイドの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Java チュートリアル

1677

CakePHP チュートリアル

1430

Laravel チュートリアル

1333

PHP チュートリアル

1278

C# チュートリアル

1257

Related knowledge

Python vs. C：曲線と使いやすさの学習 Apr 19, 2025 am 12:20 AM

Pythonは学習と使用が簡単ですが、Cはより強力ですが複雑です。 1。Python構文は簡潔で初心者に適しています。動的なタイピングと自動メモリ管理により、使いやすくなりますが、ランタイムエラーを引き起こす可能性があります。 2.Cは、高性能アプリケーションに適した低レベルの制御と高度な機能を提供しますが、学習しきい値が高く、手動メモリとタイプの安全管理が必要です。

Pythonの学習：2時間の毎日の研究で十分ですか？ Apr 18, 2025 am 12:22 AM

Pythonを1日2時間学ぶだけで十分ですか？それはあなたの目標と学習方法に依存します。 1）明確な学習計画を策定し、2）適切な学習リソースと方法を選択します。3）実践的な実践とレビューとレビューと統合を練習および統合し、統合すると、この期間中にPythonの基本的な知識と高度な機能を徐々に習得できます。

Python vs. C：パフォーマンスと効率の探索 Apr 18, 2025 am 12:20 AM

Pythonは開発効率でCよりも優れていますが、Cは実行パフォーマンスが高くなっています。 1。Pythonの簡潔な構文とリッチライブラリは、開発効率を向上させます。 2.Cのコンピレーションタイプの特性とハードウェア制御により、実行パフォーマンスが向上します。選択を行うときは、プロジェクトのニーズに基づいて開発速度と実行効率を比較検討する必要があります。

Python vs. C：重要な違いを理解します Apr 21, 2025 am 12:18 AM

PythonとCにはそれぞれ独自の利点があり、選択はプロジェクトの要件に基づいている必要があります。 1）Pythonは、簡潔な構文と動的タイピングのため、迅速な開発とデータ処理に適しています。 2）Cは、静的なタイピングと手動メモリ管理により、高性能およびシステムプログラミングに適しています。

Python Standard Libraryの一部はどれですか：リストまたは配列はどれですか？ Apr 27, 2025 am 12:03 AM

PythonListSarePartOfThestAndardarenot.liestareBuilting-in、versatile、forStoringCollectionsのpythonlistarepart。

Python：自動化、スクリプト、およびタスク管理 Apr 16, 2025 am 12:14 AM

Pythonは、自動化、スクリプト、およびタスク管理に優れています。 1）自動化：OSやShutilなどの標準ライブラリを介してファイルバックアップが実現されます。 2）スクリプトの書き込み：Psutilライブラリを使用してシステムリソースを監視します。 3）タスク管理：スケジュールライブラリを使用してタスクをスケジュールします。 Pythonの使いやすさと豊富なライブラリサポートにより、これらの分野で優先ツールになります。

科学コンピューティングのためのPython：詳細な外観 Apr 19, 2025 am 12:15 AM

科学コンピューティングにおけるPythonのアプリケーションには、データ分析、機械学習、数値シミュレーション、視覚化が含まれます。 1.numpyは、効率的な多次元配列と数学的関数を提供します。 2。ScipyはNumpy機能を拡張し、最適化と線形代数ツールを提供します。 3. Pandasは、データ処理と分析に使用されます。 4.matplotlibは、さまざまなグラフと視覚的な結果を生成するために使用されます。

Web開発用のPython：主要なアプリケーション Apr 18, 2025 am 12:20 AM

Web開発におけるPythonの主要なアプリケーションには、DjangoおよびFlaskフレームワークの使用、API開発、データ分析と視覚化、機械学習とAI、およびパフォーマンスの最適化が含まれます。 1。DjangoandFlask Framework：Djangoは、複雑な用途の迅速な発展に適しており、Flaskは小規模または高度にカスタマイズされたプロジェクトに適しています。 2。API開発：フラスコまたはdjangorestFrameworkを使用して、Restfulapiを構築します。 3。データ分析と視覚化：Pythonを使用してデータを処理し、Webインターフェイスを介して表示します。 4。機械学習とAI：Pythonは、インテリジェントWebアプリケーションを構築するために使用されます。 5。パフォーマンスの最適化：非同期プログラミング、キャッシュ、コードを通じて最適化

See all articles

独自の AI RAG チャットボットを作成する: LangChain を使用した Python ガイド

検索拡張生成 (RAG) とは何ですか?

プロジェクト環境のセットアップ

1. プロジェクトフォルダーと仮想環境の作成

2. 依存関係をインストールする

3. APIキーの設定

ドキュメントの処理とチャンク化

1. document_processor.pyを作成する

埋め込みとインデックス作成の作成

1.embedding_indexer.pyを作成する

取得と応答生成の実装

1. rag_chain.pyを作成する

チャットボットインターフェイスの構築

1.chatbot.pyを作成する

Streamlit UI の作成

1.app.pyを作成する

2.Streamlitアプリを実行する

パフォーマンスの最適化

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック