Genai：用兰班建造抹布系统-Python教程-PHP中文网

在生成式 AI 时代，检索增强生成 (RAG) 已成为构建智能、上下文感知应用程序的强大方法。 RAG 将大型语言模型 (LLM) 的优势与高效的文档检索技术相结合，以回答基于特定数据的查询。在本博客中，我们将探讨如何使用 LangChain、GPT-4o、Ollama、Groq 等

Github 存储库 ->

Image description

RAG 管道的主要特点

数据检索：使用LangChain的加载器从网络源、本地文件或API中获取数据。
文档处理：将文档分解为更小的块，以便使用文本拆分器进行高效检索，从而实现更好的索引和更快的搜索结果。
向量嵌入：使用 OpenAI 嵌入或其他嵌入技术将文档块表示为高维向量，以实现灵活集成。
查询处理：检索最相关的文档块并使用 LLM（如 GPT-4o 或类似模型）生成准确的、基于上下文的答案。
交互式 UI：使用 Streamlit 构建的无缝用户界面，用于文档上传、查询和结果可视化。
模型集成：管道支持基于云的模型和本地模型，确保根据项目需求进行适应性。

使用的工具和库

此实现依赖于一系列强大的库和工具：

> langchain_openai：用于Openai嵌入和集成。
> langchain_core ：用于构建Langchain Workflows的核心实用程序。
Python-dotenv：安全地管理API键和环境变量。>
spartlit ：用于创建交互式用户界面。>
> langchain_community ：社区控制的工具，包括文档加载器。
langserve ：将管道部署为服务。>
fastapi：为抹布应用构建强大的API。
：为FastApi应用程序。>
：用于处理服务器sent事件。>
：用于网络刮擦和从HTML内容中提取数据。> > pypdf和pypdf2
chromadb和faiss-cpu
groq
> cassio
> wikipedia和arxiv：用于从在线来源加载数据。
langchainhub ：用于访问预构建的工具和组件。
stone_transformers ：用于创建高质量的向量嵌入。
> langchain-ObjectBox：用于使用Objectbox的向量嵌入。
> langchain ：抹布管道的骨干，处理文档检索和LLM集成。
它如何工作

设置环境

>
>使用环境管理工具安全地加载API密钥并为基于云和本地型号配置设置。
数据加载
>加载来自多个来源的数据，包括在线文档，本地目录或PDF。
- 文档拆分
：
>将大型文档分成较小的，可管理的块，以确保搜索过程中更快的检索和更好的准确性。
- 的向量嵌入
：
>将文档块转换为基于相似性搜索的数值向量。使用> objectbox
或其他向量数据库存储嵌入，启用了高速数据检索。
- 查询处理
>将文档检索与上下文感知的响应生成结合在一起，以精确和清晰度回答查询。
- 本地vs付费LLM
实施抹布管道时，本地和付费LLM之间的选择取决于项目需求和约束。这是一个快速比较：

Feature	Local LLMs	Paid LLMs (e.g., OpenAI GPT)
Data Privacy	High – Data stays on local machines.	Moderate – Data sent to external APIs.
Cost	One-time infrastructure setup.	Recurring API usage costs.
Performance	Dependent on local hardware.	Scalable and optimized by providers.
Flexibility	Fully customizable.	Limited to API functionality.
Ease of Use	Requires setup and maintenance.	Ready-to-use with minimal setup.
Offline Capability	Yes.	No – Requires internet connection.