使用DeepSeek R1構建RQA系統並簡化-人工智慧-PHP中文網

使用DeepSeek R1構建RQA系統並簡化

Christopher Nolan

發布： 2025-03-07 10:43:10

原創

728 人瀏覽過

> DeepSeek R1：通過基於檢索的問題回答

的AI應用開創性的開源推理模型

DeepSeek R1正在迅速獲得其在構建AI應用方面的效率和準確性的吸引力。本文詳細介紹了使用DeepSeek R1，Langchain和簡化的基於檢索的問答（RQA）系統的構建。我們將在實際推理任務中探索其功能，並在實際應用中展示其功能。

鍵學習成果：

掌握由DeepSeek R1驅動的RQA系統的增強的推理和解決問題的能力。
學會將DeepSeek R1集成到基於檢索的問題解答系統中。
>分析現實世界DeepSeek R1在編碼，數學和邏輯推理中的應用。
（本文是數據科學博客馬拉鬆的一部分。）目錄的
表：

了解DeepSeek R1

> DeepSeek R1-Zero和R1培訓

> DeepSeek R1的四個訓練階段

> DeepSeek R1的關鍵功能

的本地部署
構建RQA系統
>理解DeepSeek R1
在AI的動態領域，開源基礎模型正在改變企業AI的開發。由中國人工智能公司DeepSeek開發的DeepSeek R1是一種開源推理模型，旨在在需要邏輯推理，數學解決問題和實時決策的任務上表現出色。從一般推理到代碼生成的各種應用程序，它的效率和性能延伸。 >
>

>許多大型語言模型（LLMS）遵循三階段的培訓過程（預訓練，監督微調和強化學習），但DeepSeek R1-Zero採用了另一種方法。它利用了預先訓練的DeepSeek-V3基本模型（6710億參數）和跳過監督的微調，直接利用稱為組相對策略優化（GRPO）的大規模增強學習技術。

基於近端策略優化（PPO）的

> DeepSeek R1的四個訓練階段

> DeepSeek R1建立在DeepSeek R1-Zero的基礎之上，並結合了四個關鍵培訓階段：

冷啟動：在DeepSeek R1-Zero數據的高質量子集上進行微調以增強可讀性。
推理強化學習：通過跨編碼，數學，科學和邏輯領域的大規模強化學習來增強推理技能。
拒絕採樣和監督微調：生成多個樣本，僅通過拒絕採樣保留正確且可讀的樣本，然後再通過生成獎勵模型進行進一步的微調。 >
>多樣化的強化學習：利用基於規則的獎勵來完成數學和語言模型反饋以與人類偏好保持一致。

> deepSeek r1的密鑰特徵

>促進檢查，修改和集成到各種項目中。在GitHub和Azure AI Foundry等平台上可用。

高性能：

可與各種基準（數學，代碼生成，複雜推理）上的OpenAI的GPT-4媲專家（MOE）體系結構的混合物

> ： 67.1億個參數模型僅激活每個正向參數370億個參數，優化效率。

蒸餾型：提供較小，更可部署的型號（例如，DeepSeek-R1-Distill-Qwen-32b，Qwen-1.5b，7b，7b，14b）。 >

DeepSeek r1

本地部署

>使用Ollama很簡單：

>安裝Ollama。

在您的終端中運行以下命令（可以選擇模型大小）：>

構建使用DeepSeek R1

ollama run deepseek-r1   # Default 7B model
ollama run deepseek-r1:1.5b # Specific model

登入後複製

的RQA系統 Building a RQA System with DeepSeek R1 and Streamlit 讓我們使用langchain和deepseek r1構建一個RQA系統：

步驟1：導入庫>

（步驟2-10：構建簡易應用程序的其餘步驟，包括文件上傳，嵌入創建，矢量存儲生成，檢索器設置，LLM定義，提示模板創建，QA鏈創建，UI定義和UI實現，與原始響應相同。請參閱原始響應。

輸出示例：

（用示例查詢和響應說明了應用程序的功能。）>

import streamlit as st
from langchain_community.document_loaders.csv_loader import CSVLoader
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import FAISS
from langchain_community.llms import Ollama
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain
from langchain.chains.combine_documents.stuff import create_stuff_documents_chain
from langchain.chains import RetrievalQA

登入後複製

結論

DeepSeek R1代表了AI推理模型的重大進步。它的複雜技術和開源可訪問性的結合使其成為開發人員的強大工具。 RQA系統示例展示了其實際應用和未來創新的潛力。

鑰匙要點：