> DeepSeek R1:通過基於檢索的問題回答
的AI應用
開創性的開源推理模型
DeepSeek R1正在迅速獲得其在構建AI應用方面的效率和準確性的吸引力。 本文詳細介紹了使用DeepSeek R1,Langchain和簡化的基於檢索的問答(RQA)系統的構建。 我們將在實際推理任務中探索其功能,並在實際應用中展示其功能。
鍵學習成果:
- 掌握由DeepSeek R1驅動的RQA系統的增強的推理和解決問題的能力。
>了解AI驅動的問答的DeepSeek R1的架構和功能。
- 學會將DeepSeek R1集成到基於檢索的問題解答系統中。
請參閱增強學習如何提高DeepSeek R1響應的準確性。
- >分析現實世界DeepSeek R1在編碼,數學和邏輯推理中的應用。
- (本文是數據科學博客馬拉鬆的一部分。)
目錄的
- 表:
了解DeepSeek R1
> DeepSeek R1-Zero和R1培訓
> DeepSeek R1的四個訓練階段
> DeepSeek R1的關鍵功能
DeepSeek R1- 的本地部署
>用DeepSeek R1 - 構建RQA系統
常見問題-
- >理解DeepSeek R1
-
在AI的動態領域,開源基礎模型正在改變企業AI的開發。 由中國人工智能公司DeepSeek開發的DeepSeek R1是一種開源推理模型,旨在在需要邏輯推理,數學解決問題和實時決策的任務上表現出色。 從一般推理到代碼生成的各種應用程序,它的效率和性能延伸。 >
-
deepSeek r1-Zero和R1訓練- >
>許多大型語言模型(LLMS)遵循三階段的培訓過程(預訓練,監督微調和強化學習),但DeepSeek R1-Zero採用了另一種方法。 它利用了預先訓練的DeepSeek-V3基本模型(6710億參數)和跳過監督的微調,直接利用稱為組相對策略優化(GRPO)的大規模增強學習技術。
基於近端策略優化(PPO)的
> DeepSeek R1的四個訓練階段>
DeepSeek R1建立在DeepSeek R1-Zero的基礎之上,並結合了四個關鍵培訓階段:
-
冷啟動:在DeepSeek R1-Zero數據的高質量子集上進行微調以增強可讀性。
- 推理強化學習:通過跨編碼,數學,科學和邏輯領域的大規模強化學習來增強推理技能。
- 拒絕採樣和監督微調:生成多個樣本,僅通過拒絕採樣保留正確且可讀的樣本,然後再通過生成獎勵模型進行進一步的微調。 >
- >多樣化的強化學習:利用基於規則的獎勵來完成數學和語言模型反饋以與人類偏好保持一致。
>
> deepSeek r1的密鑰特徵>
>開源(MIT許可證):>促進檢查,修改和集成到各種項目中。 在GitHub和Azure AI Foundry等平台上可用。 -
高性能:
可與各種基準(數學,代碼生成,複雜推理)上的OpenAI的GPT-4媲
專家(MOE)體系結構的混合物- > : 67.1億個參數模型僅激活每個正向參數370億個參數,優化效率。
- 蒸餾型:提供較小,更可部署的型號(例如,DeepSeek-R1-Distill-Qwen-32b,Qwen-1.5b,7b,7b,14b)。 >
DeepSeek r1- >
本地部署
>使用Ollama很簡單:
>安裝Ollama。
在您的終端中運行以下命令(可以選擇模型大小):>
-
-
>
構建使用DeepSeek R1ollama run deepseek-r1 # Default 7B model
ollama run deepseek-r1:1.5b # Specific model
登入後複製
的RQA系統
讓我們使用langchain和deepseek r1構建一個RQA系統:
>步驟1:導入庫>
(步驟2-10:構建簡易應用程序的其餘步驟,包括文件上傳,嵌入創建,矢量存儲生成,檢索器設置,LLM定義,提示模板創建,QA鏈創建,UI定義和UI實現,與原始響應相同。請參閱原始響應。
>
輸出示例:(用示例查詢和響應說明了應用程序的功能。)>
import streamlit as st
from langchain_community.document_loaders.csv_loader import CSVLoader
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import FAISS
from langchain_community.llms import Ollama
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain
from langchain.chains.combine_documents.stuff import create_stuff_documents_chain
from langchain.chains import RetrievalQA
登入後複製
結論
DeepSeek R1代表了AI推理模型的重大進步。它的複雜技術和開源可訪問性的結合使其成為開發人員的強大工具。 RQA系統示例展示了其實際應用和未來創新的潛力。 鑰匙要點:
DeepSeek R1是一種高性能的開源推理模型。 -
RQA系統利用DeepSeek R1的功能來回答。 -
> DeepSeek R1的訓練增強了解釋性和準確性。
- MOE體系結構優化了資源利用率。
-
參考:
> grpo
(常見問題解答部分與原始響應保持相同。)
以上是使用DeepSeek R1構建RQA系統並簡化的詳細內容。更多資訊請關注PHP中文網其他相關文章!