构建简单的 RAG 系统并集成 DeepSeek 大模型

RAG (Retrieval Augmented Generation) 是一种结合了检索（Retrieval）和生成（Generation）两大能力的技术。它允许大型语言模型（LLM）在生成回答之前，先从外部知识库中检索相关信息，从而提高回答的准确性、时效性，并减少“幻觉”现象。本文将详细介绍如何构建一个简单的 RAG 系统，并以 DeepSeek 大模型为例，展示如何将其集成到流程中。

RAG 的核心思想

RAG 的工作流程通常如下：

用户提问 (Query)

信息检索 (Retrieval)

上下文增强 (Context Augmentation)

答案生成 (Generation)

技术选型

为了实现一个简单的 RAG 系统，我们将使用以下工具：

Python

LangChain

Sentence Transformers

FAISS (Facebook AI Similarity Search)

DeepSeek API

实现步骤

1. 环境准备

首先，确保你安装了必要的 Python 库。

pip install langchain sentence-transformers faiss-cpu deepseek-llm openai python-dotenv

langchain

sentence-transformers

faiss-cpu

faiss-gpu

deepseek-llm

openai

python-dotenv

接下来，你需要获取 DeepSeek API Key。访问 DeepSeek 开放平台注册并获取你的 API Key。

建议将 API Key 存储在项目根目录下的 .env 文件中，以避免硬编码：

# .env 文件内容DEEPSEEK_API_KEY="your_actual_api_key"

2. 准备知识库

创建一个名为 knowledge_base 的文件夹，并在其中放入一些文本文件作为你的知识库。例如：

knowledge_base/deepseek_info.txt:

DeepSeek是一家致力于研究通用人工智能（AGI）的公司。DeepSeek的使命是“用AI改变世界”。DeepSeek发布了多款强大的语言模型，包括DeepSeek Coder和DeepSeek LLM。DeepSeek LLM 67B在多个基准测试中表现出色。

knowledge_base/rag_intro.txt:

RAG代表检索增强生成。它结合了信息检索系统的能力和大型语言模型的生成能力。RAG可以帮助减少LLM的幻觉，并提供基于特定文档的答案。

3. 代码实现

下面是完整的 Python 代码实现：

import osfrom dotenv import load_dotenvfrom langchain_community.document_loaders import DirectoryLoader, TextLoaderfrom langchain.text_splitter import RecursiveCharacterTextSplitterfrom langchain_community.embeddings import HuggingFaceEmbeddingsfrom langchain_community.vectorstores import FAISSfrom langchain_deepseek import ChatDeepseek # langchain_community.chat_models for older versionsfrom langchain.chains import RetrievalQAfrom langchain.prompts import PromptTemplate# 1. 加载环境变量 (DeepSeek API Key)load_dotenv()api_key = os.getenv("DEEPSEEK_API_KEY")if not api_key:    raise ValueError("DEEPSEEK_API_KEY not found in .env file or environment variables.")# --- 知识库处理 ---# 2. 加载知识库文档# 使用 TextLoader 加载单个文件，或 DirectoryLoader 加载整个目录print("加载知识库文档...")loader = DirectoryLoader('./knowledge_base/', glob="**/*.txt", loader_cls=TextLoader, loader_kwargs={'encoding': 'utf-8'})documents = loader.load()if not documents:    print("未能加载任何文档，请检查 'knowledge_base' 文件夹和文件路径。")    exit()print(f"成功加载 {len(documents)} 个文档。")# 3. 文本分割# 将加载的文档分割成更小的块，以便嵌入和检索print("分割文档...")text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)texts = text_splitter.split_documents(documents)if not texts:    print("未能分割文档。")    exit()print(f"文档被分割成 {len(texts)} 个文本块。")# 4. 文本嵌入# 使用 HuggingFace 上的预训练模型将文本块转换为向量# 'all-MiniLM-L6-v2' 是一个轻量级且效果不错的模型print("生成文本嵌入...")embeddings_model_name = "sentence-transformers/all-MiniLM-L6-v2"embeddings = HuggingFaceEmbeddings(model_name=embeddings_model_name)# 5. 构建向量数据库# 使用 FAISS 将嵌入向量化并存储，以便进行快速相似性搜索print("构建向量数据库...")# FAISS.from_documents 会自动处理嵌入和索引vector_store = FAISS.from_documents(texts, embeddings)print("向量数据库构建完成。")# --- 与 DeepSeek 大模型集成 ---# 6. 初始化 DeepSeek LLM# 使用 DeepSeek 的聊天模型# 注意：model_name 可能需要根据 DeepSeek 官方文档更新# 常见的模型如 'deepseek-chat' 或 'deepseek-coder' (如果你用coder模型)print("初始化 DeepSeek LLM...")llm = ChatDeepseek(    model="deepseek-chat", # 或者其他 DeepSeek 模型，如 "deepseek-coder"    api_key=api_key,    temperature=0.1 # 控制生成文本的随机性，较低的值使输出更确定)print("DeepSeek LLM 初始化完成。")# 7. 创建 RAG 链 (RetrievalQA)# RetrievalQA 链封装了检索、构建提示和调用 LLM 的整个过程# 定义一个Prompt模板 (可选，但推荐用于更好地控制输出)prompt_template = """请根据以下提供的上下文信息来回答问题。如果你在上下文中找不到答案，请说你不知道，不要试图编造答案。保持答案简洁。上下文:{context}问题: {question}答案:"""PROMPT = PromptTemplate(    template=prompt_template, input_variables=["context", "question"])chain_type_kwargs = {"prompt": PROMPT}print("创建 RAG 链...")qa_chain = RetrievalQA.from_chain_type(    llm=llm,    chain_type="stuff", # "stuff" 是最简单的方法，将所有检索到的文本块直接塞入上下文    retriever=vector_store.as_retriever(search_kwargs={"k": 3}), # k=3 表示检索最相关的3个文档块    chain_type_kwargs=chain_type_kwargs,    return_source_documents=True # 同时返回源文档，方便溯源)print("RAG 链创建完成。")# 8. 进行提问print("\n--- 开始提问 ---")while True:    user_query = input("\n请输入你的问题 (输入 '退出' 来结束程序): ")    if user_query.lower() == '退出':        break    if not user_query.strip():        print("问题不能为空，请重新输入。")        continue    print(f"\n正在处理问题: {user_query}")    try:        result = qa_chain.invoke({"query": user_query}) # LangChain 0.1.0+ 使用 invoke        print("\n模型回答:")        print(result["result"])        print("\n引用的源文档片段:")        for i, source_doc in enumerate(result["source_documents"]):            print(f"--- 片段 {i+1} (来自: {source_doc.metadata.get('source', '未知来源')}) ---")            print(source_doc.page_content)            print("-" * 20)    except Exception as e:        print(f"处理问题时发生错误: {e}")print("\n程序已退出。")

详细解释

加载环境变量 (load_dotenv, os.getenv):

.env

DEEPSEEK_API_KEY

加载知识库文档 (DirectoryLoader, TextLoader):

DirectoryLoader

glob

*.txt

loader_cls=TextLoader

TextLoader

loader_kwargs={'encoding': 'utf-8'}

文本分割 (RecursiveCharacterTextSplitter):

RecursiveCharacterTextSplitter

\n\n

\n

chunk_size=500

chunk_overlap=50

文本嵌入 (HuggingFaceEmbeddings):

HuggingFaceEmbeddings

sentence-transformers

sentence-transformers/all-MiniLM-L6-v2

备选方案

构建向量数据库 (FAISS):

FAISS.from_documents(texts, embeddings)

texts

embeddings

初始化 DeepSeek LLM (ChatDeepseek):

ChatDeepseek

model="deepseek-chat"

deepseek-chat

deepseek-coder

api_key=api_key

temperature=0.1

创建 RAG 链 (RetrievalQA):

RetrievalQA

llm=llm

chain_type="stuff"

map_reduce

refine

map_rerank

retriever=vector_store.as_retriever(search_kwargs={"k": 3})

vector_store.as_retriever()

Retriever

search_kwargs={"k": 3}

k=3

k

prompt_template

PROMPT

{context}

{question}

RetrievalQA

chain_type_kwargs={"prompt": PROMPT}

stuff

return_source_documents=True

result

source_documents

进行提问 (qa_chain.invoke):

qa_chain.invoke({"query": user_query})

qa_chain({"query": user_query})

qa_chain.run(user_query)

user_query

retriever

user_query

k=3

context

user_query

question

PROMPT

llm

result["result"]

result["source_documents"]

如何运行

simple_rag.py

.env

knowledge_base

simple_rag.py

python simple_rag.py

进阶与优化方向

这个简单的 RAG 系统是一个很好的起点，但还有许多可以优化和扩展的地方：

更优的文本分割策略

chunk_size

chunk_overlap

更强的嵌入模型

all-MiniLM-L6-v2

混合搜索 (Hybrid Search)

重排 (Re-ranking)

提示工程 (Prompt Engineering)

上下文管理

处理找不到答案的情况

异步处理与流式输出

评估

用户界面

总结

通过 LangChain、Sentence Transformers、FAISS 和 DeepSeek API，我们成功构建了一个基础的 RAG 系统。这个系统能够从本地知识库中检索信息，并利用 DeepSeek 大模型的强大能力生成基于上下文的回答。RAG 是增强 LLM 应用能力的关键技术，希望本文能为你探索更高级的 AI 应用打下坚实的基础。

RAG 的核心思想

技术选型

实现步骤

1. 环境准备

2. 准备知识库

3. 代码实现

详细解释

如何运行

进阶与优化方向

总结

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签