LangChain 设计原理分析¹⁰ | 向量数据库与 Retriever 机制

本文旨在理解向量检索的实现机制、VectorStore 与 Retriever 在 LangChain 中的职责划分，掌握 FAISS 与 Chroma 的实践用法，以及如何把向量库“作为 retriever” 接入检索增强生成（RAG）流水线。

一、先把概念理清楚（最重要的点）

向量数据库 / VectorStore

Embedding

Retriever（检索器）

BaseRetriever

给我最相关的 documents

.as_retriever()

.invoke()

.ainvoke()

关键区别：VectorStore 负责存与查；Retriever 负责把“查询”映射成文档列表并做业务侧包装（例如加过滤、返回 score、metadata 过滤等）。

二、FAISS 与 Chroma 的快速比较（实践视角）

FAISS（Facebook AI Similarity Search）

优点：极高的性能与灵活的索引（IVF、PQ、HNSW 等），适合大规模离线索引与高吞吐检索。实现上常用于内存/本地服务化场景。典型场景：批量构建索引后离线部署、需要自定义索引参数与性能调优时。

Chroma

优点：开源、易用、开发者友好，提供嵌入 + 向量存储的一体化体验，适合中小规模快速迭代。LangChain 提供了 Chroma 的一键集成。典型场景：快速原型、POC、轻量级应用或与 metadata 结合做过滤。

选择建议：如果你要生产级、海量检索（亿级向量），优先 FAISS / Milvus / ANN 专有云；若只是开发迭代或中小数据，Chroma 更省心。

三、`as_retriever()` 的作用与行为

as_retriever() 是 VectorStore 提供的便捷方法，把 VectorStore 包装成 BaseRetriever（或可直接当作 Runnable 使用）。调用后你得到的 retriever 常带有 search_kwargs（比如 k），并可被 LangChain 的 create_retrieval_chain / RetrievalQA 直接消费。官方 How-to 有示例。

要点：

vectorstore.as_retriever(search_kwargs={"k":4})

.invoke({"input": "..."})

四、实战示例（两版：FAISS 与 Chroma，基于最新 `create_retrieval_chain`）

说明：下面示例基于 LangChain 最新 API（create_retrieval_chain(retriever, combine_docs_chain)），并展示如何用 as_retriever()。你可以把 embedding 换成本地模型（如 Xinference / HuggingFace）。

依赖（示例环境）

pip install -U langchain langchain_community faiss-cpu chromadb sentence-transformers

示例 A：FAISS + Xinference Embeddings（小数据集演示）

import osfrom langchain_community.document_loaders import DirectoryLoaderfrom langchain_community.embeddings import XinferenceEmbeddingsfrom langchain_community.vectorstores.faiss import FAISSfrom langchain.text_splitter import CharacterTextSplitterfrom langchain.chains.combine_documents import create_stuff_documents_chainfrom langchain.chains import create_retrieval_chainfrom langchain_core.prompts import ChatPromptTemplatefrom langchain_openai import ChatOpenAI# 1. 加载文本并切片loader = DirectoryLoader("docs", glob="**/*.txt")  # 你的文档目录docs = loader.load()splitter = CharacterTextSplitter(chunk_size=300, chunk_overlap=30)chunks = splitter.split_documents(docs)# 2. Embeddingembedding = XinferenceEmbeddings(    server_url="http://127.0.0.1:9997",    model_uid="bge-large-zh-v1.5"  # 这里填你在 Xinference 加载的 embedding 模型的 uid)# 3. 建索引（FAISS）vectorstore = FAISS.from_documents(chunks, embedding)vectorstore.save_local('GPT5')# 4. 构造 retriever（as_retriever）retriever = vectorstore.as_retriever(search_kwargs={"k": 2})# 5. LLM + combine chain（stuff）llm = ChatOpenAI(    temperature=0,    model="glm-4.5",    openai_api_key=os.getenv("ZAI_API_KEY"),    openai_api_base="https://open.bigmodel.cn/api/paas/v4/")  # 或本地 LLM 封装prompt_template = "根据下面文档回答问题：\n\n{context}\n\n问题：{input}\n"prompt = ChatPromptTemplate.from_template(prompt_template)combine_chain = create_stuff_documents_chain(llm, prompt)# 6. 组合成 retrieval chainretrieval_chain = create_retrieval_chain(retriever=retriever,                                         combine_docs_chain=combine_chain)# 7. 调用resp = retrieval_chain.invoke({"input": "GPT-5有什么特点？"})print(resp["answer"])

说明/要点：

FAISS.from_documents

retriever = vectorstore.as_retriever(...)

create_retrieval_chain

输出：

示例 B：Chroma 快速原型

import osfrom langchain_community.document_loaders import DirectoryLoaderfrom langchain_community.embeddings import XinferenceEmbeddingsfrom langchain_community.vectorstores import Chromafrom langchain.text_splitter import CharacterTextSplitterfrom langchain.chains.combine_documents import create_stuff_documents_chainfrom langchain.chains import create_retrieval_chainfrom langchain_core.prompts import ChatPromptTemplatefrom langchain_openai import ChatOpenAIloader = DirectoryLoader("docs", glob="**/*.txt")docs = loader.load()splitter = CharacterTextSplitter(chunk_size=400, chunk_overlap=40)chunks = splitter.split_documents(docs)emb = XinferenceEmbeddings(    server_url="http://127.0.0.1:9997",    model_uid="bge-large-zh-v1.5"  # 这里填你在 Xinference 加载的 embedding 模型的 uid)db = Chroma.from_documents(chunks, embedding=emb)retriever = db.as_retriever(search_kwargs={"k": 1})llm = ChatOpenAI(    temperature=0,    model="glm-4.5",    openai_api_key=os.getenv("ZAI_API_KEY"),    openai_api_base="https://open.bigmodel.cn/api/paas/v4/")prompt = ChatPromptTemplate.from_template(    "请基于下面上下文回答问题：\n\n{context}\n\n问题：{input}\n")combine_chain = create_stuff_documents_chain(llm, prompt)chain = create_retrieval_chain(retriever=retriever, combine_docs_chain=combine_chain)print(chain.invoke({"input": "一句话总结GPT5的特点！"})["answer"])

说明：

Chroma 做为一体化 DB，使用体验更简单，适合迭代。

输出：

五、实现细节与调优要点（工程级）

文本切分（chunking）

chunk_size=300~800

overlap=50~200

向量归一化（normalize）

normalize_L2

距离度量

FAISS 支持欧氏（L2）/内积(dot)等；Chroma 默认用余弦/内积。根据 embedding 决定（embedding 是否已归一化）。

索引类型与性能（FAISS）

IndexFlatL2

IVF

PQ

HNSW

Metadata 过滤

metadata

source

date

filter

retriever.get_relevant_documents

filters

持久化 / 重建索引

FAISS.save_local

FAISS.load_local

语义质量监测

使用小集的查询做 A/B（不同 embedding / chunking / index）评测。监控召回率、平均相似度分布、用户反馈。

六、如何自定义 Retriever（高级用法）

如果内置 retriever 不满足你的需求（例如要做多阶段检索、语境压缩、检索融合多个 index），可以继承 BaseRetriever：

from langchain_core.retrievers import BaseRetrieverfrom langchain_core.documents import Documentfrom langchain_core.callbacks import CallbackManagerForRetrieverRunfrom langchain_core.vectorstores import VectorStoreclass MyCustomRetriever(BaseRetriever):    vector_store: VectorStore    k: int    def _get_relevant_documents(        self, query: str, *, run_manager: CallbackManagerForRetrieverRun = None    ) -> list[Document]:        # 可以先做 query expansion / rerank / metadata filter        docs = self.vector_store.similarity_search(query, k=self.k)        # 做二次排序或裁剪        docs = docs[:2]        return docsretriever = MyCustomRetriever(vector_store=db, k=4)

输出

检索、排序和压缩

七、实操常见问题与排错

检索到的是无关片段

向量大小不匹配 / 报错

metadata 过滤不起作用

filter

八、快速参考代码片段（保存/加载 FAISS）

from langchain_community.vectorstores.faiss import FAISS# 3. 建索引（FAISS）if os.path.exists("GPT5"):    vectorstore = FAISS.load_local("GPT5", embeddings=embedding,                                   allow_dangerous_deserialization=True)else:    vectorstore = FAISS.from_documents(chunks, embedding)    vectorstore.save_local('GPT5')

九、小结

as_retriever()

接下来我们将把 Agent 工作流扩展为图式执行引擎，分析 LangGraph 的任务编排、异步执行与状态管理机制。

一、先把概念理清楚（最重要的点）

二、FAISS 与 Chroma 的快速比较（实践视角）

三、`as_retriever()` 的作用与行为

四、实战示例（两版：FAISS 与 Chroma，基于最新 `create_retrieval_chain`）

依赖（示例环境）

示例 A：FAISS + Xinference Embeddings（小数据集演示）

示例 B：Chroma 快速原型

五、实现细节与调优要点（工程级）

六、如何自定义 Retriever（高级用法）

七、实操常见问题与排错

八、快速参考代码片段（保存/加载 FAISS）

九、小结

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签

一、先把概念理清楚（最重要的点）

二、FAISS 与 Chroma 的快速比较（实践视角）

三、as_retriever() 的作用与行为

四、实战示例（两版：FAISS 与 Chroma，基于最新 create_retrieval_chain）

依赖（示例环境）

示例 A：FAISS + Xinference Embeddings（小数据集演示）

示例 B：Chroma 快速原型

五、实现细节与调优要点（工程级）

六、如何自定义 Retriever（高级用法）

七、实操常见问题与排错

八、快速参考代码片段（保存/加载 FAISS）

九、小结

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签

三、`as_retriever()` 的作用与行为

四、实战示例（两版：FAISS 与 Chroma，基于最新 `create_retrieval_chain`）