index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html
![]()
本文介绍了基于MCP的RAG系统,该系统由知识库服务(MCP Server)、客户端工具(MCP Client)和大模型集成三部分组成。MCP Server基于Milvus向量数据库实现,负责文档存储和检索;MCP Client用于构建和检索知识库。大模型则用于文档切分、FAQ提取、问题拆解和回答生成。文章提供了详细的启动步骤,包括环境配置和服务器启动,并说明了如何通过SSE调试模式进行验证和提问。
💡 **核心组件**: 基于MCP的RAG系统主要由三个核心部分构成: 知识库服务(MCP Server), 客户端工具(MCP Client)以及大模型集成。
💾 **知识库服务**: MCP Server基于Milvus向量数据库实现,负责文档的存储和检索,确保知识库的高效运作。
⚙️ **启动流程**: 启动系统需要配置.env文件,设置包括Milvus的地址和端口、Embedding模型等参数,随后启动后端服务。
🚀 **验证与调试**: 启动服务器后,可以通过访问http://localhost:8080/sse验证服务器是否成功启动,并使用MCP Inspector进行本地调试。
基于MCP的rag系统
github.com/FlyAIBox/mc… 基于MCP的RAG系统主要包含三个核心部分:
1. 知识库服务(MCP Server):基于Milvus向量数据库实现的后端服务,负责文档存储和检索
2. 客户端工具(MCP Client):与MCP Server通信的客户端,实现知识库的构建和检索功能
3. 大模型集成:通过LLM实现文档切分、FAQ提取、问题拆解和回答生成等核心功能 启动步骤如下所示
拷贝.env.template 为.env文件
123456
| MILVUS_HOST=localhostMILVUS_PORT=19530EMBEDDING_MODEL=all-MiniLM-L6-v2KNOWLEDGE_COLLECTION=knowledge_storeFAQ_COLLECTION=faq_storeVECTOR_DIMENSION=384
|
CopyCopy
接下来就是启动这个项目了
12
| export HF_ENDPOINT=https:python -m app.main
|
CopyCopy
如果一切正常,你会得到下面的输出
1 2 3 4 5 6 7 8 910
| INFO: Started server process [76521]INFO: Waiting for application startup.INFO: Application startup complete.INFO: Uvicorn running on http://0.0.0.0:8080 (Press CTRL+C to quit)INFO: 127.0.0.1:42300 - "GET /sse HTTP/1.1" 200 OKINFO: 127.0.0.1:57392 - "GET /api/v1 HTTP/1.1" 404 Not FoundINFO: 127.0.0.1:57392 - "GET /api/v1 HTTP/1.1" 404 Not FoundINFO: 127.0.0.1:44854 - "GET /api/v1 HTTP/1.1" 404 Not FoundINFO: 127.0.0.1:44854 - "GET /api/v1 HTTP/1.1" 404 Not FoundINFO: 127.0.0.1:38692 - "GET /sse HTTP/1.1" 200 OK
|
CopyCopy
验证服务器是否启动成功: http://localhost:8080/sse
接下来本地启动sse的调试模式
12
| npx @modelcontextprotocol/inspector node build/index.js
|
CopyCopy
打开·http://localhost:6277·
提问,可以参考github.com/FlyAIBox/mc… 其中注意,json中的内容,需要分开对应到输入框中,不然会报错的

本文使用 文章同步助手 同步