MCP 学习系列②：理解 MCP 的核心结构与思维模型

简介

到目前为止，我们已经在第一篇博客中理解了为何需要 MCP（Model Context Protocol），并掌握了 Prompt 三角色与 Function Calling（工具调用）的基础操作。接下来，本篇将带你从“用大模型”过渡到“管理语义链”的思维维度，揭开 MCP 的关键数据结构与运行机制。我们会重点讲解：

MCP 是什么：大模型的语义操作系统

MCP 三阶段：Pre / In / Post Model 执行控制

MCP 语义角色结构

MCP 与 OpenAI、Claude 的 Tool Use 结构对比

通过阅读，你会对 MCP 的核心字段有清晰认识，并且能够用 Python（Pydantic）编写最简版 MCPRequest、MCPMessage、MCPPhase 等结构体，为后续实战打下基础。

✅ 1. MCP 是什么：大模型的语义操作系统

核心点：MCP 将用户对话、工具／函数调用、Agent 协作等所有语义交互，视作“大模型的上下文协议层”，从而在调用链条的每一步都可以精确地描述“谁发起、在什么时候、为何而发、如何执行”。

1.1 请求上下文统一封装：who / when / why / how

在没有 MCP 之前，我们的聊天系统上下文往往依赖于纯粹的 messages: [{role, content}]。但极简的两字段并不能表达诸如“这是哪个 Agent 发起的”、“这是一次工具调用还是普通对话”、“在第几轮”、“携带的元数据”等重要信息。MCP 通过以下几个核心字段进行补充与约定：

actor

"user"

"assistant"

"calculator_agent"

"search_agent"

timestamp

phase

"pre_model"

"in_model"

"post_model"

intent

payload

messages[i].content

metadata

MCPRequest 样例（JSON 格式）

{  "actor": "user",  "timestamp": 1686200000,  "phase": "pre_model",  "intent": "CHAT",  "payload": {    "role": "user",    "content": "请帮我推荐一款性价比高的手机。"  },  "metadata": {    "session_id": "abc123",    "user_tier": "premium"  }}

这条 MCPRequest 表示：
Who（谁发起）： 用户When（何时发起 / 阶段）： Pre-Model 阶段（也就是还没把对话内容喂给 LLM 前）Why（意图）： 普通聊天（CHAT）How（载荷）： 带着 role=user 的消息 "请帮我推荐一款性价比高的手机。"

从而，MCP 引擎就能在 Pre-Model 阶段做两件事：

metadata.session_id

payload

messages

后续一旦模型开始推理（进入 In-Model 阶段），MCP 会依据上下文中的 intent 与 phase 来判断该如何处理函数/工具调用，保证系统提示词不被篡改。

✅ 2. MCP 三阶段：Pre / In / Post Model 执行控制

核心点：MCP 对每次请求都划分为三个阶段，让我们可以在模型推理前、中、后都插入自定义逻辑。这也是 MCP 作为“语义操作系统”最关键的一环。

[ 用户发起 → MCP Pre-Model ]                       ↓               [ LLM In-Model ]                       ↓                [ MCP Post-Model ]                     ↓                [ 反馈给用户/下游 ]

2.1 前置信息注入（Pre-Model）

目标：在调用 LLM 之前，对上下文进行预处理，包括：

注入系统提示词（System Prompt）对 Payload 做脱敏、合并、分片等操作加载或检索用户的 Memory（多轮对话记忆、知识库内容等）绑定、拼接必要的元数据（如 A/B-Test 标记、实验 ID）

示例：Pre-Model 阶段的处理流程

from datetime import datetimefrom typing import List, Union, Dictfrom pydantic import BaseModel# 1. 定义 MCPPhase 枚举class MCPPhase(str):    PRE_MODEL = "pre_model"    IN_MODEL = "in_model"    POST_MODEL = "post_model"# 2. 定义 MCPMessage（即 payload 中的 message 结构）class MCPMessage(BaseModel):    role: str  # "user" / "assistant" / "function"    content: str    name: str = None  # 当 role="function" 时，填函数名# 3. 定义 MCPRequestclass MCPRequest(BaseModel):    actor: str    timestamp: int    phase: MCPPhase    intent: str    payload: Union[MCPMessage, dict]    metadata: Dict[str, Union[str, int, dict]]# 模拟一个用户请求进来raw_request = {    "actor": "user",    "timestamp": int(datetime.now().timestamp()),    "phase": MCPPhase.PRE_MODEL,    "intent": "CHAT",    "payload": {"role": "user", "content": "帮我写一段 Python 代码，计算斐波那契数列前 10 项。"},    "metadata": {"session_id": "session_001", "user_level": "free"}}# 预处理逻辑示例def mcp_preprocess(request: MCPRequest) -> List[dict]:    """    Pre-Model 阶段逻辑：    1. 验证 session_id    2. 注入系统提示词    3. 加载 Memory（这里先假设没有历史）    4. 拼装成 OpenAI 的 messages 列表    """    # 验证 session_id（示例里直接通过）    assert request.metadata.get("session_id"), "缺少 session_id"    # 注入系统提示词    system_msg = MCPMessage(role="system", content="你是一名专业的 Python 编程助手。")    # 构造最终要发送给 LLM 的 messages    messages = [system_msg.dict(), request.payload]  # payload 本身就是一个 MCPMessage    return messages# 演示调用parsed_request = MCPRequest.parse_obj(raw_request)llm_messages = mcp_preprocess(parsed_request)print("Pre-Model 拼装的 messages：", llm_messages)

运行结果示例（打印）：

[  {"role": "system", "content": "你是一名专业的 Python 编程助手。"},  {"role": "user",   "content": "帮我写一段 Python 代码，计算斐波那契数列前 10 项。"}]

这段代码演示了如何在 Pre-Model 阶段，将最初的 MCPRequest.payload（用户消息）与系统提示词合并，变成原生的 Chat API messages。在这个阶段，你还可以加入“检索 Memory”、“检查黑白名单”、“做内容安全校验”等逻辑，并且只要 phase = PRE_MODEL，就说明这些逻辑不会影响到 LLM 推理中对“模型运行状态”的控制。

2.2 模型运行中响应控制（In-Model）

目标：当 LLM 在推理过程中，如果遇到需要调用工具／函数、需要中断推理或注入额外信息之类的指令，就会进入 In-Model 阶段。在这一阶段，MCP 主要负责：

function_call

示例：In-Model 处理 Function Calling

继承上节示例，假设我们在 Pre-Model 阶段拼装好了 messages 并发送给 LLM，得到了下面的响应：

{  "choices": [    {      "message": {        "role": "assistant",        "content": null,        "function_call": {          "name": "calculate_fib",          "arguments": "{"n": 10}"        }      }    }  ]}

In-Model 阶段拆解流程

MCP 解析到 LLM 返回了带 function_call 的消息，说明模型“要调用工具”。

MCP 根据 function_call.name 和 arguments 构造一个新的 MCPRequest：

actor = "assistant"

phase = MCPPhase.IN_MODEL

intent = "TOOL_CALL"

payload = {"name": "calculate_fib", "arguments": {"n":10}}

Python 端执行 calculate_fib(n=10) 得到列表 [0,1,1,2,3,5,8,13,21,34]。

MCP 再构造一条 role="function" 的 MCPMessage，把结果放在 payload 里，并把 phase 设为 "in_model"，继续下一轮调用。

# 继续在前面示例的基础上，演示In-Model的伪代码# 1. 模拟 LLM 返回（带 function_call）llm_response = {    "choices": [        {            "message": {                "role": "assistant",                "content": None,                "function_call": {                    "name": "calculate_fib",                    "arguments": "{"n": 10}"                }            }        }    ]}def mcp_handle_in_model(request: MCPRequest, llm_message: dict):    """    处理 LLM 输出的 function_call，    1. 构造 Tool-Call MCPRequest    2. 执行工具    3. 构造新的 In-Model 阶段的 function 返回消息    """    func_call = llm_message["function_call"]    func_name = func_call["name"]    func_args = json.loads(func_call["arguments"])    # 2. 执行用户定义的函数（这里用伪函数演示）    if func_name == "calculate_fib":        n = func_args["n"]        # 计算前n项斐波那契        fib = [0, 1]        for i in range(2, n):            fib.append(fib[-1] + fib[-2])        result = fib[:n]    else:        result = None    # 3. 构造一条新的 MCPMessage，用作 LLM 下一轮的输入    function_message = MCPMessage(        role="function",        name=func_name,        content=json.dumps({"fib_sequence": result})    )    # 注意：phase 依然保持 In-Model，因为工具调用仍在“推理链”中    next_request = MCPRequest(        actor="assistant",        timestamp=int(datetime.now().timestamp()),        phase=MCPPhase.IN_MODEL,        intent="TOOL_CALL",        payload=function_message.dict(),        metadata=request.metadata  # 原始 metadata 可延续    )    return next_request# 演示调用parsed_pre_request = parsed_request  # 来自上节 Pre-Model 的 parsed_request# 1. LLM 给出的 llm_messagellm_message = llm_response["choices"][0]["message"]# 2. MCP 处理 In-Modelin_model_request = mcp_handle_in_model(parsed_pre_request, llm_message)print("In-Model 阶段构造的下一轮请求：", in_model_request.json(indent=2, ensure_ascii=False))

输出示例（In-Model 构造的下一轮 MCPRequest）：

{  "actor": "assistant",  "timestamp": 1686201234,  "phase": "in_model",  "intent": "TOOL_CALL",  "payload": {    "role": "function",    "content": "{"fib_sequence": [0,1,1,2,3,5,8,13,21,34]}",    "name": "calculate_fib"  },  "metadata": {    "session_id": "session_001",    "user_level": "free"  }}

此时，MCP 就将“函数调用结果”以 role="function" 的形式包装在 payload 中。如果后续 LLM 还需要读入这份斐波那契序列，就会继续下一次 In-Model 调用。直到没有 function_call，或 intent 变更，才会进入 Post-Model 阶段。

2.3 模型输出后的后处理（Post-Model）

目标：当 LLM 不再主动发出工具/函数调用时，说明已经可以产出最终自然语言回答。这时进入 Post-Model 阶段，MCP 负责做：

intent

示例：Post-Model 阶段的业务处理

假设 LLM 最终回答已经出来，MCP 收到：

{  "choices": [    {      "message": {        "role": "assistant",        "content": "前 10 项斐波那契数列为 [0,1,1,2,3,5,8,13,21,34]。"      }    }  ]}

Post-Model 整体流程

function_call

intent="CHAT"

metadata

need_persist_memory = true

message.content

{"response": "..."}"

# 伪代码示例def mcp_postprocess(request: MCPRequest, llm_message: dict):    """    处理 Post-Model 阶段：持久化、路由、日志、输出封装    """    # 1. 如果需要写 Memory    if request.intent == "CHAT" and request.metadata.get("need_persist_memory"):        save_to_memory(request.metadata["session_id"], llm_message["content"])    # 2. 打日志    print(f"[MCP POST] 会话 {request.metadata['session_id']} 正常结束，输出：{llm_message['content']}")    # 3. 构造给前端的标准输出格式    return {"response": llm_message["content"]}# 演示调用final_llm_message = {"role": "assistant", "content": "前 10 项斐波那契数列为 [0,1,1,2,3,5,8,13,21,34]。"}post_output = mcp_postprocess(in_model_request, final_llm_message)print("最终返回给前端：", post_output)

输出示例：

[MCP POST] 会话 session_001 正常结束，输出：前 10 项斐波那契数列为 [0,1,1,2,3,5,8,13,21,34]。最终返回给前端： {'response': '前 10 项斐波那契数列为 [0,1,1,2,3,5,8,13,21,34]。'}

综上，MCP 的“三阶段”将一个原本“黑箱式调用 LLM → 得到回答”的流程，细分成 Pre-Model 注入逻辑、In-Model 工具／函数调用控制、Post-Model 结果处理与路由。这样一来，无论是在性能监控、日志审计、还是安全脱敏、跨 Agent 协作时，都可以精准控制在哪个阶段干什么。

✅ 3. MCP 语义角色结构

核心点：在 MCP 中，除了最基本的 role: user/assistant/function，我们要进一步给每条消息加上 actor、intent、tool_use 等属性，形成“多维度”的语义描述。

3.1 主要字段说明

下面是 MCPMessage（作为 payload 的载体）中常见的部分字段及含义示例：

字段	含义
`actor`	执行实体：如 `"user"`、`"assistant"`（LLM 本身）、`"search_agent"`、`"calculator_agent"` 等
`intent`	意图类型：如 `"CHAT"`、`"TOOL_CALL"`、`"MEMORY_LOAD"`、`"AGENT_ROUTE"` 等
`tool_use`	是否是一次工具调用：`true` 或 `false`；或者用更细粒度的枚举 `{ "name": "search" }` 等
`message`	嵌套的对话消息：包含 `role: user/assistant/function`、`content`、`name`（函数名）等
`metadata`	上下文元信息：如 `session_id`、`conversation_id`、`priority`、`A/B_test_tag`、`user_tier` 等

示例：一个包含多维度语义的 MCPMessage

{  "actor": "assistant",  "intent": "TOOL_CALL",  "tool_use": {"name": "product_search"},  "message": {    "role": "assistant",    "name": null,    "content": "正在帮您搜索性价比高的手机..."  },  "metadata": {    "session_id": "session_001",    "region": "CN",    "user_tier": "free"  }}

actor

intent

tool_use

product_search

message

"正在帮您搜索性价比高的手机..."

metadata

通过这种多维度结构，我们就可以在 MCP Pre/In/Post 三个阶段灵活地做过滤、审计、路由、脱敏等操作。例如，在 Pre-Model 阶段，如果 intent == "TOOL_CALL" 且 tool_use.name == "payment_agent"，我们就必须先校验用户余额；如果 intent == "CHAT" 且 metadata.user_tier == "free"，就需要给 LLM 加一个“免费用户每分钟最多 10 次调用”的系统提示。

✅ 4. MCP 与 OpenAI、Claude 的 Tool Use 结构对比

核心点：市面上常见的 OpenAI Function Calling、Claude Tool Use v1/v2，都只是 MCP 思想的“特定实现”，它们在 JSON 结构、管控节点上存在差异。理解这些差异，有助于我们在自己实现 MCP 时兼容不同服务。

4.1 OpenAI Function Calling 的 JSON 结构

以 OpenAI 为例，我们在调用 ChatCompletion.create() 时，functions、function_call 字段就是 Function Calling 的核心。其典型的输入／输出形式如下：

请求端（用户 → LLM）

{  "model": "gpt-4o-mini",  "messages": [    { "role": "system", "content": "你是一名 AI 助手。" },    { "role": "user", "content": "请计算 6 * 7 的结果。" }  ],  "functions": [    {      "name": "multiply",      "description": "将两个整数相乘",      "parameters": {        "type": "object",        "properties": {          "a": { "type": "integer" },          "b": { "type": "integer" }        },        "required": ["a", "b"]      }    }  ],  "function_call": "auto"}

模型返回（LLM → 用户）

{  "choices": [    {      "message": {        "role": "assistant",        "content": null,        "function_call": {          "name": "multiply",          "arguments": "{"a":6,"b":7}"        }      }    }  ]}

函数执行结果回传（用户 → LLM）

{  "model": "gpt-4o-mini",  "messages": [    { "role": "system", "content": "你是一名 AI 助手。" },    { "role": "user",   "content": "请计算 6 * 7 的结果。" },    {      "role": "assistant",      "content": null,      "function_call": {        "name": "multiply",        "arguments": "{"a":6,"b":7}"      }    },    {      "role": "function",      "name": "multiply",      "content": "{"result": 42}"    }  ]}

以上结构在实现 MCP 所需的核心要素时，还缺少以下几点：

actor 字段

role="assistant"

phase 阶段

更多元的 intent 与 metadata

role + function_call

4.2 Claude Tool Use v1 / v2 的 JSON 结构

以 Anthropic Claude 为例，其 Tool Use v1、v2 在设计上更接近 MCP 思想，但依然不是完全通用的协议。

V1 结构（示例）

{  "options": {    "model": "claude-2-opus",    "plugins": [      {        "plugin_id": "my_search_tool",        "arguments": {          "query": "MCP 是什么？"        }      }    ]  },  "messages": [    { "speaker": "user", "text": "请告诉我 MCP 的核心机制。" }  ]}

优点

plugins

缺点

actor

intent

V2 结构（示例）

{  "messages": [    { "speaker": "system", "text": "你是一个 API 协调专家。" },    {      "speaker": "assistant",      "text": "{{TOOL_CALL: search({"query": "MCP 语义协议"})}}"    }  ]}

优点

text

缺点

4.3 用 Python 比较三者差异

下面给出一个示例脚本，将 OpenAI Function Calling、Claude Tool Use v1、MCP 三种方式并列展示，帮助你直观感受各自的结构特点。

from pydantic import BaseModelfrom typing import List, Dict, Any# 1. OpenAI Function Calling 示例openai_example = {    "model": "gpt-4o-mini",    "messages": [        {"role": "system", "content": "你是一名 AI 助手。"},        {"role": "user",   "content": "请计算 6 * 7 的结果。"}    ],    "functions": [        {            "name": "multiply",            "description": "将两个整数相乘",            "parameters": {                "type": "object",                "properties": {                    "a": {"type": "integer"},                    "b": {"type": "integer"}                },                "required": ["a", "b"]            }        }    ],    "function_call": "auto"}# 2. Claude Tool Use v1 示例claude_v1_example = {    "options": {        "model": "claude-2-opus",        "plugins": [            {                "plugin_id": "my_search_tool",                "arguments": {"query": "MCP 是什么？"}            }        ]    },    "messages": [        {"speaker": "user", "text": "请告诉我 MCP 的核心机制。"}    ]}# 3. MCP 示例class MCPMessage(BaseModel):    actor: str    timestamp: int    phase: str    intent: str    payload: Any    metadata: Dict[str, Any]mcp_example = MCPMessage(    actor="user",    timestamp=1686205000,    phase="pre_model",    intent="CHAT",    payload={"role": "user", "content": "请计算 6 * 7 的结果。"},    metadata={"session_id": "abc123", "user_tier": "free"}).dict()# 并列打印import jsonprint("=== OpenAI Function Calling 示例 ===")print(json.dumps(openai_example, ensure_ascii=False, indent=2))print("\n=== Claude Tool Use v1 示例 ===")print(json.dumps(claude_v1_example, ensure_ascii=False, indent=2))print("\n=== MCP 示例 ===")print(json.dumps(mcp_example, ensure_ascii=False, indent=2))

运行结果示例：

=== OpenAI Function Calling 示例 ==={  "model": "gpt-4o-mini",  "messages": [    { "role": "system", "content": "你是一名 AI 助手。" },    { "role": "user",   "content": "请计算 6 * 7 的结果。" }  ],  "functions": [    {      "name": "multiply",      "description": "将两个整数相乘",      "parameters": {        "type": "object",        "properties": {          "a": { "type": "integer" },          "b": { "type": "integer" }        },        "required": ["a", "b"]      }    }  ],  "function_call": "auto"}=== Claude Tool Use v1 示例 ==={  "options": {    "model": "claude-2-opus",    "plugins": [      {        "plugin_id": "my_search_tool",        "arguments": { "query": "MCP 是什么？" }      }    ]  },  "messages": [    { "speaker": "user", "text": "请告诉我 MCP 的核心机制。" }  ]}=== MCP 示例 ==={  "actor": "user",  "timestamp": 1686205000,  "phase": "pre_model",  "intent": "CHAT",  "payload": {    "role": "user",    "content": "请计算 6 * 7 的结果。"  },  "metadata": {    "session_id": "abc123",    "user_tier": "free"  }}

从并列示例可以看到：

OpenAI Function Calling

messages/functions/function_call

actor

phase

intent

metadata

Claude Tool Use v1

options

MCP

✅ 阶段产出

了解 MCP 的核心字段结构（消息上下文 + 调用上下文 + 控制上下文）

actor

timestamp

phase

intent

payload

metadata

自己写一个 Python MCPRequest 数据结构（推荐用 Pydantic）

MCPPhase

MCPMessage

MCPRequest

priority

trace_id

parent_request_id

agent_chain

至此，通过第②篇博客的学习，你已经从“单纯用大模型”升级到“管理语义链”的思维模式，为后续“实战搭建 MCP 层”和“构建多 Agent 协作”打下了坚实基础。下一篇我们将进入 第三阶段：用 Python 实现一个最小 MCP 系统，带你动手把 MCP 的数据结构、调用转换、工具链调用等整合到一起，让模型真正“像一个有操作系统的 Agent”来工作。敬请期待！

简介

✅ 1. MCP 是什么：大模型的语义操作系统

1.1 请求上下文统一封装：who / when / why / how

MCPRequest 样例（JSON 格式）

✅ 2. MCP 三阶段：Pre / In / Post Model 执行控制

2.1 前置信息注入（Pre-Model）

示例：Pre-Model 阶段的处理流程

2.2 模型运行中响应控制（In-Model）

示例：In-Model 处理 Function Calling

In-Model 阶段拆解流程

2.3 模型输出后的后处理（Post-Model）

示例：Post-Model 阶段的业务处理

Post-Model 整体流程

✅ 3. MCP 语义角色结构

3.1 主要字段说明

示例：一个包含多维度语义的 MCPMessage

✅ 4. MCP 与 OpenAI、Claude 的 Tool Use 结构对比

4.1 OpenAI Function Calling 的 JSON 结构

4.2 Claude Tool Use v1 / v2 的 JSON 结构

V1 结构（示例）

V2 结构（示例）

4.3 用 Python 比较三者差异

✅ 阶段产出

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签