掘金 人工智能 07月21日 14:02
AIGC、RAG、Agent、Function Call、MCP 到底啥关系?一次讲明白!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文旨在用最简单的方式,一次性讲清楚AI领域层出不穷的热词。从AIGC(AI生成内容)的单模态到多模态进化,阐述了AI生成内容的核心能力。接着,探讨了AIGC在实时性和工具使用上的局限,引出了RAG(检索增强生成)和Function Call(函数调用)技术,它们分别解决了信息实时性和模型调用外部工具的问题。Function Call是AI走向Agent(智能体)的关键,Agent通过多步骤、多工具、多轮决策来完成复杂任务,具备自主决策和任务规划能力。最后,介绍了MCP协议(模型上下文协议)作为AI世界的“USB接口”,致力于标准化模型与外部工具的连接方式,推动AI应用生态的繁荣。

🚀 **AIGC与多模态:AI内容生成的新时代** AIGC(AI Generated Content)的核心能力是利用AI自动生成人类常做的工作,最初多为单模态(如文生文或图生图)。随着技术发展,AI已能处理多种类型的内容,如文生图、图生文等,这种支持多种信息类型交互的能力被称为多模态,以GPT-4为代表的多模态模型是AI从“工具”进化为“助手”的关键,极大地拓展了AI的应用场景。

💡 **RAG与Function Call:解决AI的“信息差”与“行动力”** AIGC存在两大限制:实时性不足(知识库更新滞后)和不具备使用工具的能力。RAG(Retrieval-Augmented Generation)通过实时检索外部信息来增强生成内容,让AI能“看资料答题”。Function Call(函数调用)则允许AI根据指令自动调用外部函数或接口,赋予AI“动手”能力,使其能执行实际任务,这是AI走向“智能体”的关键一步。

🤖 **Agent:AI的自主决策与任务规划能力** Agent(智能体)是AI发展的更高阶段,它能够进行自主决策和任务规划。面对复杂任务,Agent能够像“多线程”调度器一样,自行拆解任务、调用多个工具、并根据中间结果重新思考下一步行动,最终完成闭环任务。这使得AI不再是被动执行指令,而是能够主动规划和执行,提供更智能化的解决方案。

🔌 **MCP协议:AI世界的“USB接口”,实现工具的标准化接入** 随着AI工具和系统日益复杂,工具的标准化接入成为痛点。MCP(Model Context Protocol)作为AI世界的“USB接口协议”,旨在标准化模型与外部工具之间的连接方式。它通过统一的协议,降低了接入新工具的成本,实现了模型与工具的松耦合,使得AI应用能够像“装插件”一样灵活扩展,促进了AI生态的繁荣发展。

Hello,大家好,我是 Sunday。

最近很多同学特别关注 AI 相关的领域。但是,AI 技术发展太快了,AIGC、RAG、Agent、Function Call、MCP 等等的各种热词层出不穷的。多到就算是很多程序员都搞不明白了。

所以,咱们今天这篇文章,我就来用最简单的方式,帮你把这些热词一次性讲清楚~

从 AIGC 到多模态

大部分同学应该都是从 ChatGPT 开始接触 AI 的,比如我就是。

刚开始用 ChatGPT 的时候,我们体验到的其实是一种典型的 文生文 能力:

你输入一句话,它给你生成一段文字回应。

不管是写文章、改简历,还是输出代码、写周报,都是 AI 在根据你的文字 Prompt,生成另一段文字。

这种让 AI 自动生成内容的能力,就叫做 AIGC

AIGC,全称是 AI Generated Content(AI 生成内容),它的核心能力是:用 AI 自动生成“人类常干的活”

在最初的时候,AIGC 他只能处理 一种类型 的内容,比如:GPT-3 只懂文字,SD 只会画画,这种模式就被称之为 单模态

但是,随着 AI 的进化,不只是文生文,像:文生图、图生文、文生视频、图文生视频……也都逐渐支持了(并且进化的速度特别快),而这种支持 多种类型 消息的,就被称为是 多模态。 比如现在的 CPT-4。

而这些多模态模型,才是真正让 AI 从“工具”进化成“助手”的关键。

但 AIGC 有两个“天生的限制”:

因此,这就引出了两个技术方向,一个叫 RAG,一个叫 Function Call

RAG 实时信息查询

RAG,全称是 Retrieval-Augmented Generation(检索增强生成)。

就像上面的 DeepSeek 截图一样,如果查询的内容超过了知识库怎么办呢?

很简单 实时查询就可以了! 查完以后,把资料贴给 AI,再让它写。

比如你问“北京明天的天气”,它自己不知道,但可以去“检索模块”查一遍,把查到的结果再结合起来给你回答。

你可以理解成:原来模型靠死记硬背,现在它学会“看资料答题”了。

但如果你仔细想一想:只会看,越不行呀。

咱们需要的时,他可以把资料看完之后,把内容返回给咱们。甚至可以做到,当我说:“给我订个明天下午去北京的高铁票” 时,他可以 自动调用 12306 接口,选好车次直接下单

如果你可以想到这里,那么恭喜你。你已经摸到 Agent 智能体 的门槛了。

中间就只差了一个 Function Call(函数调用)

Function Call 调用函数

简单来说,Function Call 就是让模型 根据你的指令,自动调用外部的函数或接口,把任务真正执行掉。

比如你说:“我现在在北京,查一下明天上海的天气。”

传统的 LLM:

“对不起,我只能提供截至 2023 年的信息。”

支持 RAG 的模型:

“明天上海天气 28°C,小雨。”(它查了资料,但没动手)

支持 Function Call 的模型:

它会判断你这个请求,需要调用一个叫 getWeather(city) 的函数,然后自动生成参数 city = "上海",调用完天气 API → 拿到结果 → 生成回复:

“明天上海 28°C,小雨,建议带伞。”

你看,整个过程中,它已经从一个单纯的回答者,变成了 可以自己思考你接下来应该怎么做 “带伞 的 “人” 了

因此,我们说 Function Call 是 AI 走向“智能体”的关键

这时候,该登场的,就是最近特别火的词:Agent(智能体)

Agent:传说中的 “人工智能”

前面咱们说了,Function Call 让模型拥有了“动手能力”。

但是你会发现,现实世界的任务,往往不是一句话、调一次函数就能搞定的。

比如说你问它: “我十一想自驾从济南去北京,帮我规划下出行方案。”

一个聪明的 AI 应该怎么干?

理想流程可能是这样的:

    查济南十一当天的天气(看是否适合出行)查从济南到北京的高速路况查加油站分布和服务区情况安排中途住宿综合输出一份行程建议

注意,这不是一步能干完的,而是一个“多步骤 + 多工具 + 多轮决策”的链条

普通的 Function Call,只能调用一个函数。但是,这个流程里,模型要自己判断用哪些工具、什么顺序、调几次,每次结果又影响下一步行为。

这时候,就该轮到 Agent(智能体) 出场了。

什么是 Agent?

Agent,说白了就是让模型具备一定程度的自主决策和任务规划能力

它就像一个“多线程”的模型调度器:

    每接一个任务,自己思考怎么拆解根据情况调用多个工具遇到中间结果会重新思考下一步最后一步步把复杂任务完成

你可以理解成:它会思考、规划、决策、执行,真正具备了“完成任务”的闭环能力。

我们可以通过一张 Agent 流程图 进行展示:

并且,这整个流程可以重复多轮,直到目标完成。

还是以“济南十一自驾去北京”为例,它可能经历这样的 Agent 执行链:

这就是 Agent 的特性:不是你一步步告诉它怎么干,而是它自己规划该怎么干。直接给你最终的规划和结果

到目前,大家是不是已经感觉 Agent 挺牛批 的了。

但是(哎,必须得有个但是),他依然还存在一些问题。比如:标准化

大家想想,就和手机充电头一样,各家的可能都不一样,从而导致除了现在这种奇葩的 “一拖三”:

那么对于 Agent 也一样,调用的工具那么多。当工具越来越多、系统越来越复杂的时候,如何让模型可以按照统一的标准,低成本地接入更多工具呢?

答案就是:MCP 协议

MCP 协议:标准化协议接口

MCP(Model Context Protocol,模型上下文协议)是由人工智能公司 Anthropic 于 2024 年 11 月 24 日正式发布并开源的协议标准。你可以简单理解成:AI 世界的 “USB 接口协议”。

它的目标是:标准化模型和外部工具之间的连接方式。

什么意思?

来看几个典型痛点:

没有 MCP 以前有了 MCP 之后
每个工具都要独立接入所有工具统一协议,复用成本低
模型和工具强绑定松耦合,谁来调用都行
平台之间协议不通用基于开放标准,可跨平台、跨模型
没有工具生态MCP 广场上线,AI 应用像“装插件”一样用工具

举个例子:

一句话总结就是:以前是 M × N 的混乱对接,现在是 M + N 的标准接口。

你可以这么理解现在 AI 技术栈的关系:

这就是我们现在看到的 AI 应用演进路径......

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AIGC RAG Agent Function Call MCP协议
相关文章