“AI小万”是阿里妈妈基于先进AI能力给广告商家打造的AI数字员工,作为个性化的推广管家帮助商家在淘宝平台更好地进行营销推广。它通过对话方式对客户的精准意图进行识别,辅助多轮会话及总结能力,在投放的各个环节给广告主带来个性化建议,比如依托全局营销知识库的知识问答功能,基于自然语言表达的数据快查功能,面向推广提效的诊断调优、AI巡检、早晚报、图表速成功能,面向投放过程辅助的AI选词及悉语文案功能等,目前小万支持的功能如下图所示:

延展阅读>>:详细产品信息请参考阿里妈妈「AI小万」正式上岗,你的专业推广诊断师来了!
小万是阿里妈妈充分利用大模型价值的典型AI应用,其背后包括针对大模型规划、生成能力的原生化实践,Multi-Agent架构体系的沉淀,以及配套的原生化AI工程能力建设。本文会针对小万背后的工程能力进行一轮揭秘。
2. 整体思路
小万作为AI商业应用,与传统商业化应用最大的区别在于允许用户做个性化诉求表达,工程框架侧核心是构建Native AI Agent模式来进行支持。具体思路包括:
依托Multi-Agent架构体系,联动工程体系和算法能力,充分利用大模型价值(规划能力、生成能力),对商业化能力进行支撑;
依托工具中心,标准化外部能力的构建和调用模式,高质量的为大模型提供外部工具调用能力;
依托知识库,实现知识标准化迭代,持续提升知识质量,通过端到端的RAG能力,助推应用效果的持续提升;
依托评测中心,初步形成AI应用迭代的数据飞轮,提升AI应用迭代的质量。具体如下图所示:

3. 技术细节
3.1 Multi-Agent架构体系
小万基于Vertical Multi-Agent架构进行了Native AI Agent能力的建设,具体如下图所示。

其中Controller Agent为入口层Agent,其核心定位为拆解及分发任务,汇总总结,和客户直接交互。类似于老板角色。它通过任务规划形成任务执行指令,交由执行Agent来执行,并针对执行结果对用户进行展示。Controller Agent之下为Executable Agent,其核心定位为专业工作的执行,类似于员工角色。
Controller Agent与Executable Agent基于标准化的Agent通信协议来进行交互,通信协议中包括原始的自然语言指令及改写后的更精准 & 具体的指令。交互过程中的多轮对话历史信息及执行中的过程信息,两者通过Memory进行共享。

3.1.1 Controller Agent
Controller Agent是客户交互的入口,结合用户的意图进行拆解及分发,我们基于自研的研发框架联动算法侧进行了多轮对话、总结回答能力、多任务Agent规划建设。
多轮会话能力:通过Memory升级,并联动算法Planner模块及工具中心,完成了多轮会话能力的升级。

如上图所示,针对图示的多轮对话,系统处理过程如下:
? ROUND 1: 查询过去7天花费最多的三个计划
tb1f88f642f5
标识,同时在Episodic Memory中存储用户的对话历史。? ROUND 2: 它们的ROI是多少
tb1f88f642f5
变量中的数据。tb1f88f642f5
变量的过滤条件。Summary能力:基于研发框架进行了Graph编排,联动算法侧完成Summary能力建设,针对复杂的取数类场景完成过程润色及结果总结能力。

复杂问题的CoT规划:部分复杂问题需要进行多次反思规划才能得出最终的一个结论,在Controller Agent引入了ReAct模式来进行复杂问题的CoT规划。ReAct过程中的Context数据,交由LLM进行反思,决定下一步规划的结果。

借助研发框架的组图能力,基于ReAct模式的step进行了组图,在observation之后引入了pastSteps环节,将observation的结果与之前的步骤进行汇总,供LLM在下一轮迭代中使用。
3.1.2 Executable Agent
Executable Agent,其核心定位为专业工作的执行,目前Multi-Agent下挂了几个特定领域的Agent:

数据查询Agent任务规划能力:在执行框架侧,通过Plan & Execute规划模式,与内置LLM的Planner模块之间进行交互,规划出的工具动态编排的协议,同时通过预定义了callback函数inject上下文及环境信息,完成复杂取数指令的执行。

__call_back_dump_list($_node_1.计划)
,可以获取上一个节点的计划执行结果。3.1.3 Agent通信协议
在Multi-Agent体系下定义了标准化的Agent协议,方便各Agent间的通信,在协议上借鉴了Google Langfun的自然语言表达,及结构化变量携带,并在出参上携带schema信息;协议定义上也参考了开源的AgentProtocol。
{
"input": xxx, // 实例化后真实调用自然语言
"additionalInput": {
"rawInput": xxx, // 原始请求
"rewriteInput": xxx, // 改写后请求
"variable1": xxx, // 相关变量 ... }, ....}
{
"status": "success|failed|unsupported", // 执行成功|执行失败|能力暂不具备
"outputType": "标准化输出类型"
"output": "xxx | [] | {} ",
"outputSchema": {}, // 对应的结果schema
"additionalOutput":{}
"tasks": [ {"task_id": "xxx",
"name": "xx"
"type": "agent, tool, function, xx",
"output": "xxx | [] | {} ",
"additionalOutput":{}
"input": {} } ] ....}
3.2 基于工具中心的标准化Tool-Use能力的建设
依托小万场景,我们沉淀了具备标准化Tool-Use能力的工具中心,其面向妈妈全域工具进行管理,通过工具规范,支持高效工具接入、高效模型训练、高效agent调用,并建立工具可观测性及评估机制,建立了Tool-Use及Tool Learning的标准。

其中的关键能力包括:
工具接入 & 样本增强标准化:对全域工具进行管理,包括工具的注册、发布、修改、删除、打标等;同时进行工具调用权限的管控;针对工具识别的样本,我们实现了样本管理能力,包括样本的添加、修改及删除;同时提供了基于种子样本进行的AI样本泛化增强能力。

工具动态感知:联动Controller Agent侧构建了In-Context-Learning链路,新工具可以通过打标进行动态感知,badcase可以通过升级工具样本进行快速解决。

controller_agent
tag。3.3 基于Advanced RAG的知识库建设
依托小万场景进行了知识库建设,为妈妈营销大模型提供优质数据语料,并提供端到端的RAG能力,助推小万知识场景效果的持续提升。

其中的关键能力包括:
知识接入标准化:实现了从知识接入到知识索引构建的链路标准化,具体如下图所示:

知识管理标准化:依托内部的AI研发平台构建了营销场景的知识管理平台,实现了面向小万的知识管理标准化。


3.4 面向应用迭代的数据飞轮建设
AI应用的效果,最终依托数据飞轮来提升,我们面向小万,完成了标准化数据链路的构建,依托评测中心收拢应用侧的回流、反馈、清洗、标注、评测数据,持续提升小万的迭代质量。

依托人工/自动化评测的数据飞轮迭代机制:评测中心打通线上回流截图,基于人工/自动化评测发现线上潜在的问题,并通过工单系统来追踪和反馈,解决后通过Popup机制通知到潜在用户,从而驱动业务迭代。

4. 未来规划
AI数字员工的一个核心特质是可以在真实场景中基于正负反馈不断提升自身能力,实现“自我进化”,这也是搜推广等传统算法模型驱动业务的技术精髓。
目前,小万已经初步完成了交互感知、直觉规划、外部能力标准化接入以及基础知识生产和迭代链路的构建。为了进一步提高其智能水平,我们需要以智能体Agent为中心,进行拟人化建设,标准化感知、规划及认知学习模式,推动Agent技能进化。下个阶段,我们将持续建设基于Memory的感知能力、System2级别的推理和规划能力,并构建完整的DIKW学习链路,确保小万能够持续学习并不断涌现新技能。

▐ 关于我们
我们是阿里妈妈AI数据与应用平台团队,专注于推进AI商业应用、AI工程体系构建,及AI应用架构的升级,目前相关的工程能力,覆盖阿里妈妈内外多条业务线,欢迎各业务方关注与业务合作。同时,欢迎具备AI背景的同学加入我们!
?简历投递邮箱:alimama_tech@service.alibaba.com