原创 贾思玉、亢江妹 2025-06-05 19:00 陕西
分析当下热门AI Agent产品的交互设计模式,探讨如何打造高效、易用、友好的Agent交互体验。
或许你还记得 ChatGPT 问世时的轰动,第一次使用 DeepSeek R1 的兴奋和激动也历历在目。AI Agent 发展一日千里,今年以来,几乎每个月都有新的 AI Agent 产品发布,现有产品也不断更新换代,让人目不暇接。
本文将从体验设计视角,来看看当下热门的 AI Agent 产品,如 Manus、Flowith、Gemini Deep Research、Cursor、Devin 等,分析 Agent 产品面临的设计挑战,探讨有效的交互设计模式,
一、 从“工具”到“伙伴”的 AI Agent 产品
回顾 AI Agent 的发展历程,可以看到一条从“工具”到“伙伴”
当下,AI Agent 正朝着更高阶的 AGI 形态迈进,
正是这种能力进阶,使得 AI Agent 的交互设计变得越来越重要。当 AI 从单纯的"工具"
二、AI Agent 产品交互设计难点
AI Agent 产品的工作流程大体上包括:用户输入需求开启任务、
以 Manus 的简历筛选案例为例,在收到用户请求后,
围绕这一工作流程,要打造流畅的 AI Agent 交互体验,设计师需要解决贯穿其中的多个难点。
启动阶段设计难点
当用户开始使用 AI Agent 时,
模型/模式切换困难:一个 AI Agent 可能提供多种模型或工作模式,对于非熟练用户而言,
上手门槛高:一些 AI Agent 的首页或任务开启界面追求创新,
复杂任务需修修补补:对于需要调用工具、多步决策的复杂问题,
过程阶段设计难点
在 AI Agent 执行任务的过程中,用户面临着如何理解、
多模块信息难对应:如上文所说,AI Agent 通常整合对话、任务进度、结果和代码日志等多种元素,
过程透明度不足:一些 AI Agent 不能清晰披露为何做出某种决策,
用户介入不灵活:当前 AI Agent 产品一般并不允许中途暂停。任务一旦开启(
结果阶段设计难点
当 AI Agent 完成任务后,用户需要进行结果浏览、使用和优化,
结果呈现割裂:AI Agent 最终可能输出文档、报告、图表、网页、
结果修改受限:当用户对结果不满意,应该为他们提供简便、
质量自检空白:一个任务有没有完成、结果质量如何、
版本管理缺失:AI Agent 执行完任务后,用户可能需要持续注入反馈或补充指令,
以上这些难点直接影响了用户与 AI Agent 协作的效率和结果满意度。不过,AI Agent 产品发展日新月异,一些产品已经开始探索解决之道,
三、AI Agent 产品交互设计模式及应用案例
Agent 产品设计三大原则
为解决 AI Agent 交互设计的诸多挑战,
1.透明化和可解释性:
2.认知减负:如何简洁有效地呈现信息,帮用户减少干扰、
3.人在环路(Human-in-the-loop):
基于这些原则,我们总结了七个关键设计模式,也可以作为日后 AI Agent 产品的设计策略:
七大关键设计模式
模式 1:注意力引导(Attention Guidance)
核心理念:引导用户将注意力放在正在发生的、
最关键的或需要协作处理的信息区域, 减少无关信息或干扰用户理解 AI 工作的元素。
设计要点:渐进式展示而非一次性呈现所有信息;非高频/
重要窗口隐藏折叠;信息分层及视觉效果区分, 如高亮正在执行重要操作的模块; 同类元素的交互和视觉样式保持一致。
模式 2:就地澄清(In-Place Clarification)
核心理念:允许用户在任务执行的环境中直接提供反馈和修正,
而不会脱离上下文。
设计要点:提供灵活、定位准确的编辑入口,
避免多个窗口或操作位置之间的转换; 保持编辑区域与结果预览的一致性;用户修改完成后, 提供明确的保存/更新反馈。
模式 3:自动建议(Auto-Suggestion)
核心理念:用选择代替输入,少用开放式提问,
邀请用户协作而非依赖人工。
设计要点:在关键决策点、需要用户意见时,
提供范围适当的选项数量;指出错误的同时给出解决方案选项; 允许用户在选项之外自由输入;根据使用历史、 用户偏好推荐最优选项。
模式 4:思考外显(Think-Aloud)
核心理念:让 AI 外显其思考过程、计划和决策依据,
增强透明度和可解释性。
设计要点:AI 工作状态和进度始终清晰可见;
使用自然语言与用户互动;允许用户调整推理、 执行过程展示的详细程度;使用适当的可视化手段(如思维导图、 流程图)解释工作过程。
模式 5:上下文/知识匹配(Context/Knowledge Match)
核心理念:主动识别相似问题,自动调取历史信息和知识资源,
减轻用户记忆负荷,避免重复输入。
设计要点:记录用户选择或决策以简化未来任务执行;
标注正在记忆或使用的上下文/知识; 提供修改或移除自动引用上下文的选项; 隐私敏感场景下的调用需向用户确认。
模式 6:暂停-反馈-继续(Pause-Feedback- Continue Flexibility)
核心理念:任务执行过程中允许用户暂停、
提供反馈并决定后续操作,始终保证用户控制权。
设计要点:提供明显的暂停按钮;允许中止并保存已完成内容;
设置关键决策点的自动暂停;提供操作简便的继续/重启/ 放弃选项;用户操作可撤销/可逆。
模式 7:环境/工作流适配(Environment/ Workflow Adaptability)
核心理念:AI Agent 可以与现有工作环境或工作流程适配融合,
帮用户减少腾挪的麻烦。
设计要点:任务启动位置和方式灵活;
为用户提供多种结果使用方式,贴合实际工作习惯;工作环境中, 支持跨平台同步,向用户清晰展示同步结果。
模式应用场景举例
AI Agent 产品设计模式并非孤立存在,而是在 AI Agent 工作的不同使用阶段相互配合、综合应用, 共同提升用户体验。 让我们进一步探讨这些设计模式如何在已有的 AI Agent 产品中得到应用,或者未来有哪些应用机会, 以解决特定的交互难题。
入口设计和任务开启阶段
在用户开始使用 AI Agent 的阶段,重点是降低上手门槛,帮助用户高效表达需求:
- 就地澄清 & 自动建议应用:在用户下达任务后,ChatGPT Deep Research 会就模糊的地方提问确认,Gemini Deep Research 则根据用户指令先进行任务拆解规划,再提供“修改方案”按钮,允许用户较早参与协作,但二者都需要用户在对话框中输入文本。更优的设计是提供选项加快决策,或允许用户“就地”在方案计划上直接编辑。
- 环境/工作流适配应用:Gemini 针对 Google Workspace 设计了一整套解决方案,
- 上下文/知识匹配应用:目前一些 AI Agent 产品允许用户建立和管理自己的知识库,
过程呈现与人机协作阶段
在任务执行过程中,设计重点是增强透明度、支持用户灵活介入,
- 注意力引导应用:AI Agent 界面通常由以下核心元素构成:1)用户输入与对话框;
- 思考外显应用:目前 AI Agent 产品都很重视思考、行动过程的透明化,
- 暂停-反馈-继续应用:用户通过对话框下达指令后,
结果展示与结果迭代阶段
任务完成后,关键是让结果易于浏览、使用和改进:
- 就地澄清应用:如果利用 v0 和 Cursor 等代码生成类 AI Agent 搭建网页、手机APP等产品,
- 环境/工作流适配应用:AI Agent 生成的结果,往往并不是用户工作的终点,
4. 结语
随着 AI Agent 从简单的问答工具向协作伙伴、数字生产力转变,
通过对 Manus,Cursor,Gemini 等产品进行分析,
- 透明化和可解释性:让用户看到 AI Agent 的工作过程、信息来源和决策依据,降低 AI 幻觉、
未来,随着技术的发展,我们期待看到更多创新的交互模式,