原创 镜山 2025-05-19 20:31 北京
Agent Neo ——与众不同的新物种。
你好呀,世界!我,Agent Neo,来了!
👦🏻 作者: 镜山
🥷 编辑: Koji
🧑🎨 排版: NCon
自从 3 月份 Manus 发布打响 AI Agent 元年的第一炮之后,整个 AI Agent 赛道如雨后春笋,百花齐放。
如果说 4 月份是每周一个新 AI Agent 产品的发布节奏,到了 5 月这一周,几乎每天都有 1~2 个新的 AI Agent 产品来邀请「十字路口」体验。
就在我们团队的几个人用得头昏眼花又审美疲劳之际,突然遇到了一个让我们眼前一亮的「新物种」,来自 flowith 推出的 AI Agent:Neo。
出道吧!Agent Neo
两天前的周六,Agent Neo 选择在「十字路口」于上海漕河泾发起的 AI Hacker House 「出道」,举办了一场非常硅谷范儿的小型闭门发布会。
「出道」发布会的现场来了几十位 AI 行业的朋友,大家热热闹闹地聊了三四个小时。
AI Hacker House 也为 Agent Neo 的「出道」悄悄准备了一个「0 岁生日蛋糕」。
(ps,我们期待看到更多酷产品、好产品来 AI Hacker House 出道,欢迎后台联系我们。)
Koji 在这场发布会的现场往我们的群里 po 了不少照片和感想,表达欲突然变强,还立了 flag 说打算写一篇文章来分享他的感受和思考,下周发在「十字路口」,欢迎大家关注。
今天这篇文章,我们着眼于产品本身,重点介绍 Agent Neo。
与众不同的新物种
「十字路口」团队大概提前 5 天拿到了邀请码,第一时间全方面体验了 Agent Neo。我们在花了几十个小时、跑了四十几个 case 之后,可以很有信心地说:
Agent Neo 确实是:与 众 不 同 的 新 物 种。
为什么说 Agent Neo 是「新物种」?——因为它就像是跨越了 Agent 种族的一次创新,不但长得和其他 AI Agent 不一样,背后的逻辑与理念也独树一帜。
下面是我们的第一手体验。包括 3 个最能代表 Agent Neo 与众不同能力的 case,和几点感受。
Hello,Agent Neo!初次见面,请多多关照。
在分享 case 之前,让我们先介绍一下 Agent Neo:它是谁、从哪里来、打算到哪里去。
它是谁?
Agent Neo 是 flowith 推出的 AI Agent。
在 flowith 里打开 Agent Mode ,可以直接调用 Agent Neo 模式,此模式下 Agent Neo 可以智能指挥多种大模型,完成长程复杂任务。
除了 Agent 模式之外,flowith 还提供了像是图片/视频生成、提示词生成、联网搜索等多种垂类任务的应对策略。
flowith 把 DeepSeek-R1、Grok 3、Claude 3.7 Sonnet、OpenAI o3 等全网最 SOTA 的大模型全部集成进来了,统统可用。
flowith 还有一个在深受用户喜爱的功能:知识花园,以及隐藏在「发现更多」里的知识市场。
通用 Agent 在面临垂类任务时往往会有些吃力,因为它需要私域信息确保输出答案的合理性。
flowith 则将这一系列知识库功能融合进来。
用户可以自主创建知识库,或者干脆用别人上传好的。在让 Agent 干活时,一键启用这些知识库即可。
比如,我将做客「十字路口」的嘉宾们的谈话记录上传了知识库,并且公开给所有人用。
上传后,flowith 会自动进行分析,提取关键信息作为“种子”。
flowith 认为“种子是知识的最小单元”,就像是下面的每一页都是一个“知识种子”:
从哪里来?
flowith 由一群年轻的中国人成立于美国硅谷,现在同时在上海和美国设立两个办公室,现已获得多轮一线美元基金投资。从创建之初,他们就在思考如何构建一个超越传统聊天工具的 AI 创作平台。 他们自己也有一句非常有趣的 slogan: " Stop chatting, start creating"
他们的第一款 Agent 产品 Agent Oracle 早在 OpenAI o1 推理模型出世之前,就已经推出,曾在去年 8 月获得了 Product Hunt 产品日榜全球第一。
上个月,flowith 甚至创造了 0 投放 130 万美金 ARR 订阅收入的好成绩。
他们的愿景也很简单:Let technology flowith everyone
要到哪里去?
flowith 的野心不小,为 Agent Neo 设定的目标听起来十分“星辰大海”。
比如,flowith 认为 Agent Neo 不仅是他们过去的 Agent Oracle 的升级,更是争取要超越其他 AI Agent。
并且,他们洞察到 Agent 元年的下半场的第一个关键词是 「Agency」(此语境下译为:能动性)。
Agent Neo 希望全方位突破 AI Agent 的应用边界。
flowith 这么讲的原因是:这回他们带来了一个能够构建、执行、管理超复杂自动化工作流。
flowith 提供了 Agent Neo 在通用 AI Agent 能力测试 GAIA 中的表现:在三个难度级别中,全部刷新了 SOTA 性能评分。
接下来是我们的一手体验,分享给大家!
Agent Neo 的关键词:「无限」
无限步骤、无限上下文、无限工具
为了测试 Agent Neo 打造的「无限」有多「无限」,我们试跑了很多任务。
先从「无限步骤」说起:Agent Neo 可「打一辈子工」
「无限步骤」意味着 Agent Neo 能持续不断地为你工作,就像一个永不疲倦的终身助手。
目前市面上的 AI Agent 都只发挥了 LLM 的基础智力,在此之上并没有展现更多的「主观能动性」。
而 Agent Neo 是第一个同时支持主动思考、询问、迭代的「专家」。
首先,你可以指定 Agent Neo 定时完成重复的复杂任务,这个任务可以一直重复、一直跑,直到地老天荒。
比如,我们试了试这个任务:
挑选并汇总分析 10 家顶级国外风险投资公司(例如a16z),不断跟踪他们又投了什么新公司,做一份投资动态报告,发送到我的邮箱。
然后,我一般默认打开所有“外挂知识库”,这样操作既方便,又能让 Agent Neo 在实际执行任务提升精准性。
Agent Neo 会立马开始规划一个非常详细的长序任务工作流:
在无限画布里, Agent Neo 会在第一轮寻找如何定位 10 家 VC,开始自动搜寻知识,自己给自己赋能。
根据这些搜索信息,Agent Neo 会让用户确认最终的候选名单。完成确认后,你只需提供一个邮箱地址,它就能继续执行任务。
之后,Agent Neo 就会继续自动规划,全程无需用户交互。
它首先会回溯并分析各家 VC 的历史投资动态,汇总相关信息,生成一份完整的回溯报告。
到这一步,我就无须关注 Agent Neo 到底如何完成任务了——因为第一份报告已经顺利送达我的邮箱。
值得一提的是,Agent Neo 相对于 flowith 前一代 Agent Oracle,在处理复杂任务时明显更加流畅,而且能更熟练地搜寻信息并判断信息来源的时效性。
然后,我就可以安心睡觉了,因为 AgentNeo 不仅可以半夜工作,还可以像一个人一样自己优化任务,按照我的提示词需求,定时爬起来做任务。
在我睡着的几个小时内,Agent Neo 自动发送了 28 轮报告到我的邮箱,展现出惊人的工作效率。
经过与 Agent Neo 团队确认后我们了解到:只要用户不主动终止任务且 token 额度充足,这个任务就会一直持续下去——真如"打一辈子工"那般,直到地老天荒。
Agent Neo 的「无限上下文」可以有多无限?
先看一个简单点的任务:
我预先复制了一篇 Koji 与大聪明的对谈记录,做成了文档上传给 Agent Neo,再让 Agent Neo 自己去搜什么是 flowith,参考飞书和我上传的文档,做一个网页。
紧接着,Agent Neo 开始自动规划多步骤的工作流,开始第一轮信息搜集:flowith 到底是个怎样的公司。
很快,Agent Neo 将这些信息和知识总结成了一份报告,并根据这份报告作出了第一个网站。
它长这样:
之后,Agent Neo 开始了数个版本的自主迭代:
直到 Agent Neo 觉得上一个版本的沙盒演示可能符合用户的基础需求了,它开始询问我是否有进一步微调或者是补充特定信息的修改意见:
在回滚五六轮之后,Agent Neo 的工作流终于完成了。
它发来了最终版本——一个数万字的网页,文章排版完全符合我给出的设计提示词要求。
具体长什么样,请看下面这个视频:
看到 Agent Neo 动不动就能输出数万字的能力,我们打算进一步试探 Agent Neo 「无限上下文」的边际在何处。
于是,我们布置了一个新任务:
请帮我续写 100 集甄嬛传,并提供海量的关键配图。
《甄嬛传:太后临朝》100 集的详细叙事就这样被「无限上下文」地创作出来了,除了文字部分,Agent Neo 同样搜寻到了大量关键剧照:
直观感受下全屏的工作流:
对于真实存在的《甄嬛传》,Agent Neo 会直接搜索根据文字内容去「无限制」地寻找真实的剧照。
如果让它续写 100 集《哆啦 A 梦》,它则会自主根据这部动画片先前的内容进行分析,按照一般的情节开始创作:
紧接着,Agent Neo 开始根据《哆啦 A 梦新动画片》每集的内容开始调用文生图模型,进行图片生成了。
比如「万能修理泥浆大混乱」这一集,主要的剧情是这样的:当大雄再次搞砸事情时,哆啦 A 梦拿出的“万能修理泥”却搞得到处都是。
这张关键配图是不是还挺符合故事主题的:
在 Agent Neo 创作的过程中,故事与图是一起生成的,每一张生成的图片都对应一个剧情短篇:
Agent Neo 调用文生图模型第一轮图片生成中就给出了 20 张,每张图都做的好可爱,我忍不住多放了几张在这里,大家请欣赏!
利用「无限工具」,用知识花园做一个「数字分身」
Agent Neo 的「无限工具」体现在哪些地方呢?
为了探索它的真正含义和边界,我们进行了大量的任务测试。
最后,我们找到了一个好玩的:
我们发现 Agent Neo 将复杂任务处理能力与 flowith 深受好评的「知识花园」功能进行了结合,从而开启了更多的「可能性」。
在 flowith 首批测试用户群里,我们受到了 @杜韦柯er. 的启发,决定利用十字路口的知识库(Koji 的采访对话播客稿件)来制作一个 Koji AI 数字分身。
创建一个性格丰富的 AI 数字分身其实很简单,只需前往 DeepSeek API 平台[1] 开通 API 并充值 10 元即可,这笔费用足够使用很长时间。
接下来,只需要输入一段很简单的提示词,只需要描述好:
参考知识库信息
分析 Koji 的性格特点
做一个数字分身
API Key 是:XXX
API 技术文档在哪里
之后,Agent Neo 会自动结合我上传的知识库,分析里面所有与 Koji 这个人物有关的信息,并给出一份极其详尽的 Koji 人物画像报告。
(据悉,Koji 本人对此十分满意,性格特点和身份等等信息都十分精准)
紧接着,Agent Neo 会自动调用 Browser 查看 DeepSeek 的技术文档,视觉定位这个网页里的所有元素,获取知识。
有了上一步的知识积累,Agent Neo 开始自主构建 Koji 的数字分身了,包括如何调用 API、Koji 这个角色该如何塑造等等。
制作 Koji 数字分身的整体流程只需要 10 分钟,甚至只跑了一遍测试,结果就已经令人十分满意了。
我录了一段 Koji 老师是如何工作的视频,大家可以直观感受下:
我与这个分身聊了不少时间,DeepSeek API 的消耗非常低,如果想聊一上午,估计也就是几分钱。
Koji 数字分身的整体人设也比较一致,并且具有历史记忆管理能力。
现在大家可以随意通过 flowith 的知识花园——这个具有强大识别能力的知识库,以非常“从容、轻松”的姿态,上传你想要构建的任何数字分身的背景资料,一步做出具有“专业知识的数字分身”。
你想与谁对话?其实只取决于你的想象力,Agent Neo 负责执行并扩大的你的创意。
别急,我们还有一些感受要分享:
1 与众不同的“无限画布交互方式”
flowith 主打的“无限画布交互方式”,虽然初看非常复杂,但往往会在某些时刻带给我很惊艳的体验。
比如,在这份无限的画布中,AgentNeo 的任务步骤、可延展性、多线程处理能力可以做到相对无限地自由拓展。
在 Agent Neo 的工作流程中,当它在某个节点完成了一份详尽的投资动态报告后,我能直接选中并引用这份报告。
此时,flowith 会提供大量对话模式,每种模式下都会提供可选择模型。
如果没有特殊需求,直接选用“Agent Mode”模式,Agent Neo 就可以直接自动调用多种类型的模型,制作一份用于商业分析报告的网页。
我们给 Agent Neo 做的可交互网页录了个屏,你可以直观感受下,短短几分钟之内,Agent Neo 是如何多线处理任务,并且给出了一份质量很高的答卷的:
在这份 VC 投资分析网页原型里,每一个功能模块(诸如 Filters、搜索框)都可以交互,体现出了很高的完成度。
2 从”透明“到”控制”
人与人要构建深度关系,信任非常重要。因此,Manus 和 DeepSeek 都把自己的工作过程与思维过程纤毫毕现地“透明”展示出来,赢得了用户的信任。
Agent Neo 又往前走了一步,在“透明”的基础上,实现了更多一些的“控制”。
1)给用户赋权,人为控制
从输入提示词开始到项目制作完毕,Agent Neo 的工作并不总是一帆风顺的,虽然它的能力已经很强大了,但「使用者」更重要。
比如,最终成品网页出来之前,它就已经做了三个版本,不断地添加功能、修改 BUG。在这个自我改善的过程中,Agent Neo 会将修改的权利给到用户。
像是 Webpage 节点的下方都会存在两个键:一个网页代码、一个可视化成品。
在可视化成品端,flowith 还支持单一节点的 Refine,可以直接用提示词在交付物上进行代码的优化。
在网页代码端,用户被赋予了“随意修改代码”的权利,这集成了主流 AI 编程 Agent 的界面交互思路。
2)自我反思,不断审查
AgentNeo 还会一遍一遍地自主审查做出的成果是否符合需求。
你会在 Agent Neo 的工作流之中,发现它不断地给自己发送审查报告,以此来督促自己。
如果 Agent Neo 在某项任务中出现问题,你还可以用 AI 去微调它,
即便成果已到达用户提示词里的交付标准,Agent Neo 还会再附赠一份框架审查报告、一份框架总结报告,还有一堆项目总结报告。
这种将"控制权"交给用户的方式让我感到非常愉悦。它不再是一个让人无从插手的"黑盒",即便结果可能出现幻觉。
作为使用者、作为人类,我对 Agent 的需求不仅仅是"提示词—结果"这样简单的互动(何况在当下,LLM 的幻觉问题仍未解决,结果质量往往不尽如人意),更重要的是要有"掌控感"。
3 美是一种生产力
Agent Neo 是具有「审美观」的,这不仅体现在 Agent Neo 的交互界面上,更体现在了功能之中。
相对于传统的图片生成工作流,Agent Neo 不会基于用户直接输入的提示词生图,,而是用“提示词——自主搜集信息——生产创意性知识——图片生成”的流程。
先看效果。
Agent Neo 在做一整套“三体”设定故事集时,生成了如下的配图:
如果单纯追求艺术感,而忽略了用户需求,那么它就很难说是一个能够扩宽 AI Agent 生产力平台边界的产品。
但看看下面这个 Agent Neo 为自己量身定做的「自我介绍」网站,也很有风格。
除此之外,flowith 这家公司的审美还体现在各种细节,比如为 Agent Neo 做的预告片。
再比如,他们劝导用户进入超级 AI 创作空间的宣传片:
4 将知识作为 Agent 的算力
flowith 利用过去的积累——知识花园,给 Agent Neo 送上了新的价值大礼包。
现在的用户可以快速上传、添加知识库,利用 flowith 将知识降解成「知识种子」的玩法,让 Agent Neo 发挥更大能力。
比如,在我实际测试 Agent Neo 能不能为我“打工”一辈子时,就已经产生了大量较为成熟的工作流,而这些“知识”全部可以作为 Recipe 发布到社区里,继续发光发热。
flowith 还做了一个 Agent 社区,在这里用户间可以互相分享 Recipe,为彼此提供新玩法。
每个人都在分享自己的工作流,这不就是在花园里播撒知识的种子吗!
🚥
Agent Neo:欢迎来到未来世界,我们一起,共赴星辰大海!
flowith 也为我们提供了一批邀请码,数量真的非常非常非常有限!需要的朋友直接关注公众号,后台回复「 neo 」就能参与抽奖了。
悄悄地说一句:flowith 已注册的老用户会自动获得邀请码,未注册的新用户还能继续「裂变」邀请码,并获赠会员。
希望大家都能玩上!
参考资料
[1] DeepSeek API 平台: https://platform.deepseek.com/api_keys