诠释备忘录 04月09日 18:57
AI创业者夜聊:跟几个大咖一起聊聊Agent
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文是对创新工场夜聊活动的复盘,作者与汪华老师、张鹏老师等行业人士深入交流,探讨了GPT-4o对行业的影响、C2AI平台的潜力、模型边界、AI Native应用机会、以及Agent的定义等关键议题。文章结合讨论内容,分享了对AI创业的思考和感悟,强调了技术追踪、产品体验、需求洞察和团队的重要性,并对行业发展趋势进行了展望。

🤯 **GPT-4o的冲击:** 讨论了GPT-4o对行业带来的巨大冲击,尤其是在图像生成领域,其去流程化的特性颠覆了传统的workflow模式,使得AI内容创作的门槛大大降低,加速了AI内容平台的发展。

🔄 **C2AI与商业模式变革:** 探讨了AI对现有商业模式的解构,规模效应在AI时代可能不再是核心竞争力,C2C、C2B平台可能转变为C2AI或AI2B模式,为创业公司提供了新的机会,但短期内AI能力主要集中在匹配撮合阶段。

🧐 **模型边界与Agent的挑战:** 讨论了LLM的局限性以及RL在提升推理能力上的进展。指出多步复杂推理是判断Agent能否深入应用的挑战,合成数据在追赶策略中的应用,以及AI在垂直领域的数据获取和应用是关键。

💡 **AI Native应用的关键:** 强调了在垂直场景下获取标准化数据的重要性,并提出产模一体化的方法。作者认为,采集、使用好垂直场景数据是AI Native应用成功的关键,需要产品承载,原子化用户动作并转化为模型学习的格式。

🎭 **AI的“两面性”:** 汪华老师的观点认为,AI目前主要有两个作用:糊弄人和创作价值。前者已经达到较高水平,而后者在多轮对话和垂直场景任务上仍有不足。文章认为,当人未被完全替代时,人可以作为Agent调用的“tool”,推动协作平台的发展。

原创 忠炜 2025-03-31 09:53 北京

昨天参加创新工场和变量资本(极客公园)组织的创业者夜聊,第一次近距离和汪华老师、张鹏老师近距离深入交流,这期是对本次会议的一个复盘和思考,以此文作为记录

昨天参加创新工场和变量资本(极客公园)组织的创业者夜聊,第一次近距离和汪华老师、张鹏老师近距离深入交流,也有一些明星创业者、投资人,很开心,也非常感谢好朋友 Judy 的邀请和组局。

一般大的交流会基本上不怎么去了,这种小范围聚会,轻松的环境,大家聊的也比较深入。想法都是在交流中涌现的。希望以后还是多一些这种的讨论。

本文当作对交流的复盘思考和记录(仅代表个人观点,大概率都是错的):

1. 本来是个 agent 讨论,但是不得不对刚发的 GPT-4o 进行讨论,大家真的是太受震撼了

这里有个特别有意思的事,在 Gemini 绘图新模型出来时候,我私下问好朋友归藏老师,“你觉得大模型这种端到端的出图能力会击碎 comfyUI 嘛?” 当时回应的很坚决的,是不会的,结果 2 周后 4o 出来后,我又问了归藏老师,回复了“哈哈哈哈 艹”。

我对这个事情其实是有预期的,comfy 本质还是 workflow,为解决不同需求,将节点进行组装。有他的优势,因为是 workflow 结果更加可控,但缺点也很明显有局限性,被框定在一个模版里,用户只能修改暴露出的 input,部署过于复杂。

但大模型就是去流程化的,本来是等着什么时候大模型真正学习了 comfy 的节点,可以自主进行编排就行了,没想到直接来个跨维度碾碎(目前猜测是 transformer 像素推理 --> 再转扩散模型生成)简直是图片领域的 deepseek 时刻。

0 门槛级别的创新,创意的快速实现,之前还很远的 AI 内容平台的,感觉一夜间不远了...

2. C2C 平台、C2B 平台等交易平台会不会变成 C2AI 或 AI2B 甚至 AI2AI

这个问题之前说实话没认真想过这个问题,但确实还挺关键的,AI 会解构规模效应,一些互联网时代通过规模效应建立起来的商业模式,如果一方被 AI agent 解构,那就是技术问题,不是核心竞争力了 ,比如 boss 直聘。这么看有很多创业公司的机会,只是 timing 问题。

但是短期内 AI 的能力还是在匹配撮合阶段进行效率提升,还没有深入渗透,可能就是行业的窗口期吧~

3. 模型的边界在哪里?RL 到头后还没有新的增量空间?

这个问题决定于在有限的未来,上述的设想能不能落地,在技术上是不是有可能的。目前看 LLM Pre-training 已经到头了,RL 主要还是在代码和数学上增加 COT 的推理能力,但模型的发展人类顶尖的知识库已经被耗干了,下一步模型提升的方法在哪,目前看还没有在地平面之上。

基模的智能其实很难再快速提升了,但是目前能力看下来,涉及多步的复杂推理还是效果不好,这块是判断 agent 是否可以用到比较深的领域,对后边 AI 可以做到的边界是非常有挑战的事情。

(关于合成数据的问题,有一线的头部数据公司创始人表示,一些头部的公司还是想办法找更牛的人去做数据标注,数据合成现在大多还是用于一些非头部的追赶策略

4. 新一代 AI native 应用机会

世界有很多场景是一些通用大模型拿不到的数据。拿不到标准化的数据,就无法让模型进行学习。

且在相对垂直的场景下,模型来训练相关工作流程的学习效率 是比 模型只根据外部输入进行流程编排准确率是高很多的

如何拿到某个场景中的 标准化数据 且有 很好的 performance 评估,我觉得该垂类场景能不能存在的关键。

从这类垂直场景下,如何采集到且使用好这些数据,是AI native应用的关键。

看起来这些数据必须有前端产品承载,才可以有效的抓取,且产生的结果知道好还是不好产模一体在相对垂直场景下确实是很 make sense,如果拆解用户动作进行原子量化,且可以转化为模型学习的格式,确实是值得好好研究的问题。

环境、动作、奖励这三个很底层的概念。 什么样的环境是通用的(可以被通用模型吃掉的),对应的动作是什么(增、删、改、查?浏览、点击、滚动?),如何进行奖励。不同的场景批凑不同的组合,对应不同的产品。

Anthropic 对 Agent 的定义是:Agent 必须在内部执行目标任务,而不是依赖外部的工作流。 

5. 汪华老师很有意思,表达了一个观点,AI 现在主要干两个东西:一个是糊弄人,一个是创作价值。

糊弄人的:帮面试者作弊、搞个 AI 帮开会、洗稿、陪聊美女等等

创作价值:coding、辅助写小说等等

目前看糊弄人的已经能到 80-90 分了,创作价值的可能知道 60 分,一涉及多轮对话,垂直场景难一些的任务就不行。

6. 当人没有被 AI 完全替代时,人可以作为“tool”,被 agent 调用。agent 根据需求来分配人。

需求被自动合理的分解、分配、量化产出,并可以快速匹配对应的供给方。所带来的需求更加原子化,新一代的写协作平台感觉有巨大的机会。

7. 关于隐私的问题

有提到几个 case 都很好,体现了人类的微妙

智能眼镜:如果告诉这个眼镜可以实时录像,可以记录孩子上学时的所做。对于这个孩子的家长是很好的,对于其他的孩子家长就会觉得隐私被侵犯。 但是其实手机现在已经有录像录音的全部能力,大家其实是不关心的。

让 AI 替我去开会:如果说别人不知道这个是 AI,那没事。如果进去的真的是 AI,那就是对开会人的不尊重。其实大家本来对于大会也是不怎么听的。

会议录音总结

有些需求是真实存在的,但是还真不好拿到台面去说,对自己有利的工具,可能就是伤害其他人隐私的利器。最终可能还是靠大家默许的自觉。

8. 还有个点很有意思,大家在几个小时的讨论中,几乎没有讨论 manus

9. 到底什么是Agent?
其实 agent 的定义每个人都有自己的理解,不用纠结于概念,没变的还是需要找的垂直场景需求,走对应的技术路线更好解决它。算法能干的算法干,干不了的工程化给补补,最终交付一个相对合理的产品给到用户。

...

还有些东西就不便在公开场合分享了。




根据大家的交流,对我的启发:

1. 还是需要多看相关论文,跟进最新技术变化

2. 多用产品,最牛的产品会给很多启示

3. 牛逼的创业者对需求定义和理解还是最犀利的,最根本的核心竞争力

4. AI native 团队的创业者整个认知理解是高一个 level 的,团队的场域真的很重要

5. 真正理解最新技术,进行快速实践的团队还是不多,更多是一些敏锐的个体开发者。

6. 最近身边出来创业的人越来越多,新的周期可能真的要来了。

零零碎碎的暂时想起这么多,有新的思考会及时补充,欢迎各位“AI同行人”找我来交流,微信 ysbg_z,有好的想法大家可以一起探讨!


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI 创业 GPT-4o Agent AI Native
相关文章