诠释备忘录 06月12日 10:33
AI创业者夜聊:跟几个大咖一起聊聊Agent
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

文章记录了创新工场和变量资本组织的创业者夜聊复盘,探讨了AI技术发展对各行业的影响。会议核心围绕GPT-4o、C2AI平台、模型边界、AI native应用机会、Agent定义等议题展开深入讨论。文章对AI在内容创作、交易平台、垂直场景应用等方面的机遇与挑战进行了分析,并对未来创业方向提出了独到见解,引发了对AI时代创业的深刻思考。

🚀 GPT-4o 的发布引发行业震动,大模型展现出跨维度碾压的潜力,加速了AI在内容创作领域的应用,使得零门槛的创新成为可能。

💡 C2C/C2B等交易平台可能演变为C2AI/AI2B等模式,AI的介入将解构规模效应,为创业公司带来新的机会,但短期内AI能力主要集中在效率提升层面。

🤔 模型发展的瓶颈在于顶尖知识库的耗尽,RL在复杂推理方面的不足限制了Agent的应用范围。合成数据在追赶策略中扮演重要角色,但标注仍依赖专业人才。

🌱 AI native应用的关键在于获取垂直场景下的标准化数据,通过产模一体化来实现。用户行为的原子量化和模型学习格式的转化是关键。

🗣️ AI目前主要在“糊弄人”和“创作价值”两方面发挥作用,前者已接近成熟,后者仍有提升空间。Agent与人类协作模式将催生新一代协作平台。

原创 忠炜 2025-03-31 09:53 北京

昨天参加创新工场和变量资本(极客公园)组织的创业者夜聊,第一次近距离和汪华老师、张鹏老师近距离深入交流,这期是对本次会议的一个复盘和思考,以此文作为记录

昨天参加创新工场和变量资本(极客公园)组织的创业者夜聊,第一次近距离和汪华老师、张鹏老师近距离深入交流,也有一些明星创业者、投资人,很开心,也非常感谢好朋友 Judy 的邀请和组局。

一般大的交流会基本上不怎么去了,这种小范围聚会,轻松的环境,大家聊的也比较深入。想法都是在交流中涌现的。希望以后还是多一些这种的讨论。

本文当作对交流的复盘思考和记录(仅代表个人观点,大概率都是错的):

1. 本来是个 agent 讨论,但是不得不对刚发的 GPT-4o 进行讨论,大家真的是太受震撼了这里有个特别有意思的事,在 Gemini 绘图新模型出来时候,我私下问好朋友归藏老师,“你觉得大模型这种端到端的出图能力会击碎 comfyUI 嘛?” 当时回应的很坚决的,是不会的,结果 2 周后 4o 出来后,我又问了归藏老师,回复了“哈哈哈哈 艹”。

我对这个事情其实是有预期的,comfy 本质还是 workflow,为解决不同需求,将节点进行组装。有他的优势,因为是 workflow 结果更加可控,但缺点也很明显有局限性,被框定在一个模版里,用户只能修改暴露出的 input,部署过于复杂。

但大模型就是去流程化的,本来是等着什么时候大模型真正学习了 comfy 的节点,可以自主进行编排就行了,没想到直接来个跨维度碾碎(目前猜测是 transformer 像素推理 --> 再转扩散模型生成)简直是图片领域的 deepseek 时刻。

0 门槛级别的创新,创意的快速实现,之前还很远的 AI 内容平台的,感觉一夜间不远了...

2. C2C 平台、C2B 平台等交易平台会不会变成 C2AI 或 AI2B 甚至 AI2AI这个问题之前说实话没认真想过这个问题,但确实还挺关键的,AI 会解构规模效应,一些互联网时代通过规模效应建立起来的商业模式,如果一方被 AI agent 解构,那就是技术问题,不是核心竞争力了 ,比如 boss 直聘。这么看有很多创业公司的机会,只是 timing 问题。

但是短期内 AI 的能力还是在匹配撮合阶段进行效率提升,还没有深入渗透,可能就是行业的窗口期吧~

3. 模型的边界在哪里?RL 到头后还没有新的增量空间?这个问题决定于在有限的未来,上述的设想能不能落地,在技术上是不是有可能的。目前看 LLM Pre-training 已经到头了,RL 主要还是在代码和数学上增加 COT 的推理能力,但模型的发展人类顶尖的知识库已经被耗干了,下一步模型提升的方法在哪,目前看还没有在地平面之上。

基模的智能其实很难再快速提升了,但是目前能力看下来,涉及多步的复杂推理还是效果不好,这块是判断 agent 是否可以用到比较深的领域,对后边 AI 可以做到的边界是非常有挑战的事情。

(关于合成数据的问题,有一线的头部数据公司创始人表示,一些头部的公司还是想办法找更牛的人去做数据标注,数据合成现在大多还是用于一些非头部的追赶策略

4. 新一代 AI native 应用机会世界有很多场景是一些通用大模型拿不到的数据。拿不到标准化的数据,就无法让模型进行学习。

且在相对垂直的场景下,模型来训练相关工作流程的学习效率 是比 模型只根据外部输入进行流程编排准确率是高很多的

如何拿到某个场景中的 标准化数据 且有 很好的 performance 评估,我觉得该垂类场景能不能存在的关键。

从这类垂直场景下,如何采集到且使用好这些数据,是AI native应用的关键。

看起来这些数据必须有前端产品承载,才可以有效的抓取,且产生的结果知道好还是不好产模一体在相对垂直场景下确实是很 make sense,如果拆解用户动作进行原子量化,且可以转化为模型学习的格式,确实是值得好好研究的问题。

环境、动作、奖励这三个很底层的概念。 什么样的环境是通用的(可以被通用模型吃掉的),对应的动作是什么(增、删、改、查?浏览、点击、滚动?),如何进行奖励。不同的场景批凑不同的组合,对应不同的产品。

Anthropic 对 Agent 的定义是:Agent 必须在内部执行目标任务,而不是依赖外部的工作流。 

5. 汪华老师很有意思,表达了一个观点,AI 现在主要干两个东西:一个是糊弄人,一个是创作价值。糊弄人的:帮面试者作弊、搞个 AI 帮开会、洗稿、陪聊美女等等

创作价值:coding、辅助写小说等等

目前看糊弄人的已经能到 80-90 分了,创作价值的可能知道 60 分,一涉及多轮对话,垂直场景难一些的任务就不行。

6. 当人没有被 AI 完全替代时,人可以作为“tool”,被 agent 调用。agent 根据需求来分配人。需求被自动合理的分解、分配、量化产出,并可以快速匹配对应的供给方。所带来的需求更加原子化,新一代的写协作平台感觉有巨大的机会。

7. 关于隐私的问题有提到几个 case 都很好,体现了人类的微妙

智能眼镜:如果告诉这个眼镜可以实时录像,可以记录孩子上学时的所做。对于这个孩子的家长是很好的,对于其他的孩子家长就会觉得隐私被侵犯。 但是其实手机现在已经有录像录音的全部能力,大家其实是不关心的。

让 AI 替我去开会:如果说别人不知道这个是 AI,那没事。如果进去的真的是 AI,那就是对开会人的不尊重。其实大家本来对于大会也是不怎么听的。

会议录音总结

有些需求是真实存在的,但是还真不好拿到台面去说,对自己有利的工具,可能就是伤害其他人隐私的利器。最终可能还是靠大家默许的自觉。

8. 还有个点很有意思,大家在几个小时的讨论中,几乎没有讨论 manus9. 到底什么是Agent?
其实 agent 的定义每个人都有自己的理解,不用纠结于概念,没变的还是需要找的垂直场景需求,走对应的技术路线更好解决它。算法能干的算法干,干不了的工程化给补补,最终交付一个相对合理的产品给到用户。

...还有些东西就不便在公开场合分享了。




根据大家的交流,对我的启发:

1. 还是需要多看相关论文,跟进最新技术变化

2. 多用产品,最牛的产品会给很多启示

3. 牛逼的创业者对需求定义和理解还是最犀利的,最根本的核心竞争力

4. AI native 团队的创业者整个认知理解是高一个 level 的,团队的场域真的很重要

5. 真正理解最新技术,进行快速实践的团队还是不多,更多是一些敏锐的个体开发者。

6. 最近身边出来创业的人越来越多,新的周期可能真的要来了。

零零碎碎的暂时想起这么多,有新的思考会及时补充,欢迎各位“AI同行人”找我来交流,微信 ysbg_z,有好的想法大家可以一起探讨!


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI 创业 GPT-4o Agent AI Native
相关文章