原创 忠炜 2025-03-31 09:53 北京
昨天参加创新工场和变量资本(极客公园)组织的创业者夜聊,第一次近距离和汪华老师、张鹏老师近距离深入交流,这期是对本次会议的一个复盘和思考,以此文作为记录
昨天参加创新工场和变量资本(极客公园)组织的创业者夜聊,第一次近距离和汪华老师、张鹏老师近距离深入交流,也有一些明星创业者、投资人,很开心,也非常感谢好朋友 Judy 的邀请和组局。
一般大的交流会基本上不怎么去了,这种小范围聚会,轻松的环境,大家聊的也比较深入。想法都是在交流中涌现的。希望以后还是多一些这种的讨论。
本文当作对交流的复盘思考和记录(仅代表个人观点,大概率都是错的):
1. 本来是个 agent 讨论,但是不得不对刚发的 GPT-4o 进行讨论,大家真的是太受震撼了
这里有个特别有意思的事,在 Gemini 绘图新模型出来时候,我私下问好朋友归藏老师,“你觉得大模型这种端到端的出图能力会击碎 comfyUI 嘛?” 当时回应的很坚决的,是不会的,结果 2 周后 4o 出来后,我又问了归藏老师,回复了“哈哈哈哈 艹”。
我对这个事情其实是有预期的,comfy 本质还是 workflow,为解决不同需求,将节点进行组装。有他的优势,因为是 workflow 结果更加可控,但缺点也很明显有局限性,被框定在一个模版里,用户只能修改暴露出的 input,部署过于复杂。
但大模型就是去流程化的,本来是等着什么时候大模型真正学习了 comfy 的节点,可以自主进行编排就行了,没想到直接来个跨维度碾碎(目前猜测是 transformer 像素推理 --> 再转扩散模型生成)简直是图片领域的 deepseek 时刻。
0 门槛级别的创新,创意的快速实现,之前还很远的 AI 内容平台的,感觉一夜间不远了...
2. C2C 平台、C2B 平台等交易平台会不会变成 C2AI 或 AI2B 甚至 AI2AI
这个问题之前说实话没认真想过这个问题,但确实还挺关键的,AI 会解构规模效应,一些互联网时代通过规模效应建立起来的商业模式,如果一方被 AI agent 解构,那就是技术问题,不是核心竞争力了 ,比如 boss 直聘。这么看有很多创业公司的机会,只是 timing 问题。
但是短期内 AI 的能力还是在匹配撮合阶段进行效率提升,还没有深入渗透,可能就是行业的窗口期吧~
3. 模型的边界在哪里?RL 到头后还没有新的增量空间?
这个问题决定于在有限的未来,上述的设想能不能落地,在技术上是不是有可能的。目前看 LLM Pre-training 已经到头了,RL 主要还是在代码和数学上增加 COT 的推理能力,但模型的发展人类顶尖的知识库已经被耗干了,下一步模型提升的方法在哪,目前看还没有在地平面之上。
基模的智能其实很难再快速提升了,但是目前能力看下来,涉及多步的复杂推理还是效果不好,这块是判断 agent 是否可以用到比较深的领域,对后边 AI 可以做到的边界是非常有挑战的事情。
(关于合成数据的问题,有一线的头部数据公司创始人表示,一些头部的公司还是想办法找更牛的人去做数据标注,数据合成现在大多还是用于一些非头部的追赶策略)
4. 新一代 AI native 应用机会
世界有很多场景是一些通用大模型拿不到的数据。拿不到标准化的数据,就无法让模型进行学习。
且在相对垂直的场景下,模型来训练相关工作流程的学习效率 是比 模型只根据外部输入进行流程编排准确率是高很多的
如何拿到某个场景中的 标准化数据 且有 很好的 performance 评估,我觉得该垂类场景能不能存在的关键。
从这类垂直场景下,如何采集到且使用好这些数据,是AI native应用的关键。
看起来这些数据必须有前端产品承载,才可以有效的抓取,且产生的结果知道好还是不好。产模一体在相对垂直场景下确实是很 make sense,如果拆解用户动作进行原子量化,且可以转化为模型学习的格式,确实是值得好好研究的问题。
环境、动作、奖励这三个很底层的概念。 什么样的环境是通用的(可以被通用模型吃掉的),对应的动作是什么(增、删、改、查?浏览、点击、滚动?),如何进行奖励。不同的场景批凑不同的组合,对应不同的产品。
Anthropic 对 Agent 的定义是:Agent 必须在内部执行目标任务,而不是依赖外部的工作流。
5. 汪华老师很有意思,表达了一个观点,AI 现在主要干两个东西:一个是糊弄人,一个是创作价值。
糊弄人的:帮面试者作弊、搞个 AI 帮开会、洗稿、陪聊美女等等
创作价值:coding、辅助写小说等等
目前看糊弄人的已经能到 80-90 分了,创作价值的可能知道 60 分,一涉及多轮对话,垂直场景难一些的任务就不行。
6. 当人没有被 AI 完全替代时,人可以作为“tool”,被 agent 调用。agent 根据需求来分配人。
需求被自动合理的分解、分配、量化产出,并可以快速匹配对应的供给方。所带来的需求更加原子化,新一代的写协作平台感觉有巨大的机会。
7. 关于隐私的问题
有提到几个 case 都很好,体现了人类的微妙
智能眼镜:如果告诉这个眼镜可以实时录像,可以记录孩子上学时的所做。对于这个孩子的家长是很好的,对于其他的孩子家长就会觉得隐私被侵犯。 但是其实手机现在已经有录像录音的全部能力,大家其实是不关心的。
让 AI 替我去开会:如果说别人不知道这个是 AI,那没事。如果进去的真的是 AI,那就是对开会人的不尊重。其实大家本来对于大会也是不怎么听的。
会议录音总结
有些需求是真实存在的,但是还真不好拿到台面去说,对自己有利的工具,可能就是伤害其他人隐私的利器。最终可能还是靠大家默许的自觉。
8. 还有个点很有意思,大家在几个小时的讨论中,几乎没有讨论 manus
9. 到底什么是Agent?还有些东西就不便在公开场合分享了。
根据大家的交流,对我的启发:
1. 还是需要多看相关论文,跟进最新技术变化
2. 多用产品,最牛的产品会给很多启示
3. 牛逼的创业者对需求定义和理解还是最犀利的,最根本的核心竞争力
4. AI native 团队的创业者整个认知理解是高一个 level 的,团队的场域真的很重要
5. 真正理解最新技术,进行快速实践的团队还是不多,更多是一些敏锐的个体开发者。
6. 最近身边出来创业的人越来越多,新的周期可能真的要来了。
零零碎碎的暂时想起这么多,有新的思考会及时补充,欢迎各位“AI同行人”找我来交流,微信 ysbg_z,有好的想法大家可以一起探讨!