原创 奇绩创坛 2025-02-21 18:08 北京
与张月光、杨松琳、周衔、刘鹏飞以及更多 AI 创业者、科研学者、产品经理和开发者面对面交流
关注奇绩的小伙伴,奇绩潜空间第六季活动开始报名,第一期活动时间为 3 月 1 日。
第六季我们邀请到 “妙鸭相机”创始人兼 CEO 张月光、MIT 计算机科学与人工智能实验室二年级博士杨松琳、卡内基梅隆大学机器人研究所博士周衔、上海交通大学生成式人工智能研究组负责人刘鹏飞与大家交流经验。共同探索前沿 AI 科技与产品的边界突破:科研、模型、数据与应用开发的多维对话。
【第 1 期嘉宾介绍】张月光——沐言智语创始人、产品经理,目前聚焦在 AI ToC 产品的创新探索。5 年阿里工作经验,从 0 到 1 创办妙鸭相机,还曾经从 0 到 1 打造二次元换装语音社交产品“元音”。本次张月光将带来《 AI 应用探索的一些实践》的分享。
【第 2 期嘉宾介绍】杨松琳—— MIT 计算机科学与人工智能实验室二年级博士生。专注于线性注意力机制、机器学习与大语言模型交叉领域,聚焦高效序列建模的硬件感知算法设计,围绕线性变换、循环神经网络优化开展研究,并取得多项研究成果,多篇论文被 ICLR 2025、NeurIPS 2024 等顶会收录,此外,她还开源 Flash-Linear-Attention 项目,助力领域发展。本次她将带来《下一代 LLM 架构展望》的主题分享。
【第 3 期嘉宾介绍】周衔——先进生成式物理引擎 Genesis 贡献人一作。多篇文章被 NeurIPS 2024、CoRL 2024、ICML 2024 等顶会收录。现卡内基梅隆大学机器人研究所博士毕业生,曾于新加坡南洋理工大学取得学士学位。对机器人技术、计算机视觉和世界模型学习有广泛的兴趣。目前的研究重点是构建用于机器人研究及其他领域的统一神经策略和数据引擎。本次分享周衔将带来《生成式仿真:为具身智能解决数据难题的新范式》的主题分享。
【第 4 期嘉宾介绍】刘鹏飞——上海交通大学副教授、清源研究院院长助理,生成式人工智能研究组(GAIR)负责人。专注于自然语言的预训、生成和评估等研究方向,发表学术论文 100 余篇, 被谷歌学术引用 16000 余次。ACL 会议史上首次实现连续两年获得 System & Demo Paper Award ;提示工程( Prompt Engineering )概念最早提出者之一,单篇引用超过 5000 余次。参与 o1 journey,LIMA 以及 LIMO 等模型的开发。在本次分享中刘鹏飞将分享《AI 第二幕驱动的数据工程与认知工程变革》。
【奇绩潜空间】是 GenAI 时代冲得最快的一批科研学者/从业者/创业者聚集的 AI 人才社区,我们定期邀请大模型前沿创业者分享产品实践探索,邀请前沿科研学者分享最新技术进展。
除嘉宾分享外,每期在北京和上海线下都设置了【匹配合伙人 Co-Founder Matching】环节,在这里你可以和 GenAI 时代最有活力的创业者和研究者线下面对面交流。(往期参与者大多是来自大厂的算法工程师、架构师、AI 产品经理、创新战略部经理及创业者们)。欢迎扫描下方海报二维码报名。
【奇绩潜空间】第五季内容回顾
【内容回顾】 第一期嘉宾
宋亚宸——VAST 创始人兼 CEO
宋亚宸与大家分享了关于 Tripo 产品、3D 大模型技术以及 3D 内容创作和应用等多方面的问题与未来发展,深入浅出地讲解了 3D 大模型技术的发展、Tripo 产品功能特性、应用场景、商业化、技术优势、面临的挑战以及对 3D 内容平台的展望等相关内容。
【观点节选】
技术方面,第一步是静态的自然生成,第二步是动态的内容生成,第三步我们认为到明年年底,不管是外婆还是孩子都可以零门槛、零成本实时地去创作完整的 3D 内容体验。
我们认为在明年,3D 生成的技术可以达到 4K,很重要的一点是认为其 AI 3D 的原生创作者社区会达到千万级别,社区达到千万级别后大家肯定要创作,创作门槛和成本下降后,大家会创作一些新的内容范式出来。
之前那些玩法都是降本增效,属于前置的使用场景,认为潜力最大的是把 3D 生成变成一种新的交互方式,变成一种新玩法,所以说越来越多的 3D 产品、3D 场景,3D 生成除了降本增效外,会变成一种新的交互方式,我们把 3D 内容平台和 AI 进行了结合,就像剪映与抖音要有所结合那样。
【内容回顾】第二期嘉宾
季宇——行云创始人兼 CEO,前华为海思昇腾芯片编译器专家
季宇围绕 AI 产业的发展与变革展开深度分享,涵盖从技术演进到商业落地的多方面内容。深入探讨了 AI 算法从萌芽到深度学习、大模型兴起的历程,分析了行业发展中面临的如技术泡沫、Benchmark 局限性等问题。详细阐述了计算演进各阶段的特点,以及 Scaling Law 在推动模型发展中的作用与局限。
【观点节选】
借鉴物理学的构建论,我们相信 AI 的未来不仅在于简单规律的扩展,还在于复杂系统的涌现规律。通过复杂性的提升,新的能力可能自然出现,而这些能力未必依赖于彻底颠覆现有方法。
要实现 AI 产业的下一阶段突破,需要把目前只能由超算支撑的计算体验转化为普惠的消费级产品。通过这种普惠化,产业可以实现规模化发展,并为人工智能带来下一个高度。
尽管当时的市场普遍认为大型机代表高端、工作站属于中高端,而 PC 则是低端,但从产业发展的角度来看,PC 体系实际上具备更优的可扩展性。简单来说,不是 GPU 比 CPU 更好,而是 GPU 和 CPU 的结合比单一的 CPU 更好。这种组合使得异构计算成为满足高性能需求的最佳选择。
【内容回顾】第三期嘉宾
叶添——清华大学姚班,卡内基梅隆大学博士生,Physics of LLM 2.1 和 2.2 作者
叶添与大家分享了关于模型推理改进、iGSM 数据集相关研究以及模型性能分析等多方面的问题和未来方向,讲解了深度对模型推理的影响、改进策略、模型错误分析、iGSM 数据集特点、模型推理过程分析、模型选择与训练数据,以及过往研究对比等相关内容。
【观点节选】
语言模型已经超越了数据集所交给它的技能,而学到了更具普遍性的能力。它能够从没有直接学习过的内容中进行归纳( generalize )。或许,这就是 AGI 中 G ( General Intelligence )诞生的地方。
总结一下,语言模型不仅能学习如何在数据集之外进行推理(我们称之为二级推理),还能够通过推理进行规划,从而提升其推理能力。此外,通过加入错误数据或伪造错误数据,语言模型能够自我修正错误错误越多,它的表现越好,能够不断学会如何纠正自己的错误。
【内容回顾】第四期嘉宾
刘琦——香港大学计算机科学系助理教授,Reka AI 联合创始人
刘琦与大家分享了关于个人、Reka 基本情况,文本与多模态大模型构建、多模态 Agents 应用及创业公司机会等多方面的问题和未来,深入浅出地讲解了文本大模型、多模型与文本模型融合、指令微调、偏好对齐、多模态数据管理分析、自动驾驶、具身智能、Computer Use 等相关内容。
【观点节选】
个人认为,AI,特别是语言模型,是年轻人创业的最佳风口之一。总体而言,我认为 AI 是年轻人创业的一个非常好的领域。这个领域能够最大化利用 GPU 资源,团队的年轻性也是一种优势。只要能够提高这些指标,在 AI 领域就能创造出很多有趣的成果。
OpenAI 最早的发现了 scaling law,不断地去 scaling 算力、数据集的规模、模型的大小。2022 年 Deepmind 重新研究了这个事情,发现现在的一些模型其实在它的训练,比方说训一个 175B 的模型,它用的数据集规模实际上是太小了。
对于创业公司面临的机会和挑战:一个关键问题是资金有限,因此必须时刻关注自己的资金跑道,另外,造血能力同样至关重要。与大厂的竞争与合作是创业公司需要考虑的另一个重要问题。同时,作为创业公司,你需要学会从战略层面判断市场趋势,而不仅仅是在战术层面追逐潮流;另外,团队的化学反应和文化也至关重要;最后,虽然创业的过程中压力很大,但仍需保持一定的工作生活平衡。
欢迎扫描海报二维码或点击【阅读原文】报名参加。报名后添加小助手可以查看过往 5 季嘉宾分享完整内容。
加入 #奇绩创业社区#
扫描创业营二维码,提交奇绩创业营申请表,即可【免费】加入社区,【滑动】查看并免费领取创业社区独家资源:
左右滑动查看更多资源