InnoVibe致力于为AI领域青年科学家打造多维成长舞台——这里是思想破壁的实验室,更是新锐力量的发声场。智源大会首届共创场活动特别邀请 18 位来自国内外顶尖计算机院校的青年研究者。通过闪电演讲等形式,青年科学家们自信展示突破性成果与创意项目,分享前沿观点以及对人工智能未来的独到洞见与深刻思考。
这不仅是一次成果展示,更是一场青年智慧的火花碰撞,充分展现了新一代研究者挑战边界、定义未来的锐气与风采。他们的声音与思考,展现了这个时代青年的科研风采,成为驱动人工智能发展的鲜活引擎。

InnoVibe现场气氛热烈,人头攒动,与会者热情高涨,不仅在每场报告后踊跃提问、展开深入讨论,更在报告间隙争相与演讲的青年学者进行场下交流,探寻合作契机。
从演讲台到交流区,深度切磋与灵感碰撞无处不在,自由开放的热烈氛围让每一个疑问都能得到即时回应,每一次见解都能引发即时共鸣。大家畅所欲言,围绕共同关心的科学问题展开深入探讨。以下是核心议题摘录。
(回放链接:https://event.baai.ac.cn/live/928)

清华大学刘子君:通过学习机制激发大模型推理时扩展能力
刘子君分享了通过学习机制激发大模型推理时扩展能力报告。他归纳研究发现:在不同领域上,大模型的高效推理和扩展能力,需要通过恰当的学习机制进行激发。具体分享了大模型多智能体系统的推理时可扩展性研究;通用领域奖励大模型的推理时可扩展性研究;大模型外部知识输入的推理时可扩展性研究等多项研究成果。
华中科技大学帖桂尧:大语言模型训练后优化技术研究
帖桂尧梳理了LLM后训练(post-training)领域的发展轨迹与核心技术突破,包括参数高效微调、人类对齐、多模态等关键方向。他不仅对现有技术进行了多维度的评估分析,还针对模型安全性、训练效率、知识更新等挑战提出了未来研究的展望。
新加坡国立大学王琨:全栈大模型安全的前沿探索
王琨介绍了获 ICLR2025 杰出论文奖的 AlphaEdit 工作及全栈大模型安全相关前沿探索,致力于提升 AI 算法的安全性、可解释性泛化性及鲁棒性等多方面性能。
香港科技大学(广州)滕枫蔚:从马尔可夫推理过程中涌现的原子化推理
滕枫蔚介绍了一种新颖的马尔可夫推理框架,旨在利用马尔可夫过程的无记忆性质来最小化对历史信息的依赖。这种基础马尔可夫链结构能够与各种测试时缩放方法无缝集成。通过与树搜索和反思等行为相结合,AoT揭示了一种涌现的原子推理结构,其中推理轨迹被分解为一系列自包含、低复杂度的原子单元。“思想原子”在性能上持续优于现有基线,特别是在计算资源扩大时。此外,该框架还能无缝集成各种模型和测试时扩展方法,彰显了其广泛的适用性以及显著提升推理效率和性能的潜力。




浙江大学乔硕斐:知识增强的智能体技术
乔硕斐分享了知识增强的智能体技术,此技术可以利用外部知识去引导、监控智能体的行为,缓解“规划幻觉”、盲目试错等现象。他强调知识增强的智能体技术可解决大模型智能体落地难、可靠性差等问题,提升大模型智能体的效率和可靠性。
香港大学博士生褚天哲:SFT 与 RL 对模型泛化性的影响
褚天哲分享了主题为「SFT Memorizes, RL Generalizes A Comparative Study of Foundation Model Post-training」的报告,监督微调(SFT)和强化学习常被用于强化学习的后训练。此前,这两种训练手段对模型泛化性的影响并不明晰。他的工作通过对比实验,在数学推理(24点)和空间推理(视觉导航)任务上揭示了SFT和RL对模型记忆与泛化的影响。
香港科技大学高深远:AdaWorld模型的提出
高深远指出现有的生成式世界模型通常需要大量的交互数据进行高昂的微调,以实现对新环境的可控性。为提升世界模型在通用决策场景中的适应性,他提出了AdaWorld模型。该模型引入了与上下文无关的隐动作作为预训练条件,能够仅依靠极少的交互样本和微调步数适应任意新环境。在游戏和具身场景中的实验证明,AdaWorld不仅能够高效提升预测质量,还能在少样本和少训练量的情况下有效做出决策。
上海交通大学王少博:NCFM数据蒸馏框架的提出
王少博提出了一种全新数据蒸馏框架——Neural Characteristic Function Matching(NCFM) ,将此数据蒸馏框架建模为一个min-max优化问题 ,并提出一种全新的基于统计学中的特征函数(Characteristic Function, CF)的分布差异度量——Neural Characteristic Function Discrepancy(NCFD) 。该方法能够在复平面上同步对齐真实数据与合成数据的神经特征相位与幅度,有效平衡生成样本的真实性与多样性。实验结果表明,NCFM在多个低分辨率与高分辨率数据集上均优于当前最先进的方法,在ImageNet子集上实现了20.5%的准确率提升 ,同时GPU内存消耗降低了300倍以上 ,该工作获得CVPR2025满分论文。




苏州大学王越与上海交通大学陈星宇:长推理模型中的推理效率问题
二人共同探讨长推理模型中的推理效率问题,他们分享了长推理模型的“过度思考”和“思考不足问题”:长推理模型在面对简单问题时,其思考行为会出现大量重复,从而浪费计算资源;在难题上则频繁地进行思路跳转,无法将注意力集中在一个正确的思路上并深入思考,该发现将为提升长推理模型提供优化方向。
南洋理工大学助理教授王子为:机器人交互问题与VLA模型
王子为分享了机器人需要与不同位置对象的交互问题。由于目前VLA模型主要是为固定基操作设计的,因此在移动操作中部署VLA模型仍然有限。为增强VLA模型用于移动操作的能力,他分享了如何有效地自适应VLA模型:设计全身运动规划框架,以从VLA中实现理想的操作轨迹。他所提出的机器人操纵系统极大地拓宽了VLA模型的应用场景,其中机器人需要完成具有移动性的任务。
俄亥俄州州立大学自然语言处理组博士生谷雨:AI 代理在开放世界任务中的扩展
谷雨的分享主题是「Extrapolating AI Agents to Open-World Tasks with Natural Language」,他分享了如何将 AI 代理扩展到开放世界任务中,并结合自然语言进行相关探索,为 AI 代理在复杂环境中的应用提供新思路。




中山大学顾嘉炜:EMMA 针对跨模态推理的新型基准
顾嘉炜提出了EMMA(Enhanced MultiModal reAsoning),一个专门针对跨模态推理的新型基准。EMMA全面覆盖数学、物理、化学和编程四大领域,包含2,788个多模态问题,其中1,796个为全新人工设计,旨在严格评估模型是否能够跨越语言与视觉的鸿沟,解决仅靠单一模态无法有效处理的复杂任务。例如,EMMA中的经典物理问题要求模型不仅掌握电荷的性质,还要准确地从图像中推导电场力的方向。这种深度跨模态协作的任务设计,超越了以往多模态任务的范畴。
清华大学李文韬:机器学习势在催化计算中的应用
李文韬介绍了机器学习势(Machine learning interatomic potentials,MLIPs),它作为新兴的计算工具正逐渐革新材料计算的传统模式,通过对大量材料数据的学习和分析,构建起精准的原子间相互作用势函数。这不仅大幅提升了计算效率,还能更准确地预测材料的结构、性质和行为,为新型材料的设计与研发提供了强大助力。在此分享中,他介绍了当前MLIPs发展的图景,并从催化领域应用的角度,分享机器学习势如何加速催化计算与推动催化剂的发现。
北京中关村学院高京:AI4Chem中的逆合成方案规划与智能化实验
高京分享的主题是「干湿耦合剂:AI4Chem中的逆合成方案规划与智能化实验」。他的分享围绕三个主题展开:化学材料的实验方案规划、实验平台UniLabOS的标准化能力,以及实验助手机器人ChemBot的辅助执行潜力,探索如何更好地连接模型与实验,助力“会想的模型”成为“会做的科学家”。



北京大学助理教授洪申达:AI-ECG 算法的临床落地
洪申达聚焦于AI-ECG算法从研究到临床落地应用的转化过程。他介绍了世界最大规模心电数据集HEEDB的构建,提出了新型心电智能模型架构Net1D,训练了心电基座模型ECGFounder,并研发了“问心无恙智能心电仪”。他希望借助人工智能技术,让古老的心电得以焕发出新的活力,为“AI for Science”提供了独特的视角。
哈尔滨工业大学吕奇:面向视觉语言动作模型的生成式动作学习
吕奇分享了他在具身智能、机械臂操作、视觉语言动作方向的思考,以及大模型面向视觉语言动作模型的生成式动作学习,提出和分享两个核心问题:How to learn a good representation for action? What is the next training paradigm for vision language action model? 引发了学者们的共鸣。
清华大学自动化系许修为:面向具身智能的在线三维场景感知
许修为的研究方向为三维场景感知和具身移动操作。此次演讲他分享了面向具身智能的在线三维场景感知技术。



InnoVibe共创场为青年科学家打破传统学术交流的界限,打造一个自由开放、灵感奔涌的创新场域,让来自多元背景与前沿领域的青年英才在此激荡思想、碰撞火花,携手探索人工智能的无限可能,为 AI 领域的未来生长注入生生不息的动能。



详细内容请访问2025智源大会官网
内容中包含的图片若涉及版权问题,请及时与我们联系删除