index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html
![]()
本报告介绍了Ultra3D,一个在3D物体生成领域取得突破性进展的高效框架。该框架着重解决了现有方法在稀疏体素表示中面临的计算效率问题,通过创新的两阶段流程和局部注意力机制,显著提升了3D建模的速度,最高可达6.7倍,同时保持了高质量的几何结构生成。报告由南洋理工大学博士生陈奕文主讲,他此前在3D生成领域已有诸多贡献,并开源了广受好评的MeshAnything系列模型。
✨ Ultra3D框架通过引入紧凑的VecSet表示,在第一阶段高效生成粗略的物体结构,有效减少了计算所需的token数量,从而加速了体素坐标的预测过程,为后续精细化建模奠定了基础。
🚀 为了优化第二阶段的特征token生成,Ultra3D创新性地提出了Part Attention机制。这是一种基于部件信息的局部注意力机制,它仅在语义一致的同部件组内部进行注意力计算,避免了全局注意力带来的二次复杂度,在保证结构连续性的同时实现了显著的加速。
💡 该框架在不牺牲3D内容生成质量的前提下,显著提升了稀疏体素建模的计算效率,最高可实现6.7倍的加速,为高分辨率、精细几何结构3D内容的生成提供了更高效的解决方案。
🎓 报告人陈奕文是南洋理工大学在3D生成式人工智能领域的博士生,在CVPR、ICLR等顶级会议发表多篇论文,其开源的MeshAnything系列模型在GitHub上获得广泛关注和高度评价,显示了其在3D生成领域的深厚实力。
报告主题:探索3D物体生成的边界:兼顾效率与质量的3D生成大模型
报告日期:07月31日(周四)10:30-11:30
本报告聚焦最新在3D生成上的突破。近来,稀疏体素表示在提升3D内容生成质量方面取得了显著进展,使得具有精细几何结构的高分辨率建模成为可能。然而,现有框架由于其两阶段扩散流程中注意力机制的二次复杂度,存在严重的计算效率问题。在本工作中,我们提出了 Ultra3D,一个高效的3D生成框架,在不降低质量的前提下显著加速了稀疏体素建模。Ultra3D在第一阶段利用紧凑的 VecSet 表示高效地生成粗略的物体结构,减少了 token 数量并加速了体素坐标预测。为在第二阶段生成每个体素的特征token,我们引入了 Part Attention,这是一种基于part信息的局部注意力机制,仅在语义一致的同part group内进行注意力计算。该设计在避免不必要的全局注意力的同时保持了结构连续性,实现了最高 6.7 倍的加速。
陈奕文,南洋理工大学(Nanyang Technological University, NTU)S-Lab 博士四年级学生,研究方向为三维生成式人工智能(3D AIGC)。在CVPR、ICLR、ICCV等顶级人工智能会议发表多篇论文。他提出的3D生成模型 MeshAnything 系列在GitHub开源后广受关注,累计获得超2300星标。
更多热门报告


内容中包含的图片若涉及版权问题,请及时与我们联系删除