AMD/沐曦/字节跳动/北京大学/上海创智共赴 Meet AI Compiler，聚焦底层编译与跨硬件编译生态的真实落地实践

2025 Meet AI Compiler 第 7 期技术沙龙将于 7 月 5 日在北京市中关村举办。

HyperAI超神经将于 7 月 5 日在北京市中关村举办第 7 期 Meet AI Compiler 技术沙龙。本次活动邀请了来自 AMD、沐曦集成电路、字节跳动、北京大学的 4 位资深专家，从底层编译到上层应用，多视角探索 AI 编译器的前沿实践。此外，上海创智学院助理教授、Apache TVM PMC 冯思远将担任圆桌环节的主持人，与众位讲师一起围绕「跨硬件的统一编译生态」这一主题展开深入讨论。

活动当天我们还为大家准备了精美礼品与茶歇，报名活动并关注「HyperAI超神经」公众号，后台回复「0705」即可参与抽奖，奖品需在 7 月 5 日当天活动现场线下领取哦，快来参与吧~

活动详情

⏰ 时间：7 月 5 日（周六）13:30-17:45

📍 地点：北京市海淀区海淀西大街 48 号车库咖啡

👬 人数：200（现场座位有限，请尽早报名）

🙌🏻 报名：点击下方小程序报名

扫码备注「AI 编译器」加入活动群：

📝 议程：

嘉宾及议程

环节 1

分享嘉宾

13:40-14:20

张宁

AMD

AI 架构师

分享主题：助力开源社区，剖析 AMD Triton 编译器

内容简介：Triton是OpenAI提出的一种专为简化高性能GPUKernel开发而设计的编程语言，在主流的LLM推理训练框架中得到了广泛应用。用户可以通过开发PythonTriton代码来实现GPUKernel，无需关心底层的GPU架构细节，大大降低了GPU代码的开发难度。

AMD 在相关的 GPU 平台上实现了 Triton 编译器，并且贡献给了 Triton 开源社区。为了优化 GPU 代码性能，需要了解 Triton 编译器及其在 Kernel 性能优化中的作用。本次分享将详细探讨 AMD Triton 编译器，介绍编译器如何提升 Triton 在 AMD GPU 平台上的性能。

观看本场分享，你将了解：

1. AMD GPU 架构的介绍

2. AMD GPU 在 Triton 开源社区上的最新工作

14:20-15:00

董兆华

沐曦集成电路

高级总监

分享主题：沐曦 GPU 上的 TVM 应用实践

内容简介：这次讨论主要围绕如何在沐曦 GPU 上应用 TVM。针对沐曦 GPU，围绕 TVM 进行高性能算子生成，使能基于 TVM 的主流 AI 框架。

观看本场分享，你将了解：

1. 国产 GPGPU 上适配 TVM 可能会碰到的问题

2. TVM 在国产 GPGPU 上的收益如何，以及哪些方面需要继续突破

3. 关于 TVM 等 AI 编译器在国产 GPGPU 上的支持现状，并讨论如何拓展相关生态圈

15:15-15:55

郑思泽

字节跳动 TopSeed

Research Scientist

分享主题：Triton-distributed: 原生 Python 编程实现高性能通信

内容简介：单芯片规模化渐至瓶颈，单加速器难支撑大语言模型训练推理，分布式系统成刚需。分布式系统中计算、内存访问、通信并发，但现有框架多独立优化，难以协同释放集群性能。

本报告提出 Triton-distributed（Triton 编译器扩展），首倡分布式 AI 工作负载原生重叠优化，覆盖多框架优化。通过集成 OpenSHMEM 通信原语、借助编译器实现三项活动联合优化、展示重叠技术应用及单 / 多节点编程方法，其生成代码在集群环境中充分利用异构资源，性能超越手工优化代码，且开发成本显著低于 CUDA/C++。

观看本场分享，你将了解：

1. Triton-distributed最新技术

2. 从Python编程通信的挑战

3. 分布式编译未来方向

15:55-16:35

杨智

北京大学

计算机学院副研究员

分享主题：TileLang：算子开发不再「烧脑」，性能依然在线

内容简介：本次分享我们带来新的算子编程语言——TileLang。它通过显式的 tile 级原语与自动推理机制，赋能开发者高效实现硬件感知的神经算子，兼顾控制力与开发效率。与传统编译器（如 Triton）相比，TileLang 在主流 GPU 上可实现高达 6 倍的性能提升，显著简化开发流程，让性能优化不再是「专家专属」。

观看本场分享，你将了解：

1. 掌握一种更简单、更高效的高性能算子开发语言

2. 了解 TileLang 的核心设计理念与技术优势

环节 2

圆桌讨论

圆桌主题：跨硬件的统一编译生态

主办方及合作伙伴

HyperAI超神经（hyper.ai）作为国际领先的人工智能及高性能计算社区，旨在通过提供行业资讯报道、数据集加速下载、在线教程演示、热门模型性能评测、前沿论文推荐、高价值成果解读、顶会日历集成等一系列服务，助力全球数据科学及⼈⼯智能⾏业的开发者及爱好者学习、理解、实践，与社区⼀起构建⼈⼯智能的未来。

访问官网：https://hyper.ai/

OpenBayes贝式计算是国内领先的高性能计算服务提供商，通过为新一代异构芯片嫁接经典软件生态及机器学习模型，进而为工业企业及高校科研提供更加快速、易用的数据科学计算产品，其产品已被数十家大型工业场景或头部科研院所所采用。

访问官网：https://openbayes.com/

MLC.AI 社区成立于 2022 年 6 月，并由 Apache TVM 主要发明者、机器学习领域著名的青年学者陈天奇，带领团队上线了 MLC 线上课程，系统介绍了机器学习编译的关键元素以及核心概念。

2022 年 11 月，在 MLC.AI 社区志愿者的共同努力下，首个完整的 TVM 中文文档上线，并成功托管至 HyperAI超神经官网，进一步为对机器学习编译感兴趣的国内开发者，提供了接触并学习一门新技术的基础设置——文档。

MLC 线上课程：https://mlc.ai/

TVM 中文文档：https://tvm.hyper.ai/

车库咖啡成立于 2011 年 4 月，是中国最早关注早期互联网创业，面向早期创业者围绕“大众创业”打造低成本、便利化、全要素、开放式创新创业服务平

台。

作为北京中关村创业大街首家众创空间，车库咖啡以咖啡厅为交互载体，为创业团队提供共享、共促、共融、共生交互式办公空间与创孵配套服务。车库咖啡是全球第一家创业主题咖啡厅，是中国最具影响力的国家级众创空间和国际化创新创业平台。

活动支持

活动行：扫码跳转至活动行报名

扫码备注「AI 编译器」加入活动群

考虑到本场活动的场地空间情况，我们仅开放了 200 个到场名额，建议大家尽早报名锁定席位。

7 月 5 日 13:30-17:45，我们不见不散！

内容中包含的图片若涉及版权问题，请及时与我们联系删除

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签