摩尔线程 03月01日
DeepSeek开源|摩尔线程完成对DeepEP和DualPipe的支持
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

摩尔线程宣布其全功能GPU已成功支持DeepSeek开源通信库DeepEP和并行算法DualPipe,并开源了MT-DeepEP和MT-DualPipe代码仓库。DeepEP主要用于MoE模型训练和推理,通过优化通信信道提升训练效率。DualPipe采用双向流水线并行,减少设备空闲等待,提升资源利用率。摩尔线程依托Torch-MUSA和MUSA软件栈,高效支持DualPipe,并结合MT-Megatron和MT-TransformerEngine框架,实现DeepSeek V3训练流程的完整复现。此次适配验证了摩尔线程MUSA架构和全功能GPU在生态兼容上的优势。

🚀 摩尔线程GPU迅速适配DeepSeek开源通信库DeepEP和并行算法DualPipe,并开源相关代码仓库,展示了其快速响应能力。

💡 DeepEP通过优化通信信道的使用率,显著提升了MoE模型训练的效率,尤其适用于需要专家并行的集群训练。

🔄 DualPipe采用双向流水线并行算法,通过计算与通信的完全重叠,显著减少了“流水线气泡”,提升资源利用率和训练效率。

🛠️ MT-DualPipe结合MT-Megatron和MT-TransformerEngine框架,可以实现DeepSeek V3训练流程的完整复现,并优化通信效率。

🤝 摩尔线程MUSA架构和全功能GPU的快速适配,验证了其在生态兼容上的强大优势,并欢迎开发者下载体验。

热爱全功能GPU的 2025-02-27 23:22 北京

迅速响应 快速适配

DeepSeek开源周第四日,摩尔线程宣布已成功支持DeepSeek开源通信库DeepEP和并行算法DualPipe,并发布相关开源代码仓库:MT-DeepEP和MT-DualPipe。

▼ MT-DeepEP开源地址

https://github.com/MooreThreads/MT-DeepEP

MT-DualPipe开源地址

https://github.com/MooreThreads/MT-DualPipe

DeepEP是一个用于MoE(混合专家)模型训练和推理的开源EP(expert parallelism,专家并行)通信库,主要适用于大模型训练,特别是需要EP的集群训练。它通过优化通信信道的使用率,显著提升了训练效率。摩尔线程基于MUSA Compute Capability 3.1全功能GPU,第一时间适配了DeepEP,支持以下特性:

▼ 高效优化的 All-to-All 通信,支持 dispatch & combine

▼ 支持 MTLink + GPU(MUSA Compute Capability 3.1)节点内通信

▼ 训练及推理预填充阶段的高吞吐量计算核心

▼ 推理解码阶段的低延迟计算核心

▼ 原生支持 FP8 数据分发

▼ 灵活控制 GPU 资源,实现计算与通信的高效重叠

DualPipe是DeepSeek-V3提出的双向流水线并行算法,通过前向计算与后向计算阶段的计算与通信完全重叠,显著减少了“流水线气泡”(设备空闲等待)。与传统流水线并行相比,DualPipe 采用双向数据流设计,使数据从两端相向处理,大幅提升了资源利用率与训练效率。

摩尔线程依托深度学习框架Torch-MUSA(已开源)和MUSA软件栈全方位的兼容性,实现了对DualPipe这一算法的高效支持。MT-DualPipe可以完整接入摩尔线程 MT-Megatron框架和MT-TransformerEngine框架(即将开源),实现DeepSeek V3训练流程的完整复现。

此外,MT-DualPipe结合MT-Megatron可以实现完整DeepSeek V3模型的MLP-FFN分离以及DW-DG分离,进一步降低气泡占比,优化通信效率。同时,MT-DualPipe与MT-TranformerEngine和MT-DeepEP的结合,可以利用MT-DeepEP和异步通信引擎实现更高效的通信掩盖,大大降低对计算资源的损耗。

DeepEP和DualPipe的第一时间适配,充分验证了摩尔线程MUSA架构和全功能GPU在生态兼容与快速适配上的强大优势。我们诚挚欢迎广大开发者下载体验,并期待您的反馈与建议。

▼ Torch-MUSA开源地址

https://github.com/MooreThreads/Torch_MUSA

  关于摩尔线程

摩尔线程成立于2020年10月,以全功能GPU为核心,致力于向全球提供加速计算的基础设施和一站式解决方案,为各行各业的数智化转型提供强大的AI计算支持。

我们的目标是成为具备国际竞争力的GPU领军企业,为融合人工智能和数字孪生的数智世界打造先进的加速计算平台。我们的愿景是为美好世界加速。

更多信息,请长按二维码关注了解

推荐阅读



阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

摩尔线程 DeepSeek GPU 并行计算 开源
相关文章