IT之家 02月27日
摩尔线程成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

摩尔线程成功支持DeepSeek开源通信库DeepEP和并行算法DualPipe,并发布相关开源代码仓库。DeepEP适用于大模型训练,提升训练效率;DualPipe减少流水线气泡,优化通信效率。

💻DeepEP是用于MoE模型训练和推理的开源通信库,提升训练效率

🚀DualPipe是双向流水线并行算法,减少流水线气泡

🎯MT-DualPipe可完整接入框架,实现训练流程复现并优化通信效率

🔗MT-DualPipe与其他技术结合,实现更高效通信掩盖并降低资源损耗

IT之家 2 月 27 日消息,在 DeepSeek 开源周第四日,摩尔线程宣布已成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe,并发布相关开源代码仓库:MT-DeepEP 和 MT-DualPipe。

据介绍,DeepEP 是一个用于 MoE(混合专家)模型训练和推理的开源 EP(expert parallelism,专家并行)通信库,主要适用于大模型训练,特别是需要 EP 的集群训练。它通过优化通信信道的使用率,提升了训练效率。摩尔线程基于 MUSA Compute Capability 3.1 全功能 GPU 适配了 DeepEP,并支持以下特性:

DualPipe 是 DeepSeek-V3 提出的双向流水线并行算法,通过前向计算与后向计算阶段的计算与通信完全重叠,减少了“流水线气泡”(设备空闲等待)。摩尔线程依托深度学习框架 Torch-MUSA(已开源)和 MUSA 软件栈全方位的兼容性,实现了对 DualPipe 这一算法的支持。

目前,MT-DualPipe 可以完整接入摩尔线程 MT-Megatron 框架MT-TransformerEngine 框架(即将开源),实现 DeepSeek V3 训练流程完整复现。此外,MT-DualPipe 结合 MT-Megatron 可实现完整 DeepSeek V3 模型 MLP-FFN 分离以及 DW-DG 分离,进一步降低气泡占比,优化通信效率。同时,MT-DualPipe 与 MT-TranformerEngine 和 MT-DeepEP 的结合,可利用 MT-DeepEP 和异步通信引擎实现更高效的通信掩盖,降低对计算资源损耗。

IT之家附 Torch-MUSA 开源地址如下:

https://github.com/MooreThreads/Torch_MUSA

相关阅读:

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

摩尔线程 DeepEP DualPipe 通信效率
相关文章