2025-05-07 21:25 广东
今天在各群里看到了:
「DeepSeek工程师在GitHub上高亮了来自腾讯的代码贡献,并用“huge speedup”介绍了这次性能提升」
追到了对应的 PR(提交代码),在这(两周前):
https://github.com/deepseek-ai/DeepEP/pull/130
找到了新闻源头(今天):
---
中译中:
前段时间,DS 开源了通信框架 DeepEP
框架很棒,尤其是在高端网络下。
但很多数据中心,网不好,表现差。
腾讯
- 优化网络资源使用
- 降低通信控制成本
- 保证数据处理顺序
结果
- DeepEP 在 RoCE 网络上的通信性能提升约 2 倍
- 在高端 InfiniBand 网络上,已有性能基础上再提升约 30%
- 技术成果已应用于腾讯内部大模型训练
开源
- 优化已开源,并入了 DeepEP 项目
- DeepSeek 团队表示感谢
One More Thing
开源不是智商税
今天在各群里看到了:
「DeepSeek工程师在GitHub上高亮了来自腾讯的代码贡献,并用“huge speedup”介绍了这次性能提升」
追到了对应的 PR(提交代码),在这(两周前):
https://github.com/deepseek-ai/DeepEP/pull/130
找到了新闻源头(今天):
\x3ca href=\x22https://mp.weixin.qq.com/s?__biz=MzA5NzU3MDczNA==\x26amp;mid=2247489049\x26amp;idx=1\x26amp;sn=fee05fb189ebdc8a8d78e589e30bb2fb\x26amp;scene=21#wechat_redirect\x22 target=\x22_blank\x22 data-itemshowtype=\x220\x22\x3eDeepSeek致谢腾讯大模型网络提速技术方案贡献\x3c/a\x3e
---
中译中:
前段时间,DS\x26nbsp;开源了通信框架 DeepEP
\x3ca href=\x22https://mp.weixin.qq.com/s?__biz=MzkzNDQxOTU2MQ==\x26amp;mid=2247497713\x26amp;idx=1\x26amp;sn=04670342f2d0dc737b7ee4721e0c92b7\x26amp;scene=21#wechat_redirect\x22 target=\x22_blank\x22 data-itemshowtype=\x220\x22\x3e一文详解:DeepSeek 第二天开源的 DeepEP\x3c/a\x3e
框架很棒,尤其是在高端网络下。
但很多数据中心,网不好,表现差。
腾讯
- 优化网络资源使用
- 降低通信控制成本
- 保证数据处理顺序
结果
- DeepEP\x26nbsp;在\x26nbsp;RoCE\x26nbsp;网络上的通信性能提升约\x26nbsp;2\x26nbsp;倍
- 在高端\x26nbsp;InfiniBand\x26nbsp;网络上,已有性能基础上再提升约\x26nbsp;30%
- 技术成果已应用于腾讯内部大模型训练
开源
- 优化已开源,并入了 DeepEP 项目
- DeepSeek 团队表示感谢
One More\x26nbsp;Thing
开源不是智商税