华丰科技，正宗的昇腾 384 超节点！核心高速总线互联技术！

韭研公社 7小时前

华丰科技，正宗的昇腾 384 超节点！核心高速总线互联技术！

文章探讨了当前大模型发展中的参数与效率演进，MoE模型结构的挑战，以及计算架构创新升级的必要性。

当前，大模型发展呈现参数与效率交替演进的态势：一方面，Scaling Law 不断推动模型能力突破极限；另一方面，以 DeepSeek 为代表的创新架构与工程技术，正加速模型能力在千行万业的落地应用。在此背景下，MoE 成为主流模型结构，其复杂的混合并行策略带来巨大挑战，TP、SP、EP 单次通信量高达 GB 级且难以掩盖。随着并行规模持续扩大，传统服务器跨机带宽已成为训练的核心阻碍，亟需计算架构的创新升级以适配未来模型发展。传统服务器依赖以太网络实现跨机互联，通信带宽较低。实践表明，当 TP

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

大模型 MoE模型计算架构

相关文章

回顾我的 prompt 能力从小白到熟练的一些重要节点：防杠叠甲： 1. 仅代表我自己的认知，没啥权威性。 2. 认为提示词那么简单至于搞那么复杂么的朋友，你对 3. ...

SAP大中华区总裁黄陈宏：SAP不做大模型

李开复：现在对中国大模型创业公司盖棺定论为时尚早，ofo式的补贴逻辑不再适用于AI 2.0

寒武纪：新一代智能处理器微架构和指令集正在研发中

阿里管理层：绝大部分大模型公司追求的方向一致，长期发展方向是图文视频音频融合大模型

大模型一体机是在“卖盒子”吗？

百度文心大模型日处理Tokens文本已达2490亿

万联证券：国产人形机器人行业发展进程不断加速

百度、阿里、腾讯Q1财报解读：保住基本面才能谈AI

腾讯吴运声谈大模型“价格战”：更关注能力提升