Deepseek R2版本预期加速发布 R2 模型的核心规格与预期 根据之前的爆料(传闻,未证实),R2 的核心规格颇具看点:总参数量达 1.2 万亿,采用 Hybrid MoE 架构;动态激活参数为 780 亿;单 token 推理成本下降 97.3%;主打编程能力、多语言推理、多模态能力。这些规格使其在发布前就承载了较高的市场期待。 转机:H20 恢复销售与 R2 的发布契机 H20 芯片恢复在华销售,无疑为 DeepSeek R2 的推进带来了关键转机。此前受限于 H20 断供,R2 的训