金色传说大聪明 2025-02-08 10:29 北京

请先【左右← → 滑屏，切换图片】

之前纳米上了 DeepSeek，我没报道。

因为我有 API，不需要。

但...这两天炸翻了

【就在刚刚】

纳米AI搜索，整了个大的

有了满血 R1，也就是 671B 版本

用的是「华为910B」进行推理加速

【效果拔群】

反正你看上面的图

有不同版本 DeepSeek 的对比效果

用了半个晚上：

【很稳】

【非常稳定】

【非常建议大家用】

【应用商店自己搜「纳米AI搜索」】

测下来的话：

首响应大概是 3 秒

生成大概是 15～20 t/s

应是现在最快最稳的

强调这是 671B 满血版

是因为...

这段时间大家用的

多是缩水版

[皱眉][皱眉][皱眉]

补充说一下：

R1 除了满血版（671B）外，还有 6 个蒸馏版

具体的，可看我之前的技术解读：

《DeepSeek-R1 是怎么训练的｜深度拆解》

其中 4 个蒸馏自 Qwen：

DeepSeek-R1-Distill-Qwen-1.5B

DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-14B

DeepSeek-R1-Distill-Qwen-32B

还有 2 个蒸馏自 Llama：

DeepSeek-R1-Distill-Llama-8B

DeepSeek-R1-Distill-Llama-70B

这些版本

大小能差个几百倍

成本/效果都是天差地别

所以嘛，都是生意

[旺柴][旺柴][旺柴]

对商家来说：

能提供小的，干嘛提供大的？

[旺柴][旺柴][旺柴]

所以，对于 R1 服务

现在只要不标注「满血」/「671 B」

默认就是是「缩水版」

[旺柴][旺柴][旺柴]

另：

据最新线报

纳米的 Windows 版，

就在刚刚刚刚

也加入了「671B 满血版」

请先【左右← → 滑屏，切换图片】

之前纳米上了 DeepSeek，我没报道。

因为我有 API，不需要。

但...这两天炸翻了

【就在刚刚】

纳米AI搜索，整了个大的

有了满血 R1，也就是 671B 版本

用的是「华为910B」进行推理加速

【效果拔群】

反正你看上面的图

有不同版本 DeepSeek 的对比效果

用了半个晚上：

【很稳】

【非常稳定】

【非常建议大家用】

【应用商店自己搜「纳米AI搜索」】

测下来的话：

首响应大概是 3 秒

生成大概是 15～20 t/s

应是现在最快最稳的

强调这是 671B 满血版

是因为...

这段时间大家用的

多是缩水版

[皱眉][皱眉][皱眉]

补充说一下：

R1 除了满血版（671B）外，还有 6 个蒸馏版

具体的，可看我之前的技术解读：

《\x3ca href=\x22https://mp.weixin.qq.com/s?__biz=MzkzNDQxOTU2MQ==\x26amp;mid=2247496255\x26amp;idx=2\x26amp;sn=8d5b4fbae07f6957ace0af3e0e88822c\x26amp;scene=142#wechat_redirect\x22 target=\x22_blank\x22 data-itemshowtype=\x220\x22\x3eDeepSeek-R1 是怎么训练的｜深度拆解\x3c/a\x3e》

其中 4 个蒸馏自 Qwen：

DeepSeek-R1-Distill-Qwen-1.5B

DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-14B

DeepSeek-R1-Distill-Qwen-32B

还有 2 个蒸馏自 Llama：

DeepSeek-R1-Distill-Llama-8B

DeepSeek-R1-Distill-Llama-70B

这些版本

大小能差个几百倍

成本/效果都是天差地别

所以嘛，都是生意