金色传说大聪明 2025-02-08 10:29 北京
请先【左右← → 滑屏,切换图片】
之前纳米上了 DeepSeek,我没报道。
因为我有 API,不需要。
但...这两天炸翻了
【就在刚刚】
纳米AI搜索,整了个大的
有了满血 R1,也就是 671B 版本
用的是「华为910B」进行推理加速
【效果拔群】
反正你看上面的图
有不同版本 DeepSeek 的对比效果
用了半个晚上:
【很稳】
【非常稳定】
【非常建议大家用】
【应用商店自己搜「纳米AI搜索」】
测下来的话:
首响应大概是 3 秒
生成大概是 15~20 t/s
应是现在最快最稳的
强调这是 671B 满血版
是因为...
这段时间大家用的
多是缩水版
[皱眉][皱眉][皱眉]
补充说一下:
R1 除了满血版(671B)外,还有 6 个蒸馏版
具体的,可看我之前的技术解读:
其中 4 个蒸馏自 Qwen:
DeepSeek-R1-Distill-Qwen-1.5B
DeepSeek-R1-Distill-Qwen-7B
DeepSeek-R1-Distill-Qwen-14B
DeepSeek-R1-Distill-Qwen-32B
还有 2 个蒸馏自 Llama:
DeepSeek-R1-Distill-Llama-8B
DeepSeek-R1-Distill-Llama-70B
这些版本
大小能差个几百倍
成本/效果都是天差地别
所以嘛,都是生意
[旺柴][旺柴][旺柴]
对商家来说:
能提供小的,干嘛提供大的?
[旺柴][旺柴][旺柴]
所以,对于 R1 服务
现在只要不标注「满血」/「671 B」
默认就是是「缩水版」
[旺柴][旺柴][旺柴]
另:
据最新线报
纳米的 Windows 版,
就在刚刚刚刚
也加入了「671B 满血版」
请先【左右← → 滑屏,切换图片】
之前纳米上了 DeepSeek,我没报道。
因为我有 API,不需要。
但...这两天炸翻了
【就在刚刚】
纳米AI搜索,整了个大的
有了满血 R1,也就是 671B 版本
用的是「华为910B」进行推理加速
【效果拔群】
反正你看上面的图
有不同版本 DeepSeek 的对比效果
用了半个晚上:
【很稳】
【非常稳定】
【非常建议大家用】
【应用商店自己搜「纳米AI搜索」】
测下来的话:
首响应大概是 3 秒
生成大概是 15~20 t/s
应是现在最快最稳的
强调这是 671B 满血版
是因为...
这段时间大家用的
多是缩水版
[皱眉][皱眉][皱眉]
补充说一下:
R1 除了满血版(671B)外,还有 6 个蒸馏版
具体的,可看我之前的技术解读:
《\x3ca href=\x22https://mp.weixin.qq.com/s?__biz=MzkzNDQxOTU2MQ==\x26amp;mid=2247496255\x26amp;idx=2\x26amp;sn=8d5b4fbae07f6957ace0af3e0e88822c\x26amp;scene=142#wechat_redirect\x22 target=\x22_blank\x22 data-itemshowtype=\x220\x22\x3eDeepSeek-R1 是怎么训练的|深度拆解\x3c/a\x3e》
其中 4 个蒸馏自 Qwen:
DeepSeek-R1-Distill-Qwen-1.5B
DeepSeek-R1-Distill-Qwen-7B
DeepSeek-R1-Distill-Qwen-14B
DeepSeek-R1-Distill-Qwen-32B
还有 2 个蒸馏自 Llama:
DeepSeek-R1-Distill-Llama-8B
DeepSeek-R1-Distill-Llama-70B
这些版本
大小能差个几百倍
成本/效果都是天差地别
所以嘛,都是生意
[旺柴][旺柴][旺柴]
对商家来说:
能提供小的,干嘛提供大的?
[旺柴][旺柴][旺柴]
所以,对于 R1 服务
现在只要不标注「满血」/「671 B」
默认就是是「缩水版」
[旺柴][旺柴][旺柴]
另:
据最新线报
纳米的 Windows 版,
就在刚刚刚刚
也加入了「671B 满血版」