IT之家 03月25日
DeepSeek V3“小版本升级”实测堪比 V3.5,非推理模型也有“啊哈时刻”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek V3-0324作为DeepSeek V3的升级版,虽然官方定义为小版本更新,但其实测表现令人惊喜。该模型在多项基准测试中表现出色,尤其在编程和解决复杂问题方面展现出强大的能力。即便并非推理模型,DeepSeek V3-0324也能在解决难题时展现出类似“啊哈时刻”的顿悟,并能自主修正错误。新版本依旧保持免费开源,权重文件已在HuggingFace上线,方便开发者使用。DeepSeek V3-0324的发布引发了广泛关注,人们对其未来发展充满期待。

🚀 DeepSeek V3-0324在各项测试中表现优异,尤其在处理复杂问题和编程方面有显著提升,甚至能应对四维空间超立方体弹跳测试。

💡 虽然DeepSeek V3-0324并非推理模型,但在解决难题时表现出类似“啊哈时刻”的顿悟,能够自主修正错误,并尝试不同的解题方法。

💻 在编程能力方面,只需一句提示词即可开发出带自适应布局和动效的完整产品着陆页,与Claude 3.7 Sonnet 处于同一水平。

🚪 DeepSeek V3-0324在解决“7米甘蔗通过2米门”这类难题时,展现出对问题本质的理解能力,虽然计算过程仍有不足,但已能找到解决方案。

🎁 DeepSeek V3-0324依旧免费开源,权重文件已在HuggingFace上线,方便开发者使用,模型大小与初代V3保持一致,为671B参数的MoE模型。

DeepSeek V3 升级了,新版本 V3-0324

官方轻描淡写只说是“小版本升级”,但很多人实测下来可一点也不小。

把流行的小球弹跳测试,提升难度到 4 维空间超立方体也没问题

天哪,如果这只是一个小更新,那我想象不出大更新会是什么样子。

编程这块,只需一句提示词开发一个完整产品着陆页,带自适应布局带动效,被评价为与 Claude 3.7 Sonnet 同一水平。

由于发布时间太短,还没有正式测评结果,不过在开发者 Xeophon 的个人 Benchmark 上所有指标都有大提升,成为该测试下最好的非推理模型

不是推理模型也有“啊哈时刻”

DeepSeek-V3-0324 并非推理模型,在回答之前不会给出思考过程,但依然遵循一定的思维方式分解问题。

走入死胡同的话,还表现出自主回到上一步重新思考的能力。

在“9.11 和 9.9 那个大”、“Straberry 有多少个 r”已经不成问题的今天,最新折磨 AI 的难题是“让 7 米长的甘蔗通过 2 米高 1 米宽的门”。

在量子位的测试中,DeepSeek-V3-0324 先是像它的前辈以及许多其他 AI 一样碰壁。

碰壁之后开始重新思考题目本身的含义,后面依旧陷入误区,但突然在中文解题过程中夹杂一句英语思考,类似 DeepSeek-R1 技术报告中的“啊哈时刻”

等等,这似乎与之前的对角线方法相似,也许我遗漏了什么。

顿悟之后,突然就走上了正确的道路,注意到了题目中没直接提到的隐藏条件。

虽然从计算过程看,还是没理解到问题的本质,但好歹得出了解决方案,还认识到了自己的误区。

依旧免费,依旧开源

像这样的优秀模型依旧免费,依旧开源,权重文件已火速上线 HuggingFace,使用最宽松的 MIT 协议。

所有权重文件加起来占硬盘空间约 688GB,与初代 v3 保持一致,说明依然是 671B 参数的 MoE 模型,目前没有更多技术细节,还需等待官方进一步发布公告。

目前在官网和官方 App(关闭深度思考即可)、HuggingFace 等渠道都能体验到 v3-0324。

也可以到大模型竞技场去与其他模型 pk,不过投票结果还要等一段时间才能出来。

当然最让大家期待的还是,v3 更新了,r2 还会远吗?

官网试玩:

https://chat.deepseek.com/

HuggingFace:

https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/blob/main/README.md

参考链接:

本文来自微信公众号:量子位(ID:QbitAI),作者:梦晨,原标题《DeepSeek V3“小版本升级”实测堪比 V3.5,非推理模型也有“啊哈时刻”,7 米甘蔗过 2 米门想通了》

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek V3-0324 大模型 开源
相关文章