量子位 03月01日
Claude 3.7登顶编程竞技场,大幅领先100分!最新布料模拟实测再惊艳网友
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Anthropic最新模型Claude 3.7 Sonnet在WebDev竞技场榜单上以巨大优势登顶,超越自家模型Claude 3.5 Sonnet以及开源模型DeepSeek R1。Claude 3.7在AI编程和网页应用开发方面表现出色,其强大能力在网络上引发热议。用户通过实测发现,Claude 3.7不仅能快速编写复杂的布料模拟效果,还能将27年前的Visual Basic 4程序转换为可运行的Python代码,甚至能改变工程师理解软件的方式,通过GitHub集成功能可视化代码库的工作流程。这些应用展示了Claude 3.7在实际应用中的巨大潜力,引发了人们对AI未来发展的无限遐想。

🥇Claude 3.7 Sonnet在WebDev竞技场榜单上大幅领先,彰显其卓越的AI编程和网页应用开发能力,超越了包括自家模型Claude 3.5 Sonnet在内的众多竞争者。

💻Claude 3.7能将27年前的Visual Basic 4程序在5分钟内转换为可运行的Python代码,展示了其强大的代码转换和问题解决能力,让老程序员惊叹不已。

✨Claude 3.7通过新的GitHub集成功能,允许用户提问关于代码的任何问题,并可视化代码库的工作流程,改变了工程师理解软件的方式,提升了开发效率。

🕹️Claude 3.7能够基于简单的故事创建互动小游戏,甚至制作能够穿越回过去的“时光机”道具,展现了其在创意应用方面的潜力。

关注前沿科技 2025-02-27 17:37 北京

官方透露Claude3.7没那么大,训练花了几千万美元

西风 发自 凹非寺
量子位 | 公众号 QbitAI

公认的编程开发能力第一!Claude 3.7 Sonnet刚刚登顶WebDev竞技场榜首

大幅甩第二名100多分,在榜单前十的其它相邻模型分差仅为几分、几十分的情况下。

那第二名是谁呢?还是Claude自己——Claude 3.5 Sonnet。

WebDev榜单与我们所熟知Chatbot Arena榜单“同宗同源”,也是由LMArena(LMSYS Org)打造,不过更专注于AI编程、网页应用开发能力。

值得一提的是,DeepSeek R1作为榜单前十唯一的开源模型排名第三,超越early-grok-3、o3-mini-high、Claude 3.5 Haiku等。

对于Claude 3.7 Sonnet高分登顶,有网友表示并不惊讶。

毕竟,这两天网友们疯狂实测Claude 3.7,一次又一次被惊艳到,最新实测更是再次刷新网友对Claude 3.7的认知。

Claude 3.7最新实测

比如前两天下面这个Claude 3.7 Sonnet用p5js编写布料模拟效果在网上疯传:

有位学者看到后,还晒出了自己1986年在MIT的硕士论文,主题正是“布料外观建模”。他提到,过去完成这项工作需要数天时间,而现在AI只需几分钟就能超越他,不禁感叹:

虽然他们现在还付我薪水,但这样的日子还能持续多久呢?

现在,更扎心了老铁。

网友又做出了另一版,还是带有明暗关系的那种:

网友表示“这种效果即使是在高级图形学课中,也很少有教怎么做的”。

除此之外,Reddit上一位老哥的最新分享也引发网友热议。

他表示突然想起一个自己在1997年用Visual Basic 4编写的古老应用程序,于是将这个27年前的EXE文件上传到了Claude 3.7并请求转换为Python代码,结果Claude不仅分析了文件组件,还在5分钟内用Pygame写出完美转换且可运行的Python代码。

这位老哥还晒出了自己与Claude 3.7的聊天记录:

网友get新玩法后纷纷开始效仿。

另外,有网友体验了Claude 3.7的新GitHub集成功能后表示“它改变了工程师理解软件的方式”:

可以Frok一个代码库选择一个特定的文件夹,然后向它提问关于代码的任何问题,Claude还会显示每个文件夹在上下文窗口中所占的百分比,帮助你更好地理解代码结构和内容。

比如,Claude 3.7可视化了yt-dlp(一个YouTube下载器)的工作流程:


沃顿商学院教授Ethan Mollick也放出了最新实测。

例如,基于“Bartleby the Scrivner”故事创建的小游戏:

还可以用Claude 3.7制作一个互动式的“时光机道具,能够穿越回过去”:

Ethan Mollick特意写了一篇Blog介绍Claude 3.7。

有意思的是,这篇Blog被Anthropic官方注意到了,官方表示Claude 3.7没有那么大(花几千万美元训练的那种)。但之后的模型规模会增长。

参考链接:
[1]https://x.com/lmarena_ai/status/1894840263379689490
[2]https://x.com/deedydas/status/1894871849269633162
[3]https://x.com/deedydas/status/1894841573311197239
[4]https://x.com/deedydas/status/1894576702749381082
[5]https://x.com/emollick/status/1894258450852401243

评选报名2025年值得关注的AIGC企业&产品

下一个AI“国产之光”将会是谁?

本次评选结果将于4月中国AIGC产业峰会上公布,欢迎参与!


一键关注 ? 点亮星标

科技前沿进展每日见



一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Claude 3.7 AI编程 WebDev 代码转换
相关文章