IT之家 02月25日
Anthropic 推出新一代混合推理模型 Claude 3.7 Sonnet:该公司“最智能”AI 模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

人工智能公司Anthropic推出了其首款“混合推理模型”Claude 3.7 Sonnet,该模型在解决复杂问题和数学、编码等领域表现出色,超越了以往模型。它具备“推理模式”和传统模式,是市面上唯一的“混合”模型。同时,Anthropic还发布了“自主性”编程工具Claude Code的“有限研究预览版”,该工具能搜索、阅读、编辑代码,并提交到GitHub。Claude 3.7 Sonnet已在Claude应用程序中上线,开发者可通过API获取。该模型在自主性编程、金融和法律任务上表现优异,知识截止日期为2024年10月。Anthropic还允许开发者通过“草稿纸”功能指导模型的“思考”方式,并精确控制响应时间。

💡Anthropic发布首款“混合推理模型”Claude 3.7 Sonnet,该模型融合了“推理模式”和传统模式,能够更有效地解决复杂问题,并在数学和编码等领域展现出卓越性能。

💻Anthropic还推出了“自主性”编程工具Claude Code,定位为“积极的合作伙伴”,具备搜索、阅读、编辑代码,编写和运行测试,以及提交代码到GitHub等功能,旨在提升开发效率。

💰Claude 3.7 Sonnet的运行成本与前代产品3.5 Sonnet相同,输入每百万token收费3美元,输出每百万token收费15美元。此外,Anthropic允许开发者通过“草稿纸”功能指导模型的“思考”方式,甚至可以精确控制模型的响应时间。

🎮Anthropic内部测试显示,Claude 3.7 Sonnet在前端网站设计、交互式游戏开发等任务中表现出色,甚至能通过反复构建和编辑测试用例,支持长达45分钟的编码工作。在经典《宝可梦》游戏中,3.7版本成功击败了多个道馆馆主。

IT之家 2 月 25 日消息,今日人工智能公司 Anthropic 宣布推出其首款“混合推理模型”——Claude 3.7 Sonnet。该模型可以解决更复杂的问题,并在数学和编码等领域中性能超过了以前的模型。

Anthropic 公司表示,这是其有史以来“最智能”的 AI 模型,称这种“混合型”模型同时具备“推理模式”(停下来思考复杂答案)与传统模式(实时生成答案)的能力,并表示该模型是市面上唯一的此类“混合”模型。

IT之家注意到,除了新模型外,Anthropic 还发布了其“自主性”编程工具 Claude Code 的“有限研究预览版”。尽管 Anthropic 已经为如 Cursor 等人工智能编程工具提供支持,但此次推出的 Claude Code 被定位为一个“积极的合作伙伴”,它能够搜索和阅读代码、编辑文件、编写和运行测试、将代码提交到 GitHub,并使用命令行工具。

从本周一开始,用户可以在 Claude 应用程序中使用 Claude 3.7 Sonnet,开发者也可以通过 Anthropic 的 API、亚马逊 Bedrock 和谷歌云的 Vertix AI 获取该模型。其运行成本与前代产品 3.5 Sonnet 相同,输入每百万 token 收费 3 美元,输出每百万 token 收费 15 美元。

目前,OpenAI 等公司提供独立的推理模型,但 Anthropic 产品研究主管 Dianne Penn 表示,公司希望简化使用模型的体验。她指出:“我们从根本上认为,推理是人工智能的一个特征,而不是一个完全独立的事物。”她还提到,Claude 在回答简单问题如“现在几点了?”和应对更复杂的提示,例如“规划一个为期两周的意大利之旅,并考虑 3 月下旬的天气”时,回应速度差异不大。

Dianne Penn 称,Claude 3.7 Sonnet 在“自主性编程”、金融和法律任务上的表现明显优于前代产品。尽管该模型仍不具备实时网络搜索功能,但其知识截止日期为 2024 年 10 月,比其他模型更新。此外,Anthropic 还允许开发者通过其“草稿纸”功能指导模型的“思考”方式,甚至可以精确控制模型的响应时间。Anthropic 产品副总裁 Michael Gerstenhaber 表示:“有时开发者只需要明确指出,回答这个问题不应超过 200 毫秒。”他认为这是产品决策的一部分。

在 Anthropic 内部,员工已利用 Claude 3.7 Sonnet 完成前端网站设计、交互式游戏开发等任务。Penn 透露,该模型甚至能通过反复构建和编辑测试用例,支持长达 45 分钟的编码工作。她还提到,公司通过将模型的 API 映射到游戏控制器方案,测试模型在一款经典《宝可梦》电子游戏中的表现。结果显示,前代 Claude 3.5 Sonnet 无法走出游戏初期的帕雷特镇,而 3.7 版本成功击败了多个道馆馆主。

目前,Anthropic 凭借 Claude 3.7 Sonnet 的性能提升再次处于领先地位。该模型的发布也表明,行业正朝着一个模型能够完成所有任务的未来迈进,而非提供独立的推理模型。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Anthropic Claude 3.7 Sonnet 人工智能 混合推理模型 Claude Code
相关文章