夕小瑶科技说 2024年10月23日
Claude 3.5 Sonnet升级!Haiku也来了!开发者可以率先使用「AI操控电脑」新功能
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Anthropic 发布了升级版 Claude 3.5 Sonnet 和全新版 Claude 3.5 Haiku,其中 Sonnet 在编码方面碾压其他模型,Haiku 则对标 GPT-4o mini。最令人瞩目的是,Claude 3.5 Sonnet 新增了操控电脑功能,允许用户通过指令让 Claude 控制电脑屏幕、鼠标、点击、交互和文本输入等。该功能通过 API 实现,分为四个步骤:提供工具和提示、选择工具、提取工具输入信息运行工具并返回结果、分析工具运行结果。Claude 3.5 Sonnet 现在已经可以使用,而 Haiku 则将于今年晚些时候发布。

🤖 **Claude 3.5 Sonnet 性能提升,编码能力超群**:升级版的 Claude 3.5 Sonnet 在编码能力方面超越了之前的版本和 GPT-4o,已经可以使用。

✨ **Claude 3.5 Haiku 对标 GPT-4o mini,即将发布**:全新版本的 Claude 3.5 Haiku 旨在与 GPT-4o mini 和 Claude 3 Opus 竞争,整体性能优于 GPT-4o mini,预计在今年晚些时候发布。

💻 **操控电脑功能重磅发布,引领 AI 发展方向**:Claude 3.5 Sonnet 新增的操控电脑功能,允许用户通过指令让 Claude 控制电脑,包括屏幕视觉、鼠标移动、点击、交互和文本输入等。该功能通过 API 实现,目前处于测试阶段。

💰 **价格优势明显,开发者青睐**:与 OpenAI 相比,Anthropic 的收入主要来自 API,开发者更倾向于使用 Anthropic 的产品。Claude 3.5 Sonnet 和 Haiku 的价格也相对亲民,尤其是使用提示缓存功能后,价格更具吸引力。

⚠️ **安全问题需谨慎,使用需注意**:由于操控电脑功能存在安全风险,Anthropic 建议开发者使用具有最小权限的专用虚拟机或容器,避免让模型访问敏感数据,并限制 Internet 访问。

原创 海野 2024-10-23 02:05 北京

夕小瑶科技说 原创
作者 | 海野
深夜轰炸,Anthropic发布了升级版Claude 3.5 Sonnet和全新版Claude 3.5 Haiku!

新的Claude 3.5 Sonnet超过了曾经的自己和GPT-4o,尤其是在编码方面完全碾压其他模型,现在已经可以使用了;Claude 3.5 Haiku这边对标的是GPT-4o mini和Claude 3 Opus,整体上也要强于4o mini,这个模型还是coming soon,今年晚些时候出。

新增功能:3.5 Sonnet可以操控电脑了!

模型效果到此为止,这次还发布了一个最最最突破性的功能——自动操控计算机(computer use)!

意思就是,你现在可以指挥Claude操控电脑了!屏幕视觉、鼠标移动、点击、交互和文本输入等等都不在话下。

教会AI学会操控电脑,细思极恐。。。

这个功能是怎么实现的呢?

根据Anthropic官方文档,大致分为四个步骤:

    首先,提供Claude操控电脑的工具和prompt。

将Anthropic定义的电脑操控工具添加到API请求中,包括使用工具的prompt,例如“将猫的图片保存到我的桌面”。

    由Claude选择执行操作的工具。

Claude会辨别已有的工具,并评估是否有工具可以用于执行操作。如果有,Claude就会提交一个工具使用请求。

在API中,会显示stop_reason:tool_use,表示这个意思。

    提取工具输入信息,运行工具并返回结果

从Claude的请求中,可以提取出工具的名称和输入内容。然后我们就运行对应的工具(根据Anthropic所说,因为一系列问题,最好在在容器或虚拟机上使用)。如果想根据操纵的结果继续与Claude对话,就要使用包含tool_result内容的新对话来继续对话。

    Claude继续调用工具,直到完成全部任务

Claude最后会分析工具运行结果,判断工作是否完成。如果完成了,它就会发出来一个完成的文本来提醒你;

如果没完成,它会用另一个stop_reason:tool_use进行响应,这时候就要重复第3步的内容。

这里,Claude还可以实现“代理循环”——即使是在没有额外输入内容的情况下,它可以重复步骤3和4,直到完成复杂任务。

这里直接附上一个官方使用的示例:


import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
    model="claude-3-5-sonnet-20241022",
    max_tokens=1024,
    tools=[
        {
          "type""computer_20241022",
          "name""computer",
          "display_width_px": 1024,
          "display_height_px": 768,
          "display_number": 1,
        },
        {
          "type""text_editor_20241022",
          "name""str_replace_editor"
        },
        {
          "type""bash_20241022",
          "name""bash"
        }
    ],
    messages=[{"role""user""content""Save a picture of a cat to my desktop."}],
    betas=["computer-use-2024-10-22"],
)
print(response)

这个功能目前只能通过API使用,且还在测试中。

从OpenAI 和Anthropic的收入对比来看:OpenAI 绝大部分收入来自付费订阅,而 Anthropic 的绝大部分收入来自API。尽管两者拉开一个数量级,但是仅从比例上看,我们开发者更青睐Anthropic。

所以,冲着这个?笔的功能首先让开发者体验,我给Anthropic投一票!

但是也是因为还在测试初期阶段,在极端情况下,可能会出现“Claude不听话”或者“威胁安全”的情况:

请注意,操控电脑的功能会带来与标准API功能或聊天界面不同的独特风险。当使用计算机与互联网交互时,这些风险会增加。为了最大限度地降低风险,请考虑采取预防措施,例如:

使用具有最小权限的专用虚拟机或容器来防止直接系统攻击或事故。

避免让模型访问敏感数据,例如帐户登录信息,以防止信息被盗。

将Internet访问限制在允许列表的域中,以减少恶意内容的暴露。

要求人员确认可能导致有意义的现实世界后果的决定以及任何需要明确同意的任务,例如接受cookie、执行金融交易或同意服务条款。

在某些情况下,即使工具指令与用户的指令相冲突,Claude也会遵循工具中的命令。例如,网页上或图像中包含的Claude指令,可能会覆盖指令或导致Claude犯错。我们建议采取预防措施,将Claude与敏感数据和操作隔离,以避免与即时注入相关的风险。

最关心的价格问题

Claude 3.5 Sonnet:

如果选择提示缓存(此前Claude发布的prompt catching功能,能让输出token价格降到输入token的10%):

Claude 3.5 Haiku:

如果选择提示缓存:

没想到率先发布突破性功能进展的是Anthropic。反观OpenAI,GPT-4o发布会时说的视觉功能的期货,什么时候放出来呀?

不多说了,这就试试让Claude帮我办公一下~

参考资料

https://docs.anthropic.com/en/docs/build-with-claude/computer-use
https://www.anthropic.com/news/3-5-models-and-computer-use  


跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Claude 3.5 Sonnet Claude 3.5 Haiku 人工智能 操控电脑 Anthropic
相关文章