赛博禅心 2024年11月29日
附内测地址:AI 开始接管物理世界
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

智谱AI发布了全新产品GLM-PC,它突破了传统Chatbot的局限,实现了AI对物理世界的交互操作。GLM-PC能够理解语义、识别场景并进行决策判断,例如自动给B站视频点赞投币,并在关键操作前主动询问用户确认。此外,它还支持手机远程操控电脑,并具备定时执行任务的功能。智谱AI还发布了端侧模型GLM4-Edge,面向手机、车机和PC等平台,并已开源。GLM-PC的出现,标志着AI从数字世界向物理世界交互的探索迈出了重要一步,有望改变我们的生活方式。

🤔GLM-PC突破了传统ChatBot的局限,实现了AI对物理世界的交互操作,例如自动给B站视频点赞投币,并在关键操作前主动询问用户确认,体现了其强大的语义理解、场景认知和决策判断能力。

📱GLM-PC支持手机远程操控电脑,用户可以通过手机发送指令控制电脑执行操作,例如给指定视频投币,并支持定时执行任务,方便用户进行自动化操作,例如打卡等。

💻GLM4-Edge端侧模型面向手机、车机和PC等平台,并已开源,降低了AI应用的门槛,促进AI技术在更多场景的落地。

🎁智谱AI发布会现场,AI发送了红包,体现了AI与人类交互的进一步发展,也展现了AI在未来生活中的应用潜力。

原创 金色传说大聪明 2024-11-29 14:22 广东

GLM-PC 一手体验

并附内测地址

今天在智谱,很震撼。先看视频: 

这两天,正在写一篇文章:《物理世界的接口,探索 AI 如何与世界交互》,并打算吐槽一下:

几乎所有 AI 大厂,都在做一件事:更好的 Chatbot,然后疯狂刷榜&PR」

却少有人关心:AI 如何真正有效的改变世界、改变生活。 


文章还没写完,就被拎到了智谱发布会... 

被发了个群红包(喜

红包很大,两万块(大喜

红包很多,100个(特喜

我没抢到(悲


但最终,

发现智谱走在了更前面... (喜




链接物理世界

放个片子:


上个月,Claude 发布了一款新的 API,Computer Using:

革命序章:Claude 3.5 新 API,可操作电脑


这次,智谱更进一步,发布了成熟产品:GLM-PC,也可以叫「牛牛」,Logo 是头牛



形式上虽是 ChatBot,落地完全不同: 

从纯语言理解转,向物理世界的交互 


因现场没有过于演示,我自己测了下:「让 AI 自动给B站上战鹰点赞投币」 

 

任务完成,很顺利,看下面的视频:

这里有个细节,让我挺惊讶:当 GLM-PC 准备投币时,会主动暂停并询问确认 - 由 AI 主动发起,这就有意思了。

从技术角度看,这个行为意味着 GLM 实现了: 

    语义理解:它知道"投币"和"点赞"虽然都是互动行为,但投币会消耗用户的虚拟货币

    场景认知:它能识别出哪些操作需要额外确认,而不是简单地执行所有指令

    决策判断:它会在关键节点主动暂停,等待用户的二次确认

这是一种有趣的思路:AI 再是一个单纯的"执行者",而是在执行的过程中,判定是否合理 

(刚好的,OpenAI 之前讨论过这个:OpenAI:搞 Agent 时,你要注意这些) 


另一个牛逼的是... 它支持我用手机来操作电脑


在绑定了手机后,输入指令:「给渤海小吏投币」后,


电脑也会完成这一操作

这个操作可以定时... 所以非常适合... 打卡。


牛牛这东西,内测地址在这(Mac 可用):
https://www.wjx.top/vm/mOs9cHw.aspx


还有一个基于浏览器的,更通用(智谱清言浏览器版):

https://new-front.chatglm.cn/webagent/landing/index.html?channel=ads_news_openday





来自异次元的红包

最能打动我的,总是红包。

发布会现场,张鹏总对着手机说了句:往群里发个红包,2万块,100个

于是... 人类收到了来自 AI 发送的第一个红包(虽然我没收到...碎碎念ing)


同样,发红包的过程中,对于敏感操作如支付,也会主动请求用户确认。 


2万块的微信红包 


微信没抢到(悲)

一份支付宝红包


支付宝抢到了(喜)


这个在手机里的产品,叫做 AutoGLM,内测地址

https://agent.aminer.cn/


 



再度开源

这些之外,端侧模型 GLM4-Edge 今天也有发布

由两种尺寸的大语言对话模型和多模态理解模型组成

1.5B / 2B模型主要面向手机、车机等平台

4B / 5B 模型主要面向 PC 等平台

 

发布即开源

https://github.com/THUDM/GLM-Edge




 


最后,我想说的是

从实验室数字,到物理世界的操控

从语言理解,到现实世界改变

可能是 AI 下一个突破口

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

GLM-PC AI交互 物理世界 智谱AI 端侧模型
相关文章