机器之心 03月24日 14:55
刚刚,谷歌Gemini Live上新功能,能看懂手机屏幕、还能实时视频
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文报道了谷歌Gemini Live推出新AI功能,包括屏幕共享和实时视频解读,标志着实时人工智能交互的重大进步。同时,文章对比了苹果Siri的升级延期,强调了苹果在人工智能领域进展缓慢的现状。谷歌的Gemini Live通过Project Astra项目,实现了低延迟的实时音视频对话和多语言支持,而苹果的Siri则因技术问题和内部管理问题,导致高级智能功能无法按时推出。文章探讨了苹果在人工智能竞赛中的困境,以及Siri现代化面临的挑战。

📱 谷歌Gemini Live推出了屏幕共享功能,用户可以共享手机屏幕,Gemini能够回答屏幕上的信息,如日期和温度,实现了更智能的交互。

📹 谷歌Gemini Live新增实时视频功能,通过手机摄像头实时解读画面,并回答相关问题,例如提供关于陶器颜料选择的建议,实现了更直观的互动。

🍎 苹果Siri的升级被推迟,高级智能功能未能按时推出,引发了内部员工的沮丧和外界的批评,反映了苹果在人工智能领域面临的挑战。

🚀 Project Astra是谷歌的AI智能体项目,拥有实时对话、记忆和工具调用三大特点,旨在提升用户体验。

🤔 苹果Siri的延期升级,反映了公司在人工智能领域的进展缓慢,与谷歌Gemini Live形成鲜明对比。

2025-03-24 12:35 韩国

与之形成鲜明对比的是,苹果推迟了 Siri 的升级

机器之心报道

编辑:陈陈、蛋酱


好消息,谷歌在 MWC 上关于 Project Astra 与 Gemini Live 集成的承诺兑现了。


刚刚,谷歌发言人 Alex Joseph 在给 The Verge 的邮件中确认,谷歌已经开始向 Gemini Live 推出新的 AI 功能,能够共享用户的手机屏幕或者通过智能手机摄像头回答相关问题。这对于实时人工智能交互来说是一个重大进步。


这些功能的推出距离谷歌首次展示「Project Astra」项目已经过去一年时间。


有 Reddit 用户表示自己已经率先体验到了屏幕共享功能,该功能通过一个名为「Share screen with Live」的新按钮来实现。



这位用户还发布了一段视频来证明。


通过视频我们可以看出 Gemini 根据用户共享的屏幕,回答出了今天的日期、温度等信息。



另外,Gemini Live 推出的另一项功能是实时视频功能,它可以让 Gemini 实时解读你手机摄像头的画面,并回答相关问题。


效果如何,我们通过示例来感受一下。在谷歌本月发布的一段演示视频中,用户使用该功能向 Gemini 求助,他们上釉的陶器选择什么颜色的颜料最合适。



只见用户打开手机摄像头,对准物体进行实时拍摄,然后询问这些釉料中哪一种最适合?



几乎是毫无延迟的 Gemini 给出了回答:



一个问题回答完毕后,你也可以继续追问,Gemini 都能对答如流



Project Astra 是谷歌去年发布的 AI 智能体项目,用户通过摄像头,可以与大模型进行实时的视觉与语音交互,也是谷歌对标 GPT-4o 的又一项重要研究。


Project Astra 有三个特点:




此外,Project Astra 还可以跨设备工作,用户可以在安卓手机或原型眼镜上使用 Project Astra 功能。



视频对话功能并非新概念。最早公开演示 AI 视频通话的 OpenAI,则在去年 12 月底就在自家产品上线了对应能力:在 ChatGPT 的移动端应用程序 App 中,高级语音模式 Advanced Voice 提供了视频和共享屏幕功能。目前该功能还没有免费开放,也是 Plus 用户和 Pro 用户才能使用。


谷歌此时推出这些功能,至少证明了 Gemini 在努力保持人工智能助手领域的「前排」地位。


与之形成鲜明对比的是,苹果推迟了 Siri 的升级。彭博社前几天报道,一份 Siri 团队内部会议的记录显示,我们期待的 Apple Intelligence 仍遥遥无期。


会议由负责该部门的高级主管 Robby Walker 主持。他称此次延迟是一个「糟糕的」情况,并同情那些可能因苹果的决定和 Siri 仍然不佳的声誉而感到疲惫或沮丧的员工。


Robby Walker 还表示,承诺过的 Siri 功能不一定会在今年出现在 iOS 19 中:「这是该公司目前的目标,但并不意味着我们会在那时推出。」


近几周,苹果一直无法摆脱有关其在 Siri 和人工智能方面进展缓慢的负面新闻。去年 6 月承诺过的高级智能功能至今无法兑现。几个月过去了,除了更漂亮的 Siri 动画外,几乎没有任何成果。


除此之外,苹果尚未公开评论此事。当时该公司表示,高级 Siri 功能「比预期耗时更长」。但 Robby Walker 告诉员工,公司的软件主管、人工智能主管等高管正在为这一困境承担「个人责任」,然而这一困境引发了广泛的、激烈的批评。


这些功能对于 Siri 的现代化、苹果在人工智能竞赛中的追赶其实非常重要。我们仍然不知道这些 Apple Intelligence 功能何时会到来。似乎,从最近这次全体会议的讨论内容来看的话,苹果本身也不知道。



参考链接:

https://www.theverge.com/news/634480/google-gemini-live-video-screen-sharing-astra-features-rolling-out

https://www.theverge.com/news/629940/apple-siri-robby-walker-delayed-ai-features


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Gemini Live Siri 人工智能 Project Astra
相关文章