虎嗅 8小时前
有嘴就行?Siri又画大饼了,明年让你解放双手用iPhone
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

苹果正致力于革新用户与电子设备的交互方式,在多点触控之后,纯手势和纯语音交互成为新的探索方向。近期有证据表明,苹果正计划通过加强Siri的App Intents功能,实现用户完全以语音遥控操作iPhone。这套基于AI Siri和增强版App Intents的组合,有望在2026年实现复杂的跨应用语音自动化操作,为用户带来更便捷的交互体验,并可能推广至Apple Watch、HomePod及AR设备等更多苹果产品线。

🤖 **App Intents作为Siri语音交互的基石**:苹果在iOS 16中推出的App Intents框架,旨在为开发者提供一个系统功能框架,用于展示和调用app内部的功能。它取代了早前的SiriKit Intents,为用户通过Siri、聚焦搜索和捷径等系统级功能,提供了调用App内部操作的“快捷通道”,是实现未来复杂语音自动化操作的关键技术。

🗣️ **AI Siri赋能语音操控iPhone**:彭博社专家Mark Gurman预测,推迟到2026年的AI Siri,将通过加强App Intents功能,让用户能够完全以语音指令遥控iPhone。例如,用户可以指示Siri“把昨晚吃饭拍的照片全部裁成正方形,发到XXX的微信,在下周六创建一个一样的日程”,从而实现一整套复杂的跨应用操作,无需手动点击。

🚀 **App Intents的未来发展与挑战**:要实现AI Siri的强大功能,App Intents框架需要得到“史诗级加强”。苹果可能通过新建API直接读取app功能列表,扩大App Intents的调用范围。同时,Apple Intelligence的语音模型需要能准确解析用户指令,并将其转化为调用App Intents的组合。这项技术预计最早在2026年春季发布,但仍需长期测试,尤其是在高风险场景下的模型控制。

💡 **语音交互的广阔应用前景**:苹果的这套AI Siri与增强版App Intents组合,不仅将首先落地于iPhone,更有潜力在Apple Watch、HomePod、智能家居中控屏、桌面机器人以及Vision Pro等AR设备上大放异彩。这套系统有望成为无障碍用户和新产品形态的强大助力,充分体现苹果软硬件结合的优势。

iPhone为智能手机领域带来的革命之一,就是多点触控屏幕。“触控”也在此后的十八年里,逐渐成为了人们与电子设备交互的主要方式之一。

但苹果觉得:触控还不够。

事实上,我们已经在Vision Pro上见到了基于视觉识别的纯手势交互,几乎是目前AR设备中最无感的一种方案。

而近期的一些新证据表明,苹果也在尝试另一种基于Siri的纯语音的人机交互方案

就在昨日,彭博社苹果专家Mark Gurman在一篇最新的预测中指出:推迟到2026年的AI Siri,有可能通过借助加强App Intents的方式,间接实现让用户完全以语音遥控的方式操作iPhone。

这是一块苹果在2024年WWDC上就已经画过的大饼了。在一则饱受虚假宣传指责的广告中,苹果展示了女演员Bella Ramsey向Siri提问、Siri跨应用收集信息并给出回答的场景:

广告中,Bella 向 Siri 提问一项活动的参与者名字,Siri 通过快速调用日历做出了回答|YouTube @QuirkyFilms

由于Apple Intelligence始终无法实现这样的功能,这则广告片早在年初就已被苹果下架。至于“更智能的Siri”,也因为Siri团队内部架构双轨的调整,推迟到了2026年。

Marc Gurman的看法是:新架构Siri反复推迟这件事,本身并不是什么大问题,比起磕磕绊绊的Siri,更值得关注的在于:

新架构Siri如果想要实现苹果在两次WWDC与发布会上画的那些大饼,iOS的App Intents功能必须在未来得到史诗级加强。

你或许没有听说过App Intents这个名字,这并不奇怪,因为它不是某个单独的功能,而是一个面向苹果开发者的系统功能框架,于2022年苹果在iOS 16中首次推出App Intents,取代了早前的SiriKit Intents。

图|Apple Developers

而App Intents的功能也如同它的名字一样,主要用于展示一款app的“意图”。

就拿iOS的聚焦搜索来说,除了直接查找app之外,我们其实还可以直接在这里输入一些功能提示词,比如“创建”或者“扫一扫”,系统就会自动拉起一些app内部的功能入口以供选择:

而这也很直观地展示了App Intents的基本作用——给原本处在app内部的各种功能,创建一条“快捷通道”,并且将这些快捷通道的入口与iOS系统级功能整合,让用户可以不打开app就快速调用。

图|Apple Developers

而这也正是Marc Gurman所预测的、新的AI Siri在未来能够胜任更多复杂操作的基石。

无独有偶的是,类似的功能快捷入口并非苹果独享,华为的HarmonyOS中也有一个类似的服务叫做Intents Kit,负责连接系统入口与app或元服务内部的功能:

图|华为开发者联盟

不过目前由于苹果的宣传力度和入口限制,能够在iOS中调用App Intents去执行操作的就只有上面提到的三大件——Siri、聚焦搜索,以及捷径。

考虑到Siri过于拉胯、聚焦搜索用户基数不高,因此使用频率最高的就是通过捷径调用了。现在各种快速记账、裁剪照片添加水印、将前一天的照片统一发送到微信文件传输之类的捷径,本质上都是经由App Intents在发挥作用。

通过聚焦搜索直接跳转执行支付宝内部的扫码功能

而未来AI Siri领衔的自动化操作,参考目前捷径对于App Intents的调用方式,爱范儿认为将会是一个很简单的“两步走”逻辑:

1. 加强App Intents能够直接调用的app功能。目前的App Intents框架需要开发者主动编写,能够覆盖的app数量十分有限,苹果后续可能通过新建API的方式让系统直接读取app功能列表,扩大App Intents的调用范围。

2. Apple Intelligence的语音模型可以帮助Siri更好地拆分和理解用户的语音指令,并且利用iPhone上面的端侧模型将自然语言指令转换为依次调用App Intents的组合,从而实现复杂步骤的自动操作。

Marc Gurman预测苹果最早可能会在2026年的春季发布会上推出这套新AI Siri+App Intents的组合,届时可以实现的操作可能类似于“嘿Siri,把昨晚吃饭拍的照片全部裁成正方形,发到XXX的微信,在下周六创建一个一样的日程”,并且全程不需要动手点iPhone。

只不过在那之前,这套新的语音操作方式还需要经过长期的测试,尤其是针对一些高风险的场景需要更加严格的Siri模型控制,在明年春季再遭推迟也不是不可能。

而从产品的角度看,这样一套完全基于语音的操作方式,虽然有可能最先落地在iPhone上,但未来能够发光发热的场景肯定不止智能手机。

反而是Apple Watch、HomePod,甚至传闻中的智能家居中控屏和桌面机器人,以及类似Vision Pro的AR设备,会成为纯Siri语音交互的主要受益者。

换句话说,这套AI Siri搭配增强版App Intents的“组合拳”,是一套上利无障碍用户、下利新产品形态的全新交互系统,非常符合我们以往对于苹果强大的软硬件结合能力的想象。

而苹果现在唯一需要做的,就是如期把它交付出来。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

苹果 Siri App Intents 语音交互 AI
相关文章