iPhone为智能手机领域带来的革命之一,就是多点触控屏幕。“触控”也在此后的十八年里,逐渐成为了人们与电子设备交互的主要方式之一。
但苹果觉得:触控还不够。
事实上,我们已经在Vision Pro上见到了基于视觉识别的纯手势交互,几乎是目前AR设备中最无感的一种方案。
而近期的一些新证据表明,苹果也在尝试另一种基于Siri的纯语音的人机交互方案。
就在昨日,彭博社苹果专家Mark Gurman在一篇最新的预测中指出:推迟到2026年的AI Siri,有可能通过借助加强App Intents的方式,间接实现让用户完全以语音遥控的方式操作iPhone。
这是一块苹果在2024年WWDC上就已经画过的大饼了。在一则饱受虚假宣传指责的广告中,苹果展示了女演员Bella Ramsey向Siri提问、Siri跨应用收集信息并给出回答的场景:
广告中,Bella 向 Siri 提问一项活动的参与者名字,Siri 通过快速调用日历做出了回答|YouTube @QuirkyFilms
由于Apple Intelligence始终无法实现这样的功能,这则广告片早在年初就已被苹果下架。至于“更智能的Siri”,也因为Siri团队内部架构双轨的调整,推迟到了2026年。
Marc Gurman的看法是:新架构Siri反复推迟这件事,本身并不是什么大问题,比起磕磕绊绊的Siri,更值得关注的在于:
新架构Siri如果想要实现苹果在两次WWDC与发布会上画的那些大饼,iOS的App Intents功能必须在未来得到史诗级加强。
你或许没有听说过App Intents这个名字,这并不奇怪,因为它不是某个单独的功能,而是一个面向苹果开发者的系统功能框架,于2022年苹果在iOS 16中首次推出App Intents,取代了早前的SiriKit Intents。
图|Apple Developers
而App Intents的功能也如同它的名字一样,主要用于展示一款app的“意图”。
就拿iOS的聚焦搜索来说,除了直接查找app之外,我们其实还可以直接在这里输入一些功能提示词,比如“创建”或者“扫一扫”,系统就会自动拉起一些app内部的功能入口以供选择:
而这也很直观地展示了App Intents的基本作用——给原本处在app内部的各种功能,创建一条“快捷通道”,并且将这些快捷通道的入口与iOS系统级功能整合,让用户可以不打开app就快速调用。
图|Apple Developers
而这也正是Marc Gurman所预测的、新的AI Siri在未来能够胜任更多复杂操作的基石。
无独有偶的是,类似的功能快捷入口并非苹果独享,华为的HarmonyOS中也有一个类似的服务叫做Intents Kit,负责连接系统入口与app或元服务内部的功能:
图|华为开发者联盟
不过目前由于苹果的宣传力度和入口限制,能够在iOS中调用App Intents去执行操作的就只有上面提到的三大件——Siri、聚焦搜索,以及捷径。
考虑到Siri过于拉胯、聚焦搜索用户基数不高,因此使用频率最高的就是通过捷径调用了。现在各种快速记账、裁剪照片添加水印、将前一天的照片统一发送到微信文件传输之类的捷径,本质上都是经由App Intents在发挥作用。
通过聚焦搜索直接跳转执行支付宝内部的扫码功能
而未来AI Siri领衔的自动化操作,参考目前捷径对于App Intents的调用方式,爱范儿认为将会是一个很简单的“两步走”逻辑:
1. 加强App Intents能够直接调用的app功能。目前的App Intents框架需要开发者主动编写,能够覆盖的app数量十分有限,苹果后续可能通过新建API的方式让系统直接读取app功能列表,扩大App Intents的调用范围。
2. Apple Intelligence的语音模型可以帮助Siri更好地拆分和理解用户的语音指令,并且利用iPhone上面的端侧模型将自然语言指令转换为依次调用App Intents的组合,从而实现复杂步骤的自动操作。
Marc Gurman预测苹果最早可能会在2026年的春季发布会上推出这套新AI Siri+App Intents的组合,届时可以实现的操作可能类似于“嘿Siri,把昨晚吃饭拍的照片全部裁成正方形,发到XXX的微信,在下周六创建一个一样的日程”,并且全程不需要动手点iPhone。
只不过在那之前,这套新的语音操作方式还需要经过长期的测试,尤其是针对一些高风险的场景需要更加严格的Siri模型控制,在明年春季再遭推迟也不是不可能。
而从产品的角度看,这样一套完全基于语音的操作方式,虽然有可能最先落地在iPhone上,但未来能够发光发热的场景肯定不止智能手机。
反而是Apple Watch、HomePod,甚至传闻中的智能家居中控屏和桌面机器人,以及类似Vision Pro的AR设备,会成为纯Siri语音交互的主要受益者。
换句话说,这套AI Siri搭配增强版App Intents的“组合拳”,是一套上利无障碍用户、下利新产品形态的全新交互系统,非常符合我们以往对于苹果强大的软硬件结合能力的想象。
而苹果现在唯一需要做的,就是如期把它交付出来。