AI产品黄叔 2024年11月19日
苹果 AI 还没入华,国产大模型公司先把入口占了!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

跃问智能助手通过将视觉搜索功能“拍照问”接入iPhone 16相机控制按钮,实现了用户一键唤起视觉搜索,即拍即问。这种创新交互方式,降低了用户使用门槛,让智能视觉搜索更贴近日常生活。跃问基于阶跃星辰自研的多模态大模型,提供包括识别美食卡路里、英语学习、宠物心情等多种场景应用,展现了强大的多模态理解能力和产品创新。其生活化的产品定位和简单易用的交互设计,为AI产品如何融入用户生活提供了新的思路。

🤔跃问将视觉搜索功能“拍照问”接入iPhone 16相机控制按钮,用户可一键唤起视觉搜索,即拍即问,降低了用户使用门槛,提升了用户体验。

📸跃问基于阶跃星辰自研的Step-1.5V多模态理解大模型,提供识别食物卡路里、英语学习、宠物心情等多种场景应用,展现了强大的多模态理解能力。

📊阶跃星辰的多模态模型在国内处于领先地位,在SuperCLUE中文多模态理解测评基准榜中位列第一,且付费率最高,体现了其模型能力的强大和市场认可度。

💡跃问的产品定位差异化明显,注重生活场景应用,而非一味追求生产力工具,这使得AI技术更贴近普通用户的生活,降低了使用门槛。

📱跃问通过相机控制按钮的入口创新,结合场景和交互创新,实现了AI与硬件的深度融合,为其他AI产品提供了借鉴。

原创 AI产品黄叔 2024-11-19 11:00 北京

这个入口被占是苹果没想到的

今年发布的 iPhone16 核心卖点是 Apple Intelligence,其中很炸裂的是能通过新增的“相机控制”按钮快速调用视觉大模型,通过拍图向 AI 提问,非常方便。可惜,苹果 AI 何时能入华还是个未知数,对国行 iPhone16 用户来说,“相机控制”就形同鸡肋了。 

 

本来以为要有的等了,结果国产大模型补上了这块短板——阶跃星辰的智能助手跃问做了个产品尝试,把视觉搜索功能“拍照问”接入了 iPhone 16 的相机控制按钮,可以一键唤起进行视觉搜索,即拍即问。我发现在很多场景下,用视觉的方式解决问题比语音和文字要直接得多。再多想一步,多模态大模型怎么跟硬件产品结合去抢占用户入口,这可能也是个范本。 

 

 

谷歌前 CEO 埃里克·施密特说过:“最好的产品是那些打破了用户使用障碍的产品。” 跃问接入 iPhone 16 的相机控制按钮,相当于把用户使用路径缩到了最短,而即拍即问,一键直出答案的产品设计,才有可能让智能视觉搜索这个目前相对小众的领域形成用户习惯。 

 

在实际体验中,因为我还没有尊贵的 iPhone16,所以拿媳妇的 15 Pro Max 来体验,因为好在跃问这项功能除了支持 iPhone 16,还支持所有系统升级到 iOS 18 的苹果用户,只是入口略有不同。简单完成配置后,按住“快捷控制”按钮大约半秒,直接进入跃问拍照问产品界面。点击拍照,产品会给出一些 prompt 提示词,我语音输入指令让它给我介绍一款产品,答案很快就出来了: 

 

就这么简单,就这么丝滑! 

 

之后我又测试了其他几个用拍图能更快解决问题的场景:让跃问帮我看孩子的作业题,拍美食图直接帮我计算卡路里摄入量,以及拍历史建筑给我介绍背景知识。 

 

我的天啦,孩子的作文可以提取出文字,甚至拼音也能给转换过来,还贴心的附带了一键复制的按钮!卡路里可以快速的估算,甚至故宫一角的照片都可以识别出来!! 

 

这些体验下来,丝滑到我都在想,苹果你不用急了,慢慢来哈哈哈。 

 

 

产品要达到这样的体验,由两个部分构成: 

    模型&产品能力

    良好的交互嵌入

 

模型效果是 AI 应用的基础,如果模型能力解决问题的效果达不到用户预期,那么产品也就没有留存。拍照问是跃问 App 内的一个智能视觉搜索功能,背后是阶跃星辰自研的 Step-1.5V 多模态理解大模型。 

 

其实很多人对阶跃最深的印象就是多模态能力强。上个月中文大模型基准测评机构 SuperCLUE 发布了 10 月中文多模态理解测评基准榜,阶跃的多模态理解模型位列国内第一: 

而再往后有看一步,是否有人愿意为模型买单也很能说明问题。网红 AI 应用胃之书的开发者赵纯想曾经说过,胃之书在选择模型时经过了 AB 测试,最后发现阶跃的多模态模型付费率最高! 

 

前段时间在线下见到了林间疗愈室的创始人李神龙,他也说在使用阶跃的多模态,识别情绪的准确率很高,使用后用户付费率提升了,未来想和阶跃有更深度的合作。 

 

包括黄叔自己的体验下来,阶跃的多模态在国内确实是独一档的存在,能不能打,拉出来溜溜就知道了。 

 

模型能力强悍,产品自然就好做了,再加上愿意和用户共创,就会衍生出很多有意思的拍照场景。跃问把多模态能力的场景应用,包装成了一些有趣的“滤镜”,这种产品形态既保留了 AI 的专业能力,又让产品的基因中包含了传播属性,很好地平衡了功能性和趣味性。下面这些是拍照问已经上线的一些场景滤镜: 

 

看几个比较有趣的,第一个是场景英语,我们国人很喜欢学英语,随时随地拍照学英语体验过没?来来来: 

 

一张照片给你弹出几个英文单词标签,标签点击后还能听读音,右下角点击详情,还可以看英文单词的释义等学习辅助功能,分享还能把单词卡保存下来! 

 

卡路里滤镜,能够识别出菜品,以及最牛逼的是,会预估食物的重量,从而来算热量和碳水之类的数值,这对于注重健身和身材管理的人来说太方便了! 

 

除了有用,拍照问选择的另一个产品方向是好玩。MBTI,宠物心情,答案之书,这些“滤镜”都自带传播性。好的产品,在设计时就要把传播考虑进去。 

 

从模型输出的内容来看,有很多细节:比如猫猫”蜷缩在角落的姿势“”正闹小情绪“,星空和海洋,探照灯,未知的世界,勇敢前行! 

 

苹果前设计师乔纳森·艾维的观点也印证了这一点:"最好的设计是如此简单,以至于看起来显而易见。" 正是这种简单而优雅的设计理念,让跃问能够将如此复杂的 AI 技术,通过简单的拍照交互呈现给用户。 

 

这种简单交互的背后,反应了跃问的产品定位差异: 

 

 

很有意思的是,从前面的产品体验来看,跃问的"拍照问"功能展现出了非常鲜明的产品定位差异: 

 

这就是:生活场景优先 

 

不同于当下大多数主打生产力的大模型产品,跃问选择了一条"生活化"路线。无论是快速识别食物热量、美食好评、测测 MBTI、猜猜鞋码,甚至是,还是宠物读心,这些都紧密贴合用户的日常生活场景。当大部分 AI 应用还在卷生产力工具,跃问的定位除了避开红海,也让 AI 真正走进了普通人的生活,降低了使用门槛。 

 

其实生活助手的场景比生产力工具更宽泛,而如何定义生活助手并从中找到商业化价值也尚有更大的探索空间。 

 

我去微博搜了下用户都是如何使用拍照问的,发现一些很有意思的 case: 

 

宠物面相图鉴,是个很容易出趣味点的功能。 

 

拍照识别美食,也确实刚需哈哈 

 

从拍照出发,是能比较好的嵌入用户的生活场景的,当然,使用门槛也要注意。 

 

那要降低使用门槛,很重要的一点是交互需要有创新,拍照问有两点创新: 

 

第一,交互创新,跃问没有一味追随传统的文字对话模式,而是将视觉交互作为核心入口,辅助语音输入,用户可以让 AI 直接"看到"问题场景,省去了复杂的文字描述过程。比如看到一道菜直接拍照估算卡路里,这比打字描述要高效得多。 

 

第二,入口创新,这次跃问的更新直接整合到 iPhone 16 相机控制按键里面相当巧妙,据我所知应该是国内 AI 大模型公司里第一个这么干的,大流量硬件+有价值的场景+固定入口,会让用户形成肌肉记忆,也大幅降低了用户使用 AI 的门槛。 

 

场景创新、定位创新、交互和入口创新,这一套组合拳下来,还是蛮值得大家学习的。 

 

 

亚马逊创始人贝索斯有句名言:“在数字时代,最重要的是专注于客户而不是竞争对手。” 跃问“拍照问”没有随大流地为了做款 AI 对话助手而做产品,而是去探索一些尚未被广泛满足的刚需场景,并让交互和场景融合都更加简单和自然。 

 

在这个苹果 AI 即将入华的时刻,跃问的产品策略给了我们三个重要启示: 

 

第一,机会始终属于先行者。当大家还在期待明年苹果的 AI 入华时,跃问已经用行动证明:国产大模型完全可以让 iPhone 焕发新的生命力。 

 

第二,产品创新要有温度。跃问没有一味追求堆砌功能,而是深入思考用户需求: 

- 产品定位贴近生活,不是冰冷的生产力工具 

- 交互设计符合直觉,拍照+语音让 AI 触手可及 

- 入口创新,巧妙融入 iPhone 最核心的使用场景 

 

第三,也是最重要的:科技的尽头是生活。在当下这个 AI 百花齐放的时代,真正能胜出的不是功能最强大的产品,而是最懂用户、最贴近生活的产品。正如黄叔所说,技术永远是服务用户需求的手段,跃问在"如何让 AI 自然地嵌入用户生活"这个命题上,交出了一份答卷。 

 

展望未来,AI 产品的竞争在于谁能真正理解并解决用户的日常需求。在这个赛道上,跃问为我们展示了一个可能的发展方向。 

 


跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

跃问 多模态 视觉搜索 AI产品 iPhone
相关文章