小米技术 07月19日 18:06
一句话找车:大模型上车,重构找车体验
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

小米汽车针对地下停车场信号弱、结构复杂导致用户找不到爱车的痛点,上线了全新的“快捷找车”功能。该功能通过在用户锁车时自动从五个角度拍摄车辆周围环境照片,并上传至小米汽车App。更重要的是,小米自研的图像理解大模型能够识别这些多视角图像,准确提取车位号、楼层、区域及周边设施等关键信息,并以结构化的方式呈现给用户,极大地提升了找车的便捷性和效率。此外,用户还可以通过呼叫超级小爱同学,语音查询爱车位置,实现“一问即知”,让找车过程更加轻松。

🚗 **多视角自动拍照记录车位信息**:用户开启“自动拍照”功能后,车辆在锁车瞬间会自动从俯视、前、后、左、右五个角度拍摄周围环境照片,这些照片将上传至小米汽车App的“车辆位置”页面,为用户提供找车的直观线索。

🧠 **AI图像理解大模型精准识别**:小米自研的图像理解大模型能够处理多视角拍摄的停车场照片,通过图像预处理、特征识别等步骤,准确识别并结构化输出车位号、楼层、区域以及周边设施等关键信息,用户无需手动放大或比对图片,即可直接获取清晰的车位详情。

⚙️ **大小模型协同优化性能与成本**:为适应不同场景的算力需求,小米构建了不同大小的视觉模块与大语言模型结合的体系。在快捷找车功能中,采用“大模型跑通+小模型部署”策略,先用大模型构建框架,再通过知识蒸馏训练轻量级模型,实现高识别准确率(室内93%,室外98%)的同时,有效降低了部署成本和运行效率。

🗣️ **超级小爱同学语音便捷查询**:小米手机用户可以通过语音指令“我的车停哪里了”唤醒超级小爱同学,系统将自动调用小米汽车App中的车位信息,并通过语音播报和弹窗形式告知车主车辆停放位置,进一步简化了找车流程,尤其方便用户在双手不便时使用。

💡 **AI技术赋能用户生活细节**:小米汽车的“快捷找车”功能体现了AI技术在解决用户日常痛点方面的价值。通过“看得见、看得懂、听得懂、答得出”的多模态AI能力,让用户在停车找车这一高频场景中获得更从容、更便捷的体验,是AI技术服务于生活细节的生动实践。

小米大模型团队 2025-07-16 17:01 北京

你是否有过这样的经历:在商场地下停车场绕了十几分钟,还是想不起车停在哪个柱子旁?或是从写字楼出来,手里拎着电脑包,却在成排的车辆中找不到自己的车?

地下车库信号弱、结构复杂,环境像“复制粘贴”一样相似,每次停车,如果没有记住车位号或者明显的标志,回过头来找车,就仿佛都在玩一场“记忆力游戏”。

作为“移动智能空间”的探索者,小米汽车始终关注用户在出行过程中的每一个细节体验,针对这一高频痛点,小米汽车上线了全新功能——快捷找车,锁车后即会自动总结车位信息,车主再也不用费劲记车位!

01 

锁车一,五视角自动拍照

离开车的瞬间,就是找车体验的开始。你只需在 小米汽车App - 车辆设置 - 安全与服务 中开启【自动拍照】功能,锁车后,车辆将自动从俯视、前、后、左、右五个角度拍摄周围环境照片,并上传至 小米汽车APP 的【车辆位置】页面。每张照片,都是你“找车的线索”。


但小米大模型团队并未止步于“拍照存图”这一步,团队进一步洞察用户需求,力争为用户提供更加直观、快捷的找车体验。



02 

AI识别不仅能看、更能理解

驻车拍照的图片在小米汽车APP界面中显示较小,楼层、区域信息往往隐藏在墙面的小角落,用户需要点击放大后查看,而前后左右的环视图还需要用户自己去“脑补”方位关系,辨识困难。

为了解决这些痛点,小米自研图像理解大模型正式上线!

小米自研图像理解大模型基于大量停车场场景数据训练,模型能基于多视角图像,进行图像预处理、关键特征区域裁切、编码、推理,准确识别停车位特征,最终结构化地输出车位号、楼层、区域、周边设施等信息。

通过这一功能,用户无需反复比对图片、放大查看,就可以直接获取车位号及车位环境的描述。

这样简单自然的体验,背后是小米长期以来在图像理解领域的技术积累。

小米很早就开始布局视觉大模型的研发,构建起了一整套自研的图像理解大模型体系,考虑到不同场景的算力条件不同,小米自研图像理解大模型通过不同大小的视觉模块结合不同尺寸的大语言模型,推出了不同大小的模型:

为了兼顾快捷找车的速度和性能需求,技术上采用“大模型跑通+小模型部署”的策略——首先采用大尺寸模型快速构建起完整的车位识别与环境分析框架,然后通过知识蒸馏的方式训练将能力“压缩”传递给轻量级模型,大大节约了大模型部署的成本。这一方案,不仅让智能识别更准确,也兼顾了速度与成本,是小米多模态大模型技术在垂直场景落地中的一次重要实践。

通过评测,室内车位号识别准确率达93%,室外车位号识别准确率达98%,周围环境特征准确率在90%以上。

*说明:该功能已率先上线YU7,需要您在车辆上登录个人账号后才能进行使用,泊车时若未开启透明底盘,车辆将无法获取底盘照片。

03 

一问小爱即知车位,找车更轻松

除了小米汽车App上显示的车位总结的信息,小米手机用户还可以直接呼出超级小爱,问一句——“我的车停哪里了”,超级小爱将自动调用小米汽车App中的车位号信息,并通过语音播报 + 弹窗展示,告知车主车停的位置。

当你从商场购物出来,手里拿着大包小包,此时只需手机唤醒超级小爱,一句提问,车辆信息一目了然,找车的难度瞬间降低。



-

随着大模型与多模态技术的深度融合,过去那些让人烦恼的小细节——看不懂的图片、找不到的车位、模糊的环境线索,如今都能交给大模型自动识别与理解,它不仅“看得见”、“看得懂”,还“听得懂”、“答得出”。

科技的进化,不只是更强的算力和模型参数,更是让每一个用户少一点麻烦,多一点从容。小米将继续拓展AI视觉在生活服务场景的落地应用,让每个用户通过大模型“看”得更清楚、生活得更轻松。


END


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

小米汽车 AI找车 图像识别 大模型 智能出行
相关文章