抢先OpenAI？AIUI全新升级燃爆22亿终端，国内大厂定义智能交互

新智元前天 18:13

科大讯飞发布了AIUI人机交互平台及多款智能硬件，展示了其在智能交互领域的最新成果。内容涵盖儿童专属交互方案、智能眼镜、机器人语音背包、移动数字人等多个方面，构建了中国“智能交互新生态”。通过技术创新和平台开放，科大讯飞致力于让人机交互更加智能、便捷，推动AI技术在各行各业的应用。

👧🏻 **儿童专属交互方案：** 针对儿童的表达特点，科大讯飞开发了童言识别和童语理解技术，打造寓教于乐的儿童内容，提供趣味对话、故事共创、早教技能等，并构建了儿童守护计划，为儿童提供安全、健康的交互环境。

👓 **智能眼镜“三麦阵列”：** 针对语音交互，科大讯飞推出了“三麦阵列”方案，通过多麦克风阵列降噪收音等技术，提升语音识别准确度和流畅度，实现了在嘈杂环境下的可靠语音交互，支持翻译、信息查询等功能。

🤖 **机器人超脑平台：** 讯飞的机器人超脑平台提供了视听融合解决方案，并推出了智能语音背包，使机器人具备语音交互能力，提升了机器人在酒店服务、展厅展馆等领域的应用能力，并推出了具身智能训练一体机，加速产业推广。

🧍‍♀️ **移动数字人“小雨”：** 讯飞发布了移动数字人“小雨”，可在导览等场景中进行移动式交互，并介绍了AI虚拟人交互平台，提供快速构建数字分身的功能，支持多语言，广泛应用于媒体、教育等领域。

🚀 **星辰Agent平台：** 科大讯飞推出了星辰Agent平台，这是一个一站式定制开发平台，可以完成从Agent开发、应用测评，到可控发布、运营迭代所有流程。星辰Agent平台专业版，提供高并发、高容量的优享资源，并支持效果评测、团队协作、1V1定制服务。

新智元 2025-06-13 15:12 广东

新智元报道

编辑：编辑部 YZJH

【新智元导读】科大讯飞又搞了个大动作，智能交互直接燃爆！AIUI全新升级，儿童专属交互方案，AI眼镜「三麦阵列」硬核出圈，还有机器人语音背包、移动数字人「小雨」实力抢镜。一场发布会，让我们看到下个时代人机交互的全貌。

不知不觉间，硅谷的巨头都开始搞AI硬件了：苹果押宝的是Vision Pro的结合；Meta在紧锣密鼓地测试AI眼镜；英伟达押注机器人。

不过国内有一位玩家，早已布局多年，下好了先手棋——

在智能硬件这条路上，科大讯飞已深耕多年，AI学习机、办公本都做到了线上品类销量第一，构建起了中国的「智能交互新生态」。甚至还凭借独特的开发者生态，大大赋能了行业创新。

而就在刚刚，科大讯飞又在深圳整了个大活儿！

这次，围绕智能交互场景，他们直接来了一波全面升级——AIUI、机器人超脑、虚拟人交互、讯飞星辰4大平台。

而且不光是产品，平台技术也开放了，还直接放出企业级的智能体引擎。可以说，是把智能狠狠砸进了各行各业。

AIUI下一个时代

科大讯飞的AIUI人机交互平台，已经发布了10年。

它以大模型为引擎，融合了情绪识别、创意生成、深度语义理解等类人多模态能力，成为产业智能化升级的核心支撑。

大模型发布前，儿童场景的交互最少；而现在儿童场景的交互次数增长了7倍以上。孩子们乐于与机器人「聊天」，这正是AI进步的结果。

儿童专属陪伴，AI承包了

然而这其中就有一个难点：儿童的表达方式，是一种「童言幼语」，跟成人有很大区别。

对于每个孩子来说，吐字不清、语言结构简单，甚至缺乏逻辑，表达跳跃等，都是很常见的现象。

为此，科大讯飞基于儿童说话习惯，专门打造了童言识别和童语理解的儿童专属交互方案，帮助我们更好地理解儿童的表达。

它不光对话起来更有趣、更友好，还能以引导的方式和儿童对话。

这样，AI就深度适配了儿童的表达逻辑，做到了更懂孩子。

除了这些专属方案本身，科大讯飞还打造了许多寓教于乐的儿童内容。

在趣味对话上，他们打造了很多经典IP，深受孩子们的欢迎。

只要一句话，就能激发海量的IP人设。在对话中，它们会主动找话题，引导孩子造词，还能一起玩故事共创、猜谜语、脑筋急转弯等趣味游戏。

团队还为儿童打造了许多早教技能，包括语言发展技能、科学发展技能、社会能力认知技能等等，让孩子在趣味的交互中全面成长。

此外，他们还打造了专门面向儿童的趣味信源，包括儿童故事和儿童音乐。

大家非常关注的另一个话题，就是儿童心理健康。讯飞的儿童交互方案，正是以鼓励、夸奖的话术为主，帮助孩子建立自信心。

同时，对于可能发生的潜在风险，它也能给出及时、正确的引导。

儿童守护计划同步发布，让孩子们在AI的守护下健康成长

比如孩子在学校如果发生什么事情，可能回家不愿意和家长说，但会和机器去聊。这种情况下，AI就会对孩子出现情绪或行为问题进行积极正向的引导。

在风险格外严重的情况下，就会通知家长。

并且，此方案已经针对未成年保护内容进行了定向调优，为儿童打造了一个绝对纯净健康的交互环境。

看完下面这个视频，你就会明白，为什么孩子们这么喜欢跟科大讯飞的机器人聊天了。

更令人惊喜的是，科大讯飞还开发了玩具开发套件，接入便捷，配置成本低，适用于多种场景，如带屏玩具、无屏玩具、桌面机器人等。

而在大会现场，几位宝爸也参加了一个60分钟极速挑战，要求在几小时内开发出一个儿童应用。

在挑战中，每位「宝爸」会被分发一块硬件开发板，依托星辰Agent开发平台，在极短时间内构建出具备情绪识别与童趣对话能力的儿童交互Agent，为硬件注入智慧人格。

智能眼镜，和外国小姐姐丝滑交流

儿童语音交互之外，智能眼镜也是刚需的场景，是下一个通向人机交互的未来。

与头显不同的是，它的交互范式只能依赖语音。

为此，讯飞打造了一个专属「三麦阵列」方案，针对不同场景，做了定向训练。

三个麦克风的作用在于，识别语音输出是否是佩戴者发出，以及对话人的声音。

说这么多，不如看看「三麦阵列」智能眼镜实际效果如何？

现场演示中，工作人员戴上眼镜随口发问，「减肥期间，可以吃荔枝吗」？小飞立即给出回复，「荔枝热量糖分超高，过量易导致热量超高」，还给出了减肥建议。

这是语音交互的一个简单的例子。如果旅游的时候，遇到不懂的景点，直接交给这款智能眼镜。

工作人员拿起一张三星堆藏品图，问道「小飞小飞，这是什么」？

令人惊艳的是，从青铜大立人像细节，到历史背景，它给出了非常直观的回复，就如一个真·导游现场讲解。

出国旅游常遇到歪果仁，听不懂不会说又是一大难题。而现在，有了面对面翻译功能，任何人戴上智能眼镜就能切大号了。

外国小姐姐和工作人员交流非常丝滑，智能眼镜实时翻译，完全不卡壳。

有了这些实用功能，不论是交朋友，还是谈合作，贾维斯就不再是科幻。

随时随地，语音交互

今天，科大讯飞不仅实现了语音识别的极速响应，像和真人交流一样可随时「插话」的流畅体验，而且还能在嘈杂环境中保证语音交互的可靠性。

为了做到这一点，团队开发了从多麦克风阵列降噪收音到线性双麦、四麦、六麦的多模态降噪技术，还有专为户外移动场景降噪设计的3麦降噪方案，让AI能在各种噪声的环境中「耳聪目明」。

在机器轰鸣中，建筑工地的智能安全帽，清晰接收指令；骑行中的智能眼镜，过滤风声，准确识别「导航到最近咖啡馆」的需求；在人声鼎沸的机场，值机柜台旁的机器人客服能理解旅客查询——

这些曾经的技术难点，如今都已被攻克。

当AI学会「察言观色」

而语音智能最令人振奋的进步，莫过于从「能听会说」到「察言观色」的跨越。

如今的AI不仅能听懂字面意思，还能感知情绪、记忆偏好，甚至理解儿童独特的话语方式——机器正变得越来越像人。

基于千万高质对话数据训练，专为情感交互场景打造的「交互大模型」，让设备读懂气氛，「高情商」回应喜怒哀乐。

类人记忆系统与自定义角色，则赋予设备独特个性。

科大讯飞的「极速超拟人交互」技术更是将情感交互推向新高度，支持1300多种人设和情感语气自由切换。

系统会基于对历史话自动生成个性化知识库，实现「共同成长的陪伴」。

现代AI交互系统构建了三层记忆体系：

· 上下文记忆，保证对话连贯性；

· 用户画像记忆，存储长期偏好；

· 生活事件记忆，关联特定场景知识。

比如，当你在智能办公软件中输入「关于AI交互技术」时，系统会根据你过去的写作习惯，自动补全的应用前景分析。

这种记忆能力让AI从「通用助手」进化为「个人专属管家」。

全新语音背包，机器人秒变社交达人

有了AIUI，为什么还需要机器人超脑呢？

这是因为，机器人本身结构非常复杂，面对的场景更加复杂。而现实任务中，有些需要「具身智能」才能完成。

2022年，讯飞首次亮相「机器人超脑平台」，目标直指让机器人能听会说、能理解会行动。

时隔3年，在这个平台下，讯飞机器人生态呈现了繁荣景象。

「超脑平台」在端侧提供了视听融合解决方案，包括多模态降噪、人类识别、物体识别，还有软硬一体设计。

针对不同四轮、双足、轮式机器人多种形态，平台提供定制化了硬件交互。

而且，机器人往往会面对比较嘈杂、多人对话的场景。

为此，讯飞打造了多人多模态交互技术，语音+唇形+降噪分离结合，就可以精准识别。在三人场景下，语音分离率高达87%，识别准确率超90%。

另外，当遇到没有网络、弱信号的时，机器人在现实世界会遇到极大的挑战。

而现在，不用担心，讯飞离线交互套件一键解决，让所有交互、识别，都在端侧完成。

值得一提的是，讯飞大会上，机器人超脑平台带来了全新「智能语音背包」，让语音成为机器人标配。

只要把背包背在机器人身上，它就具备了张口对话的能力。

现场，产品经理一开口——小飞小飞，该你上场了，随即成功召唤宇树G1登台。

激情澎湃的G1挥着手臂，向台下观众打招呼，「各位科技大佬、酷炫玩家们，大家下午好，欢迎来到智能产品交互升级party」。

紧接着，它秀出了自己偷学的赛博朋克太极拳，一边演示，一边配着梗解释，言语之间非常流畅。

「这招叫WiFi信号满格，接着是代码运行顺畅，再来个数据精准无误，最后是系统永不宕机」。

不得不说，机器人有了这个「智能语音背包」的加持，能说会道，秒变社交达人。

此外，机器人超脑平台还带来了「具身智能训练一体机」。在针对特定任务训练时，从采集数据、训练，到推理是一个非常复杂的过程。

一体机最大优势在于，将这些过程在一台机器完成，能加速产业推广和应用。

如今，科大讯飞合作500多家机器人公司，在酒店服务、展厅展馆、汽车销售、智慧零售等领域，全面铺开。

移动数字人闪现，人类AI伙伴

人机交互，不仅局限于机器人实体，数字人也是下一个重要的分支。

这次大会现场的亮点，无疑就是一款全新的移动数字人——「小雨」了。

她的出现，可以说让全场掀起了最高潮。

不同于以前在大模型一体机或固定屏幕中的的数字人，它可以出现在导览场景，提供移动式的交互。

之所以能移动，是因为它的底座配有制图和路线规划的功能。

在现场，数字人「小雨」按照提前制作好的动线移动上台，和主持人进行了流畅自然的对话，引得了全场喝彩。

接下来，主持人还随机从场上摇上来一位嘉宾，小雨面对他的种种发问，面不改色，回答流利。

嘉宾对小雨的表现极为赞叹，表示非常期待在自己公司的展厅中，也能有这样一个对话流利丝滑的数字人。

大会上，科大讯飞还介绍了AI虚拟人交互平台。

凭借业界领先的多模态感知和生成技术，这个平台实现了「极简革命」，仅需一句话复刻声音、一张图生成数字分身，即可在82种语言场景中，「分钟级」创建虚拟形象。

目前，已有累积超100万声音复刻用户、10万数字分身资产，真正实现了「每人皆可拥有数字分身」的愿景。

讯飞的虚拟人，现在已经广泛应用于媒体、教育、政企、文旅等场景，甚至还面向个人用户提供轻量化的定制方案。

通过超拟人技术，每个企业和个人，都可以快速构建自己的数字分身了。

只要一句话，大模型就能复刻声音；只要一张图，就能构建超拟人数字人。

在现场，工作人员就用讯飞智作，迅速复刻了科大讯飞赵总的声音，制作出了他的数字分身——小赵总。

厉害的是，它不仅声音非常还原，还能支持中、日、英、韩、俄等多种语言。

而数字人的样貌，也同样可以定制。一眨眼的时间，讯飞智作就生成了小赵总的商务版数字人。

「他」不仅声音跟赵总一模一样，说起外语来也是6到飞起。

在AI虚拟人交互平台上，科大讯飞提供了全栈的数字人应用服务，包括丰富的资产构建方式、可自由集成的免费API、能灵活应用的零代码SaaS、可开箱即用的软硬件套装等。

爆火Agent，一键定制专属应用

发布会另一个重点，便是讯飞大模型平台——星辰Agent。

人们都说，2025年是Agent元年。当前，Agent已成为开发应用的一个重要的方式，大幅降低了开发门槛。

星辰Agent是一个一站式定制开发平台，可以完成从Agent开发、应用测评，到可控发布、运营迭代所有流程，还包含了RAG等专业工具。

对于开发者来说，应用开发时间大幅缩短，效率倍增。

会上，讯飞正式面向企业，发布了星辰Agent平台专业版。

它能提供高并发、高容量的优享资源，还支持效果评测、团队协作、1V1定制服务。

多款智能体应用已在星辰Agent平台上线

讯飞产品经理丁瑞演示demo中，针对深圳进出口贸易报关，一项非常繁杂的任务——从发票、运单中提取报关所需要的信息，开发了一个智能体。

由于这个智能体任务复杂，需要从星辰创建一个高阶工作流，选用图片文字抽取模版。

惊艳的是，平台直接给出了一套完整的流程，只需将图片、提示、定义抽取字段等所需信息填入即完成。

接下来，上传一个报关单发票，结构比较复杂，让Agent提取信息，从OCR识别、大模型解析，到抽取信息，非常快速地完成了任务。

C端B端，全面称雄

过去15年，正是AI飞速发展的15年，也是科大讯飞开放平台，迅速发展的15年：

2010年，发布了业界首个语音云，正式拉开语音时代的帷幕。随后花了3~5年时间推动语音输入的普及；

2015年，推出首个AI人机交互界面——AIUI；

2021年，发布虚拟人；

2022年，推出机器人超脑；

2023年，迈入了大模型时代，发布「星火大模型」。

大模型的到来，带来了哪些变化？

如今，大模型浪潮驱动开发者高质增长，讯飞生态合作伙伴已超1152万，遍布了日韩、新加坡、中东、欧洲等地，构建出全球领先的AI开放生态。

值得一提的是，机器人、智能办公、穿戴领域开发者翻倍，数字人创作量激增16倍，人均交互频次提升6.5倍。

显而易见的是，大模型时代下，交互范式正加速变革。

在技术研发上，科大讯飞早有多项突破：

· 2008年，首次让机器的语音合成超过普通人说话水平；

· 2012年，首次让机器的语音评测超过人类专家水平；

· 2015年，首次让机器的语音识别超过人类速记员水平。

之后，科大讯飞创立了国内「历史上的首次」：

· 2017年，「智医助理机器人」首次通过国家执业医师资格考试综合笔试测试，并超过96.3%的人类考生；

· 2018年，首次让机器翻译的中英语音翻译达到CATTI全国翻译专业资格（水平）考试二级合格标准；

· 2022年，在OpenBookQA知识推理挑战赛中，首次单模型超过人类平均水平；

在To B/To G领域，早在2024年，科大讯飞就已做到了多个行业第一。

根据Xsignal奇异因子报告数据，科大讯飞旗下已有三款应用成功突破百万月活大关，分别是讯飞星火（APP 端）、讯飞AI学（APP 端）和讯飞晓医（APP端）。

其中，讯飞星火APP在中国APP端AI应用排行榜中位列第7，跻身通用大模型赛道的Top5。

AI时代，人机交互应该是什么样？这场大会，讯飞给出了最好的答案——AIUI。

正如科大讯飞董事长刘庆峰所言：「语音，将成为万物互联时代的主要交互方式」。

当下，智能语音若要走进多场景应用，机器人恰是将这些交互，拉进现实最重要的一步。

从儿童专属交互方案、AI智能眼镜「三麦阵列」，到机器人语音背包，再到移动虚拟数字人，我们已经看到了下一个人机交互的未来。

阅读原文

跳转微信打开

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

新智元报道

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签