IT之家 04月11日 18:28
Rokid Glasses AR+AI 眼镜最新研发进展:提词器翻页自动匹配语速,告别遥控戒指
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Rokid研发团队提交‘一种基于智能算法的提词器功能’专利,解决传统提词系统诸多痛点,可根据演讲者语速和节奏自动匹配文稿。

🎤传统提词器交互方式存在诸多痛点,如分散注意力、节奏僵化等。

💡Rokid新专利通过三项核心技术构建智能提词系统,包括多模态语音识别引擎、动态语速适配算法、多场景演讲匹配算法。

🌟该专利的多模态语音识别引擎具有方言兼容性、抗干扰能力等创新之处;动态语速适配算法可实时追踪语速并具备弹性缓冲机制;多场景演讲匹配算法能满足全方位交互需求。

IT之家 4 月 11 日消息,Rokid Glasses AR+AI 眼镜于去年 11 月发布,用户通过戒指的轻触即可控制提词翻页。

然而,这种看似炫酷的交互方式仍存在诸多痛点:手动操作分散注意力、固定翻页节奏僵化、演讲者过度依赖提词器等问题。

基于这些使用痛点,Rokid 研发团队宣布近日提交了一份“一种基于智能算法的提词器功能”的专利,可以根据演讲者的语速和演讲节奏自动匹配文稿。其核心技术在于将演讲者的语言表达与文稿滚动实现无缝同步,解决了传统提词系统的顽疾。

Rokid 介绍称,在演讲场景中,提词器的交互方式长期受限于三种模式:手动触控、物理遥控器、固定定时滚动。尽管这些方案在特定场景下有效,但其局限性日益凸显:

IT之家从公告获悉,Rokid 的新专利通过三项核心技术构建了智能提词系统:

1. 多模态语音识别引擎系统采用端到端的深度神经网络模型,可实时解析演讲者的语音内容。其创新之处在于:

2. 动态语速适配算法该算法构建了“语速-文本密度”的动态映射模型:

3. 多场景演讲匹配算法多场景匹配算法结合,满足演讲场景的全方位交互需求

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Rokid 智能提词器 演讲交互 核心技术
相关文章