IT之家 02月21日
Figure AI 人形机器人多模态能力升级:“听懂”语音指令轻松将食物放进冰箱
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Figure AI公司发布了名为Helix的新型人工智能系统,旨在通过语音命令让人形机器人执行复杂动作。该系统结合多模态语言模型和AI动作转化模块,实现机器人对物体的识别和精准抓取,无需针对每个物体进行专门训练。Helix系统仅需500小时训练数据,依靠机器人内置的GPU运行,具备商业应用可行性。该系统的发布被认为是家用机器人规模化的重要一步,并展示了其在实际环境中轻松适应新情境的能力。尽管如此,其在实际应用中的表现仍有待进一步验证。

🤖 Figure AI推出Helix系统,通过结合70亿参数的多模态语言模型和8000万参数的AI动作转化模块,使人形机器人能够响应语音命令并执行复杂动作。

🗣️ Helix系统能够以7-9赫兹的频率处理语音和视觉信息,充当机器人的“大脑”,同时以高达200赫兹的频率将语言模型发出的指令转化为精确的机器人动作,控制35个自由度。

🍳 通过演示视频展示,机器人无需为特定物体进行预先训练,即可在展示厨房中合作将食物放入冰箱,体现了Helix系统在处理不同物体方面的灵活性。

⏱️ Helix系统仅需500小时的训练数据,远低于同类项目,并且依靠机器人内置的嵌入式GPU运行,使其在商业应用上更具可行性。

IT之家 2 月 21 日消息,机器人初创公司 Figure AI 今日推出了一种名为 Helix 的新型人工智能系统,能够让人形机器人通过语音命令执行复杂的动作。该系统旨在让机器人无需针对每个物体进行专门训练,就能轻松处理不同物体

Helix 系统结合了两个关键的人工智能模块。第一个模块是一个拥有 70 亿参数的多模态语言模型,能够以 7 至 9 赫兹的频率处理语音和视觉信息,充当机器人的“大脑”。第二个模块则是一个拥有 8000 万参数的 AI,负责将语言模型发出的指令转化为精确的机器人动作,频率高达 200 赫兹。

Helix 能够同时控制 35 个自由度,涵盖了从单个手指动作到头部、躯干等多个部分的精细控制。Figure 通过一系列展示机器人如何响应语音命令、识别物体并精准抓取的演示视频,展示了该系统的强大能力。

官方公布的演示视频中,两台机器人在一个展示厨房中合作,将食物放入冰箱,且全程无需为这些物体进行任何特定的预先训练。

Helix 系统只需 500 小时的训练数据,远低于同类项目的要求。它依靠机器人内置的嵌入式 GPU 运行,这使得该技术在商业应用上具备了可行性。

Figure 的首席执行官 Brett Adcock 表示,Helix 的出现对家用机器人规模化至关重要。与传统机器人每次执行新任务都需要重新编程不同,Helix 能够轻松适应新的情境 —— 虽然它在实际应用中的表现还需要进一步验证。

据IT之家此前报道,Figure AI 近期结束了与 OpenAI 在机器人专用 AI 模型方面的合作,尽管 OpenAI 仍是其重要投资方。Adcock 在社交平台 X 上表示,虽然大型语言模型(LLM)越来越强大,但它们正变得商品化,且在 Figure 的战略中只占“最小的一部分”。

目前,Figure 专注于开发自己的 AI 模型,旨在实现高速度的机器人控制,特别是在实际环境中的应用。同时,OpenAI 重新开始招募硬件工程师,以组建新的机器人团队,而此前其机器人部门已被关闭。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Figure AI Helix系统 人形机器人 人工智能 机器人控制
相关文章