谷歌 DeepMind 最强 AI 手语翻译模型：SignGemma 登场，打破手语沟通壁垒

IT之家 05月31日 11:38

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

谷歌DeepMind团队发布了SignGemma，这是一款先进的手语翻译模型，可以将手语转化为口语文本。该模型是Gemma家族的新成员，目前主要针对美国手语（ASL）和英语进行了优化，并计划开源。SignGemma旨在帮助手语使用者在工作、学习和社交中更顺畅地交流。此外，谷歌还推出了Gemma 3n模型、DolphinGemma模型和MedGemma模型，分别用于多模态文本生成、海豚声音分析和医疗AI应用，展现了谷歌在人工智能领域的多元化发展。

🗣️SignGemma是谷歌DeepMind推出的最强大的手语翻译模型，能够将手语翻译成口语文本。

🌐该模型支持多语言功能，但目前主要针对美国手语（ASL）和英语进行了深度优化，计划开源。

💡SignGemma旨在帮助手语使用者打破沟通障碍，促进他们在工作、学习和社交中的参与。

🐬DolphinGemma模型与佐治亚理工学院及Wild Dolphin Project合作，分析并生成海豚声音，基于海豚的长期研究数据构建。

🩺MedGemma模型是Gemma 3家族新成员，聚焦医疗AI，支持临床推理和医学影像分析，加速医疗与人工智能的融合创新。

IT之家 5 月 31 日消息，谷歌 DeepMind 团队于 5 月 27 日宣布推出 SignGemma，是其迄今为止最强大的手语翻译模型，可将手语转化为口语文本，该开源模型将于今年晚些时候加入 Gemma 模型家族。

IT之家注：SignGemma 模型支持多语言功能，但目前主要针对美国手语（ASL）和英语进行了深度优化，开源属性意味着开发者可以自由使用并改进它。

DeepMind 希望通过这一技术，打破手语使用者在沟通上的障碍，让他们在工作、学习和社交中更顺畅地参与。

DeepMind 今年还推出 Gemma 3n 模型，支持从音频、图像、视频及文本输入生成智能文本，助力开发者打造实时互动应用。

此外，谷歌还与佐治亚理工学院及 Wild Dolphin Project 合作，推出 DolphinGemma 模型，分析并生成海豚声音，基于巴哈马大西洋斑点海豚的长期研究数据构建。

同时，MedGemma 模型作为 Gemma 3 家族新成员，聚焦医疗 AI，支持临床推理和医学影像分析，加速医疗与人工智能的融合创新。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签