IT之家 05月31日 11:38
谷歌 DeepMind 最强 AI 手语翻译模型:SignGemma 登场,打破手语沟通壁垒
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌DeepMind团队发布了SignGemma,这是一款先进的手语翻译模型,可以将手语转化为口语文本。该模型是Gemma家族的新成员,目前主要针对美国手语(ASL)和英语进行了优化,并计划开源。SignGemma旨在帮助手语使用者在工作、学习和社交中更顺畅地交流。此外,谷歌还推出了Gemma 3n模型、DolphinGemma模型和MedGemma模型,分别用于多模态文本生成、海豚声音分析和医疗AI应用,展现了谷歌在人工智能领域的多元化发展。

🗣️SignGemma是谷歌DeepMind推出的最强大的手语翻译模型,能够将手语翻译成口语文本。

🌐该模型支持多语言功能,但目前主要针对美国手语(ASL)和英语进行了深度优化,计划开源。

💡SignGemma旨在帮助手语使用者打破沟通障碍,促进他们在工作、学习和社交中的参与。

🐬DolphinGemma模型与佐治亚理工学院及Wild Dolphin Project合作,分析并生成海豚声音,基于海豚的长期研究数据构建。

🩺MedGemma模型是Gemma 3家族新成员,聚焦医疗AI,支持临床推理和医学影像分析,加速医疗与人工智能的融合创新。

IT之家 5 月 31 日消息,谷歌 DeepMind 团队于 5 月 27 日宣布推出 SignGemma,是其迄今为止最强大的手语翻译模型,可将手语转化为口语文本,该开源模型将于今年晚些时候加入 Gemma 模型家族。

IT之家注:SignGemma 模型支持多语言功能,但目前主要针对美国手语(ASL)和英语进行了深度优化,开源属性意味着开发者可以自由使用并改进它。

DeepMind 希望通过这一技术,打破手语使用者在沟通上的障碍,让他们在工作、学习和社交中更顺畅地参与。

DeepMind 今年还推出 Gemma 3n 模型,支持从音频、图像、视频及文本输入生成智能文本,助力开发者打造实时互动应用。

此外,谷歌还与佐治亚理工学院及 Wild Dolphin Project 合作,推出 DolphinGemma 模型,分析并生成海豚声音,基于巴哈马大西洋斑点海豚的长期研究数据构建。

同时,MedGemma 模型作为 Gemma 3 家族新成员,聚焦医疗 AI,支持临床推理和医学影像分析,加速医疗与人工智能的融合创新。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

SignGemma 手语翻译 DeepMind Gemma 人工智能
相关文章