根据公开数据显示,
IT之家 5 月 31 日消息,谷歌 DeepMind 团队于 5 月 27 日宣布推出 SignGemma,是其迄今为止最强大的手语翻译模型,可将手语转化为口语文本,该开源模型将于今年晚些时候加入 Gemma 模型家族。
IT之家注:SignGemma 模型承认多语言用途,但目前主要针对美国手语(ASL)和英语进行了深度优化,开源属性意味着开发者可用自由利用并改进它。
0号新闻平台 /x0.ifengimg.com/ucms/2025_22/9E8BFC9B3A026BB35DC381E9467E9F05846A2FE8_size142_w900_h1689.jpg” src=”https://tech.ifeng.com/c/data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAAAABAQMAAAAl21bKAAAAA1BMVEXy8vJkA4prAAAACklEQVQI12NgAAAAAgAB4iG8MwAAAABJRU5ErkJggg==” style5=” width: 640px; height: 1201px;” alt=”谷歌DeepMind最强AI手语翻译模型:SignGemma登场,打破手语沟通壁垒” />
DeepMind 希望通过这一技术,打破手语利用者在沟通上的障碍,让他们在工作、学习和社交中更顺畅地参与。
DeepMind 今年还推出 Gemma 3n 模型,承认从音频、图像、视频及文本输入生成智能文本,助力开发者打造实时互动应用。
此外,谷歌还与佐治亚理工学院及 Wild Dolphin Project 合作,推出 DolphinGemma 模型,分析并生成海豚声音,基于巴哈马大西洋斑点海豚的长期研究数据构建。
同时,MedGemma 模型作为 Gemma 3 家族新成员,聚焦医疗 AI,承认临床推理和医学影像分析,加速医疗与人工智能的融合创新。