国际最新研发一种人工智能模型 能即时翻译101种语言
创始人
2025-01-16 22:37:09
0

  中新网北京1月16日电 (记者 孙自法)国际知名学术期刊《自然》最新发表一篇人工智能研究论文称,研究人员研发出一个人工智能(AI)模型,能即时翻译多达101种语言的语音和文本,包括直接语音到语音翻译。

  这款名为SEAMLESSM4T的人工智能模型,填补了语言覆盖方面的空白,并且性能优于现有的系统。研究团队说,本项研究工作或可为快速通用翻译铺平道路,其资源公开可用(用于非商业用途),以协助进一步研究包容性语音翻译技术。

  该论文介绍,科幻小说的读者可能很熟悉《银河系漫游指南》里的“巴别鱼”,这种小鱼能侵入耳朵,即时将一种口语翻译成另一种口语。类似“巴别鱼”的这种工具对于促成全球互联环境下的交流非常有用,但大多数现有的机器学习翻译系统都是文本导向,或者需要语音识别、翻译成文本、再将文本转换成语音好几步。此外,现有语音到语音模型的语言覆盖范围也远低于文本到文本的模型,并且倾向于从源语言翻译成英语,而非从英语到另一种语言。

  为了解决这些限制,在本项研究中,美国Meta基础人工智能研究的“无缝交流团队”开发出一个单一模型SEAMLESSM4T,其支持多达101种语言之间的多种翻译模式,可以支持语音到语音(识别101种语言并翻译为36种语言)、语音到文本(101种语言译为96种)、文本到语音(96种语言译为36种)、文本到文本(96种语言)的翻译,以及自动语音识别(96种语言)。

  研究团队表示,在语音到语音的翻译中,SEAMLESSM4T的文本翻译比现有系统准确率提升23%。同时,该人工智能模型可过滤背景噪音并适应说话者的差异。

  《自然》同期发表同行专家的“新闻与观点”文章指出,虽然后续还需要进一步优化,但人工智能模型SEAMLESSM4T可能代表着向跨越语言障碍促进交流的进步。(完)

相关内容

热门资讯

京津冀少年儿童2025新年音乐...   中新网天津12月30日电 (记者 王君妍)为加强京津冀区域校外教育共同体建设,促进美育活动的交流...
广东广州:云萝植物园开园迎客 11月29日,广东广州,云萝植物园正式开园,游客在园区远眺广州塔等城市景观。中新社记者 陈楚红 摄 ...
青海:民众观日出迎接乙巳蛇年 1月29日,大年初一,民众前往青海省海南藏族自治州贵德县境内的拉脊山顶,迎接乙巳蛇年第一个日出。拉脊...
(新春见闻)新疆少年乐队以国风...   中新社新疆奇台1月31日电(胡嘉琛)“月影羌笛怨秋风,耿恭疏勒入梦中……”14岁的包梓默手指在琴...
2024年三亚国际游艇展开幕 图为一款名为“鲛子”号载人潜水器亮相展览现场。中新社记者 骆云飞 摄 图为展出的游艇停靠在三亚国际...
沈阳“文旅之王”大篷车开启冬季... 图为工作人员在给市民介绍在大篷车里众多的特色文创产品。中新社记者 于海洋 摄 图为工作人员在给市民介...
重庆民众解放碑听跨年钟声迎新年 2025年1月1日,重庆解放碑步行街,上万民众齐聚于此,聆听新年钟声,记录跨年瞬间,共同迎接2025...
2024年11月末广义货币(M...   中新网12月13日电 据中国人民银行官方微信消息,中国人民银行发布2024年11月金融统计数据报...
四川邛崃:大同古镇摆起“长街宴... 图为传菜师傅端着丰富的菜品吸引游客拍照。中新社记者 王磊 摄图为游客在长街宴上拍照。中新社记者 王磊...