您的位置:首页 > 互联网

Meta 发布多语言语音翻译模型 SeamlessM4T:可翻译多达 100 种语言、语音或文本

发布时间:2023-08-23 15:14:16  来源:互联网     背景:

8月23日消息:周二,Meta 宣布推出 SeamlessM4T,一种用于语音和文本翻译的多模态人工智能模型。作为一种能够处理文本和音频的神经网络,它可以执行文本到语音、语音到文本、语音到语音和文本到文本的翻译,支持「最多 100 种语言」,Meta 表示,它的目标是帮助说不同语言的人更有效地交流。

369889300_946056619819708_693331134612217694_n.jpg

图片来自Meta

继续 Meta 相对开放的人工智能方法,它正在以研究许可(CC BY-NC 4.0)的形式发布 SeamlessM4T,允许开发者在此基础上进行开发。他们还发布了 SeamlessAlign,Meta 称之为「迄今最大的开放式多模式翻译数据集,总共挖掘了 270,000 个小时的语音和文本对齐」。这将有可能启动其他研究人员训练未来翻译人工智能模型的过程。

在 Meta 的博客中宣传的 SeamlessM4T 的特性中,该公司表示该模型能够执行语音识别(将语音转换为文本)、语音到文本翻译(将口语音频翻译为不同语言的文本)、语音到语音翻译(提供语音,输出翻译后的语音)以及文本到文本翻译(类似于 Google 翻译的功能)和文本到语音翻译(提供文本,将其翻译并以另一种语言呈现出来)。每个文本翻译功能支持将近 100 种语言,语音输出功能支持大约 36 种输出语言。

在 SeamlessM4T 的公告中,Meta 提到了 Babel Fish, 一种虚构的鱼,来自道格拉斯·亚当斯经典的科幻小说系列《银河系漫游指南》,它可以立即翻译任何口头语言:

构建一个像银河系漫游指南中虚构的 Babel Fish 一样的通用语言翻译器是具有挑战性的,因为现有的语音到语音和语音到文本系统只覆盖了世界上语言的一小部分。但我们相信,我们今天宣布的工作在这一旅程中是向前迈出的重要一步。

它们是如何训练的?根据 Seamless4MT 研究报告,Meta 的研究人员「创建了一个多模式语料库,其中含有自动对齐的超过 470,000 个小时的语音翻译,称为 SeamlessAlign」(在前面已经提及)。然后,他们「使用人工标注和伪标注数据对这个语料库的一个子集进行了筛选,总计 406,000 个小时」

iphone12像素4800万

长城汽车公司最畅销的车型

与往常一样,Meta 对其训练数据的来源有些含糊。文本数据来自「与 NLLB 中部署的相同数据集」(从维基百科、新闻来源、脚本演讲和其他来源中提取的句子组成,由专业人员翻译)。根据研究论文,SeamlessM4T 的语音数据来自「400 万小时的原始音频,来源于一个公开可用的网络数据库」,其中 100 万小时是英语。Meta 没有具体说明使用哪个存储库或音频剪辑的出处。

Meta 远非第一家提供机器学习翻译工具的人工智能公司。Google 翻译自 2006 年以来就使用机器学习技术,大型语言模型(如 GPT-4)以其在语言之间的翻译能力而闻名。但是,在音频处理方面,最近这项技术变得非常热门。在九月份,OpenAI 发布了自己的开源语音到文本翻译模型,名为 Whisper,它可以在音频中识别语音并将其翻译成文本。

iphone12出现异常

SeamlessM4T 扩展了多语言翻译的趋势,并且 Meta 表示 SeamlessM4T 的「单一系统方法」——一个单一的人工智能模型而不是多个模型组合在一条链上(类似于 Meta 之前的一些音频处理技术)——减少了错误,增加了翻译的效率。

关于 SeamlessM4T 如何运作的更多技术细节可以在 Meta 的网站上获得,其代码和权重(实际训练的神经网络文件)可以在 Hugging Face 上找到


返回网站首页

本文评论
Cloudflare 针对 AI安全问题推出零信任安全控制套件_零信任 数据安全
5月16日 消息:日前,美国 CDN 服务商 Cloudflare 宣布推出零信任安全控制套件 Cloudflare One for AI。腾讯的战略该工具可帮助企业安全、可靠地使用最新的生成式人工智能工具...
日期:05-16
网易暴雪走向决裂的最后一谈:两个高价续约条件,抄袭IP和裁员争议
  记者/范佳来  实习生/姜霁轩  伴随魔兽巨斧的轰然倒塌,网易和暴雪的十四年“婚姻”终于以最不堪的姿态走向破裂。;  暴雪绿茶、暴雪没有心、暴雪绿茶小趴菜......1...
日期:01-19
赛道狂飙国家永恒「一个疯狂赛道爆发:3年从0干到28.68亿」
声明:本文来自于微信公众号 铅笔道(ID:pencilnews),作者:铅笔道,授权转载发布。这真是个超级赚钱赛道。还记得2020年火爆的“9块9财商课”吗?在那时,一位投资人便向铅笔道透露,已...
日期:12-30
河南电动汽车迎来“畅跑时代”:高速服务区充电桩覆盖80% 年底100%
去年国庆假期不少电动车主在高速服务区遭遇的充电排长队尴尬,如何让新能源汽车出得了城、下得了乡?备受关注。日前,河南省出台相关方案,加快推进公路沿线充电基础设施建设,将进一...
日期:10-04
赛门铁克推出Android杀软 iPhone无需使用
  6月5日消息,据国外媒体报道,赛门铁克日前表示,很快将针对Android智能手机操作系统推出杀毒软件,而iPhone则无需使用。   赛门铁克称,将很快推出Android杀毒软件测试版,主要...
日期:07-29
加强上市公司信息披露_中国海外上市企业应当加强信息披露 增强投资者信心
  获取中国海外上市企业财务信息困难已成为这些公司的主要问题之一,在此问题上中国公司需要进一步开放态度。   美国证券交易委员会(The Securities and Exchange Commi...
日期:07-30
Meta高管:明年将继续向元宇宙投入20%的成本_Meta元宇宙
12月20日消息,据国外媒体报道,尽管Meta元宇宙战略引发争议,美国当地时间周一,Meta首席技术官发文,宣布其在2023年仍将继续将总支出成本的20%用于Reality Labs。极米投影仪H3S谷歌...
日期:12-20
三翼鸟场景品牌无缝体验「在毛坯房里发布:三翼鸟启动“万家筑巢”」
见过在鸟巢开发布会的流光溢彩、见过在长城开发布会的巍然壮阔、也见过在东方明珠开发布会的绚丽璀璨,可你见过开在毛坯房里的发布会吗?6 月 3 日上午,杭州滨江区开始释放初夏...
日期:06-06
小米的光圈怎么调「小米13 Ultra可变光圈能晃动?小米王化科普:正常物理现象」
快科技4月23日消息,小米新一代影像旗舰小米13 Ultra目前已全渠道开售,该机也是首款一英寸可变光圈的小米手机,主摄光圈值能在f/1.9-f/4.0两挡之间切换。日前,有部分用户发现晃动...
日期:04-23
隐私计算技术「隐私计算编年史」
“一个民族,千百万人里面才出一个天才;人世间数百万个闲暇的小时流逝过去,方始出现一个真正的历史性时刻,人类星光璀璨的时辰。”——斯蒂芬·茨威格《人类群星闪耀时》隐私计算...
日期:07-27
B站被中超公司起诉侵权 此前曾被NBA起诉_哔哩哔哩中超
凤凰网科技讯 6月16日消息,据天眼查App显示,近日,中超联赛有限责任公司与上海幻电信息科技有限公司、上海宽娱数码科技有限公司著作权权属、侵权纠纷案新增开庭公告,原告为中超...
日期:06-16
山东00后男生保送清华:不做数学题就难受
5月19日消息,据山海视频报道,山东济南高三学生杨洲被清华大学预录取。杨洲介绍,数学是他特别擅长和热爱的科目,三天不学数学会很难受,会觉得一切没有了乐趣。芯片缺货导致汽车价...
日期:05-20
美股阿里巴巴股价大涨「美股周一:三大股指涨跌不一,阿里巴巴跌近1%,拼多多跌3%」
3月28日消息,美国时间周一,美股收盘主要股指涨跌不一,以科技股为主的纳指下跌。投资者对银行业危机蔓延的担忧得到缓解,但科技股在上周反弹后大幅下挫。道琼斯指数收于32432.08...
日期:03-28
能赚钱的音频软件「这些赚钱的APP,选择全球音视频社交市占率超60%的声网」
声明:本文来自于微信公众号 白鲸出海(ID:baijingapp),作者:辛童,授权转载发布。也是泛娱乐开发者对实时音视频传输技术的需要,传输质量更高、传输速度更快、并发处理能力更强。北...
日期:05-26
科大讯飞AI+医疗全科辅助诊断 为患者全面管理健康_科大讯飞辅助诊疗系统
  8月30日,在2019人工智能世界大会上,科大讯飞智慧医疗事业部总裁陶晓东表示,AI可以辅助医生为患者做全面的健康管理。在这过程中,科大讯飞智医助理可以为医生提供全科辅助诊...
日期:12-02
辛选启动“辛火计划”,西安专场带货销售额超5000万
7月25日消息,近日,辛选集团创始人辛巴辛有志正式启动“辛火计划”。据悉,这是一个助力乡村振兴、经济回暖的行动计划。抖音pk欢迎光临小米5 flyme7月23日,“辛火计划”第一站落...
日期:08-27
苹果推出启动更快笔记本 售价999美元(苹果笔记本最新款上市时间)
  5月19日消息,据国外媒体报道,是否因苹果不到1000美元的电脑没有参加上个月的公众见面会而感到郁闷?不用着急,苹果在周二早些时候发布了一款处理器速度更快,图形加速和电池性...
日期:07-29
如何买到放心二手车?大搜车家选为市场提供新模板(大搜车推出二手车新零售平台)
  汽车市场长达28年之久的上涨局面在去年被打破,也就是从去年开始汽车市场上的新车开始出现卖不动的情况。新车销售量下降,私家车保有量持续走高,说明市场已经有了一定的变...
日期:12-21
AI聊天机器人ChatGPT爆火,它真的靠谱吗?(附ChatGPT官网入口)
12月5日 消息:近日,美国OpenAI公司发布了一种名为 ChatGPT 的新语言模型,这个AI机器人不仅可以模仿人类对话,甚至还可以写故事、写理论性论文等等,有人称之为目前市面上最会聊天...
日期:12-08
董明珠在格力什么职位「董明珠称格力研发人员全部来自中国高校」
10月9日消息,格力电器董事长董明珠近日在接受媒体采访时谈到研发团队,她表示,格力是非常特殊的一个企业,没有外资、没有外国所谓的国际人才,格力所有的一万几千个研发人员全部来...
日期:10-12