您的位置:首页 > 互联网

亚马逊发布其有史以来最大的文本转语音模型 BASE TTS_亚马逊平台语言要求

发布时间:2024-02-18 16:15:47  来源:互联网     背景:

划重点:

⭐️ 亚马逊 AGI 团队发布了有史以来最大的文本转语音模型,具有最多的参数和最大的训练数据集。

⭐️ 新模型名为 BASE TTS,拥有980亿参数,使用了10万小时的录音数据进行训练,主要是英语。

亚马逊alexa语音

⭐️ 该团队计划将 BASE TTS 用作学习应用,以改进文本转语音应用的人类声音质量。

2月18日 消息:亚马逊 AGI 的人工智能研究团队宣布开发了他们所描述的有史以来最大的文本转语音模型。所谓最大,是指拥有最多参数并使用最大训练数据集。他们在 arXiv 预印服务器上发布了一篇论文,描述了该模型的开发和训练过程。

亚马逊的文字

与 ChatGPT 等大型语言模型(LLMs)因其人类化的智能回答问题和创建高水平文档的能力而备受关注不同,人工智能正在逐步应用于其他主流应用。在这一新尝试中,研究人员试图通过增加模型参数的数量和扩充训练基础来改进文本转语音应用的能力。

特斯拉一个月退车

这一新模型被称为 Big Adaptive Streamable TTS with Emergent abilities(简称为 BASE TTS),拥有98亿参数,并使用了10万小时的录音数据进行训练,其中大部分是英语。该团队还为其提供了其他语言中已知短语的口语单词和短语示例,以使模型在遇到这些短语时能够正确发音,比如 “au contraire” 或 “adios, amigo”。

特约龙套 吃鸡什么意思

塔城文旅集团

亚马逊团队还在较小的数据集上对模型进行了测试,希望了解模型何时会出现所谓的新兴特性,即人工智能应用,无论是 LLM 还是文本转语音应用,突然似乎突破到更高层次的智能。他们发现,对于他们的应用程序来说,新兴特性出现在拥有1.5亿参数时。

他们还指出,这种飞跃涉及一系列语言属性,例如使用复合名词,表达情感,使用外语词汇,应用语音附加语和标点,以及在句子中将重点放在正确的单词上提出问题。

该团队表示,他们不会向公众发布 BASE TTS,因为他们担心它可能被不道德地使用,而是计划将其用作学习应用。他们希望应用他们迄今为止所学到的知识,以改进文本转语音应用程序的人类声音质量。

华为十月会员日

论文网址:https://dx.doi.org/10.48550/arxiv.2402.08093


返回网站首页

本文评论
配备5080mAh电池+67W快充 「Redmi」-Note 12T Pro再预热「红米note最高支持多少快充」
日前,Redmi官方正式官宣了全新的Redmi Note 12T Pro,将在今天上午10点开启预售,其最大的亮点之一就是将采用一块满配的LCD屏幕,搭载上周发布的小米Civi 3的同款芯片天玑8200-Ult...
日期:09-16
电视开机广告怎么取消?_取消电视开机广告,为啥这么难?
  最近,上海市消保委督促当地运营商解决电视机机顶盒开机广告问题,上海电信已经承诺了,3个月内要上线“跳过广告”功能,移动慢一点,但是今年年内也能实现。少看30秒广告,广大网...
日期:09-15
智慧场景助益智慧城市落地 航班管家提供智慧出行服务_智慧出行系统
  基于新基建大背景,智慧场景服务行业范围不断扩大。5G、AI、云计算等技术的不断发展,推动智慧场景服务蓬勃发展。在未来,智慧场景服务将更加普及,更加人性化、智慧化与多样...
日期:07-10
中文医疗大模型仲景 某些场景接近专业医生水平
8月16日 消息:最近,以 ChatGPT 为代表的大型语言模型在许多领域取得了令人瞩目的表现。然而,由于医学等领域的复杂性和专业性,这些模型在特定领域(如医学)的表现相对较差。虽然已...
日期:08-16
谷歌「Alpha」家族再填新成员AlphaDev 将排序算法提速70%「谷歌alphafold2」
6月8日 消息:谷歌DeepMind最新研究成果让人惊叹!今天,Alpha家族又迎来了一名新成员:AlphaDev。这款新算法不仅是整个计算机生态系统的基础,甚至可以颠覆传统排序算法。据称,它...
日期:06-08
鸿蒙3.0再次开启尝鲜招募 nova 8等机型在列_鸿蒙怎么升级nova8
中关村在线消息:近日,华为HarmonyOS 3再次开启了测试招募,以下7款机型可以申请Beta阶段测试:华为MatePad系列华为MatePad Pro 10.8英寸、华为MatePad Pro 10.8英寸 5G、华为Mate...
日期:10-11
中国最窄的领土,仅有8米宽,是连接我国海外飞地的唯一通道_我国最窄的城市在哪里
原创 | 河山历史 中国最窄的国土在哪里?有多窄?可能没有多少人知道。中国最窄的国土是吉林省珲春市通往敬信镇防川村的一条江堤路。路面仅宽8米,长888米。路的左侧是铁...
日期:12-03
同城零售中场战事:美团补供给,京东引流量(美团新供给)
小米最新无人机违反谷歌政策   现有市场的巨大存量,还没有让京东和美团进入剑拔弩张的地步,但彼此的渗透却已经开始。   文;|;董洁;编辑;|;乔芊   来源:36氪   零售在...
日期:08-16
微信上线“腾讯混元助手”多模态对话小程序 由腾讯混元大模型提供支持
9月6日 消息:今日,微信上线了一款名为“腾讯混元助手”的小程序,同时,“腾讯混元”公众号也正式上线。据小程序介绍显示,“腾讯混元助手”是腾讯混元大模型多模态对话Bot产品,可...
日期:09-06
甩掉几条街!鸿蒙系统比安卓强在哪_鸿蒙系统与安卓系统强多少
  华为鸿蒙系统在2019年8月9日正式发布,目前不少用户已经尝试了使用升级,体验度提升。   但是对使用安卓的用户来说,他们却产生了困惑,听说鸿蒙系统比安卓快60%,那么鸿蒙系...
日期:12-22
x700 杜比视界「X7系列将首发安卓全焦段4K杜比视界HDR视频拍摄 Find」
来源:中关村在线1688新灯塔考核指标OPPO宣布Find X7系列将首发安卓全焦段4K杜比视界HDR视频拍摄,提供跨越代际的视频拍摄体验革新。杜比视界是备受好莱坞顶级电影人青睐的电影...
日期:01-04
广告商正在重返Twitter?分析称现实并没有马斯克说的那么好
4月14日消息,埃隆·马斯克(Elon Musk)表示广告商正在重返Twitter,但多家公司的声明和市场研究公司的数据表明,复苏的速度并不如人意。本周,马斯克告诉英国广播公司BBC,大多数广告商...
日期:04-14
顺丰同城“双11”配送总单量超1.2亿 医药健康品类同比增长超250%
11月16日 消息:2022年双十一活动已经正式结束了,接下来要考验的就是物流配送端了。据顺丰同城方面的信息显示,顺丰同城在“双11”期间表现活跃,配送总单量超过1.2亿单。其中,双1...
日期:11-17
半入耳式佩戴+超28小时续航 荣耀亲选Earbuds X2双11超低折扣_荣耀耳机earbuds x1上市时间
  一年一度的双11狂欢节如约而至,数码电子产品推出的折扣让人无法抗拒,优惠力度是一波大于一波。为了让大家在双11买到心满意足的数码产品,今天给大家带来一款超值的好物推...
日期:04-22
上线四月叫好不叫座 超级网银遭遇推广难题(超级网银是什么渠道)
  “(超级网银的手续)挺麻烦的,要签几个银行的协议,而且我工资卡是工行的,水费电费得用工行网银交,一般金额较大的转账也习惯去柜台办,上网买东西有支付宝,超级网银对我来所真没...
日期:07-25
爱奇艺将全面接入百度文心一言  应用于内容搜索、内容创作工具
2月15日 消息:今日,百度宣布和爱奇艺宣布达成合作,爱奇艺将全面接入百度“文心一言”。爱奇艺成为全球首个接入生成式对话产品的长视频平台。苹果六plus现据悉,双方共同探索将A...
日期:02-15
沪上阿姨top「沪上阿姨旗袍图不雅?官方研判不违法 未妨碍公共秩序」
2月24日 消息:近日,“沪上阿姨旗袍包装图不雅的消息引发了网友热议。一位网友发帖称,在沪上阿姨的杯子外包装上,有一张女性穿着开叉到大腿根部的旗袍,而旗袍的后摆堆叠在椅子上...
日期:02-25
《诡秘之主》完结一周年克莱恩何时苏醒?作者爱潜水的乌贼表态了
  5月1日,在现象级网文《诡秘之主》完本一周年之际,官方发布了一个干货满满的VCR,作者爱潜水的乌贼感谢粉丝们的一路支持,并就粉丝们关注的一系列问题进行了回复。   其中...
日期:06-25
Nikola创始人米尔顿涉嫌诈骗误导投资者 被判入狱四年_米尔顿外围
12月19日消息,电动卡车公司Nikola创始人兼前首席执行官特雷弗·米尔顿(Trevor Milton)被判处四年监禁,陪审团认定他在公司技术方面误导投资者。米尔顿还被要求支付100万美元的罚...
日期:12-19
大超与白狼不可兼得_大超 白狼
网飞发表声明称,《狩魔猎人》续订第四季,英国演员亨利卡维尔(大超)退出该剧,他的角色由澳大利亚演员利亚姆-海姆斯沃斯(锤弟)接替。大超在社交平台上表示:扮演来自利维亚的杰洛特赋...
日期:11-02