您的位置:首页 > 互联网

阿里推声画同步框架EMO 1张图片加音频即可生成对口型视频

发布时间:2024-02-28 18:07:51  来源:互联网     背景:

要点:

  • 阿里提出了EMO框架,可根据单张图像和声音生成具有表情丰富的头像视频。

  • 方法包括两个主要阶段:帧编码和扩散过程,利用多种注意机制和时间模块实现头像生成。

  • EMO支持多语言歌曲和不同风格的头像生成,可应用于歌唱、对话和跨角色表演等领域。

2月28日 消息:近期,阿里巴巴智能计算研究所提出了一种新的生成式框架EMO,只需输入图片和音频即可生成具有表现力的视频,而且视频中的嘴型还可以与声音匹配。这项技术支持多语言、对话、唱歌以及快速语速的适配,但也可能成为造假的利器,因此一些名人可能需要警惕了。

该框架包含两个主要阶段,首先是帧编码阶段,利用ReferenceNet从参考图像和动作帧中提取特征;其次是扩散过程阶段,通过预训练的音频编码器处理声音嵌入,并结合多帧噪声和面部区域掩码来生成头像。在此过程中,采用了两种注意机制(参考注意和音频注意)和时间模块,以保持角色身份并调节运动速度。

糖猫词典笔对话翻译怎样使用

项目地址:https://top.aibase.com/tool/emo

EMO不仅支持多语言歌曲和不同风格的头像生成,还可以处理歌唱、对话等不同场景。它能够根据输入音频的长度生成不同时长的视频,并保持角色的身份特征在长时间内的稳定性。此外,EMO还展示了在快节奏音乐中保持与音频同步的能力,确保角色动画的表现力和动态性。

这一研究对于头像视频生成领域具有重要意义,为多语言、多样化场景下的角色表现提供了新的可能性。它不仅可以应用于娱乐产业,还可以在学术研究和教育培训等领域发挥重要作用。然而,需要注意的是,该框架目前仅用于学术研究和效果演示,还有待进一步优化和扩展其应用范围。


返回网站首页

本文评论
欧盟部门「欧盟内部市场专员:与谷歌CEO策划AI公约,在欧洲不许讨价还价」
2023/5/26 15:03 欧盟内部市场专员:与谷歌CEO策划AI公约,在欧洲不许讨价还价  蒋均牧 C114讯 北京时间5月26日下午消息(蒋均牧)谷歌首席执行官桑达尔·皮查伊(Sundar Pichai...
日期:05-27
智能教育机器人行业异军突起,智伴科技顺应时代趋势助力“教育革命”
  “人工智能+教育”自AIED发展以来逐渐成为AI赋能的热门行业,加之创新能力的不断提升,产业生态的形成,人工智能与实体经济融合的逐步深化,AIED俨然成为了改善现代教育的突破...
日期:02-08
英雄联盟神龙尊者小小卡莎限时回归 小小卡莎怎么解锁「神龙尊者卡莎手游」
英雄联盟中的【神龙尊者 小小卡莎】得到了很多玩家的喜爱,目前官方再次宣布【神龙尊者 小小卡莎】限时回归,很多玩家还不清楚怎么解锁,下面就来为大家分享一下。facebook赔偿亲...
日期:08-11
GitHub放大招!CEO现场挑战18分钟开发小游戏,人还在台上网友已经玩到了
声明:本文来自于微信公众号 量子位(ID:QbitAI),梦晨 明敏 发自 凹非寺,授权转载发布。GitHub CEO,直播AI写代码,挑战18分钟完成一个小游戏。结果只用了不到15分钟,直接成功在线部署,这...
日期:05-04
三星安卓4.0_三星谷歌推Android4.0手机 对抗苹果诺基亚
  据中国之声《央广新闻》报道,三星谷歌今日上午联合在香港召开新闻发布会,发布Android4.0手机,这是继2008年Android系统发布以来最大的一次升级. 智能手机明天,谁是新传奇?...
日期:07-24
BYD KING/KING L首曝:比亚迪已经申请商标_比亚迪商标注册
快科技12月4日消息,据天眼查显示,近日,比亚迪股份有限公司申请注册BYD KING”BYD KING L”商标,国际分类为运输工具,当前商标状态均为等待实质审查。目前,尚不清楚上述商标的详细...
日期:12-05
三星新款滑盖手机「滑盖手机再现?三星新专利构造了一种迷你滑动屏手机」
每天分享科技热点!根据三星上周四由美国和欧洲世界知识产权组织同时公布的一项新专利,三星发明了一种全新类型的智能手机,即迷你滑动手机。三星的专利描述了提供一种迷你显示装...
日期:01-25
英芯片巨头ARM定价 孙正义正式拿下年度最大上市交易「arm公司孙正义」
凤凰网科技讯 北京时间9月14日,软银集团旗下英国芯片设计公司ARM已将其首次公开招股(IPO)的发行价确定在发行价区间的上限,融资48.7亿美元(约354亿元人民币),成为今年目前为止规...
日期:09-14
微博将于9月1日发布2022年第二季度财报(微博发布2020年第二季度财报)
如何向国家工商总局投诉淘宝商家的欺骗行为 查看最新行情   中国北京/2022年8月16日— 专供人们创作、分享和发现内容的领先社交媒体平台微博公司 (NAS...
日期:08-19
天猫和淘宝跌出十强-2022胡润品牌榜_天猫品牌销量
【】4月3日消息,胡润研究院今日发布《2022胡润品牌榜》(Hurun Most Valuable China Brands 2022),300强最具价值中国品牌上榜。这是胡润研究院连续第十七年发布胡润品牌榜...
日期:10-04
美市场研究公司NPD最新报告显示视频游戏销售额同比降4%
  北京时间2月18日消息,据国外媒体报道,美国市场研究公司NPD周四发布的最新统计报告显示,今年1月期间,美国视频游戏产业销售额比去年同期下降4%。   NPD称,今年1月美国视频...
日期:07-26
步步高音乐手机主题「步步高音乐手机主题旋律」
""是一款非常受欢迎的手机主题,它的特色是将音乐元素和主题相结合,让用户可以在手机上享受到音乐的怡情世界。下面是对""的一些相关信息的整理。1.主题介绍:采用了动态音乐元素...
日期:05-29
华为的销售收入及利润「华为半年经营业绩发布:实现销售收入3109亿元,净利润率15.0%」
通信世界网消息(CWW)8月11日,华为发布2023年上半年经营业绩,整体经营稳健,结果符合预期。上半年,公司实现销售收入3109亿元人民币,同比增长3.1%,净利润率15.0%。其中,ICT基础设施业务...
日期:08-11
谷歌 Chrome App 将于 2022 年 6 月停用,向 PWA 应用转型
  10 月 15 日消息,根据外媒 9to5Google 消息,谷歌 Chrome OS 的 Chrome App 功能,将于 2022 年 6 月停用,全面向基于网页的 PWA 应用转型。这些应用除了谷歌自家的 Gmail、G...
日期:07-17
剖析金融新基建,解决“触点、场景、底层平台”成关键趋势之一
  神策数据在《金融新基建系列报告——银行业六大中期趋势展望》中,列举并阐述了新基建背景下的银行业六大趋势。其中趋势三为:优化客户旅程并提升旅程管理能力,是银行胜出...
日期:07-16
抗击疫情 ZStack援建郑州“小汤山”医院!
  郑州要建“小汤山”   2020年的开篇,一场突如其来的“新冠肺炎”把国人推向了一场没有“硝烟”的战“疫”,紧挨湖北省的河南省更是因为“硬核防疫”被推上了热搜。为遏...
日期:04-06
美媒:拜登想多了,400亿美元实现不了美国芯片独立「美国 拜登 芯片」
12月8日消息,美国总统拜登本周二为台积电位于亚利桑那州的新工厂揭幕,他对台积电投资建设的芯片工厂感到非常自豪,亲自前往当地庆祝。台积电投资400亿美元建设芯片工厂被宣传为...
日期:12-12
BLG再战T1!《英雄联盟》S13全球总决赛瑞士轮第四轮抽签:LPL、LCK正面交锋
10月23日消息,今日晚间,《英雄联盟》S13全球总决赛瑞士轮第四轮抽签正式出炉。从结果来看,可以说是中国LPL赛区与韩国LCK正面交锋。苹果正式推送ios15系统字体太大瑞士轮第四轮...
日期:10-24
OpenAI为ChatGPT加入记忆功能!可以记住你的提问内容啦
声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。2月14日凌晨,OpenAI在官网宣布,正在测试ChatGPT记住用户提问内容的能力,同时可以自由控制...
日期:02-14
乐视电视被“熊猫”吃掉《甄嬛传》收入,告别贾跃亭时代后内容优势不再
图片来源:东方IC  近日,乐视超级电视官方微博发布乐视致南京中电熊猫家电有限公司(以下简称“熊猫家电”)的公开信称,熊猫家电受托生产的几款电视液晶屏不良率接近20%。乐视要...
日期:08-23