您的位置:首页 > 互联网

Meta AI发布炸裂项目audio2photoreal 可将音频生成全身逼真的虚拟人物形象

发布时间:2024-01-05 05:52:35  来源:互联网     背景:

1月4日 消息:Meta AI最近发布了一项引人注目的技术,他们成功地开发出一种能够从音频中生成逼真的虚拟人物形象的系统。

中国移动 投资

这个系统能够根据多人对话中的语音生成与对话相对应的逼真面部表情、完整身体和手势动作。这些虚拟人物不仅在视觉上非常逼真,而且能够准确地反映出对话中的手势和表情细节,例如指点、手腕抖动、耸肩、微笑和嘲笑等。

项目及演示:https://people.eecs.berkeley.edu/~evonne_ng/projects/audio2photoreal/

代码:https://top.aibase.com/tool/audio2photoreal

Demo:https://colab.research.google.com/drive/1lnX3d-3T3LaO3nlN6R8s6pPvVNAk5mdK

苹果或推出iphone14plus价格

这个系统的工作原理如下:

首先,Meta AI团队捕获了一组丰富的双人对话数据集,这些数据集能够提供逼真的重建。然后,他们构建了一个复合运动模型,其中包括面部运动模型、引导姿势预测器和身体运动模型。

在生成面部运动时,系统使用预训练的唇部回归器处理音频,提取与面部运动相关的特征,并利用条件扩散模型生成面部运动。

在生成身体运动时,系统根据音频自回归地输出每秒1帧的向量量化(VQ)引导姿势。然后,将音频和引导姿势输入到扩散模型中,以每秒30帧的速度生成高频身体运动。

最后,生成的面部和身体运动被传入训练好的虚拟人物渲染器,生成逼真的虚拟人物。

最终展示的结果是根据音频生成的全身逼真虚拟人物,这些虚拟人物能够表现出对话中的细微表情和手势动作。

这项技术的发布将为虚拟人物的创造和应用领域带来巨大的进步。无论是在游戏开发、虚拟现实还是电影制作领域,这种能够从音频中生成逼真虚拟人物的系统都将发挥重要作用。

Meta AI的成果再次展示了他们在人工智能领域的卓越能力和创新精神。他们不断推动着技术的边界,为我们带来了一个全新的虚拟人物生成的时代。我们可以期待在不久的将来,这种技术将成为我们生活中不可或缺的一部分。


返回网站首页

本文评论
骨灰级程序员 20多年经验IT大牛左耳朵耗子陈皓突发心梗去世 享年47岁
今天上午有网络爆料称一位IT行业的大佬突发心梗离世,享年只有47岁,他就是@左耳朵耗子,本名陈皓,先后在阿里、亚马逊等公司担任过技术高管。CSDN网站从陈皓创立的MegaEase公司处...
日期:05-15
引力传媒与澜舟科技共建“AIGC大模型实验室”  打造营销类ChatGPT大模型
5月10日 消息:5月9日,引力传媒和澜舟科技正式签署战略合作协议。依托双方在内容创意、营销传播、电商运营、AI技术和多语言翻译大模型等领域的积淀,共建“行业AIGC大模型联合...
日期:05-10
腾讯将减持美团?知情人士辟谣:没有计划「美团官方辟谣」
  原标题:媒体称腾讯将减持美团,知情人士辟谣:没有计划  循环经济助力降碳行动  36氪获悉,有媒体报道称,腾讯控股计划出售其所持美团的全部或大部分股份。对此,36氪从接近腾...
日期:09-27
三星即将发布的exynos 2400「三星即将发布的显示器」
芯片将采用1+2+3+4十核设计,拥有一个3.1ghz的armv 9 cortex-x4内核,2个2.9ghz的armv 9 cortex-a720内核,3个2.6ghz的armv 9 cortex-a720内核,和4个1.8ghz的armv 9 cortex-a520核...
日期:04-25
快手周杰伦直播榜一是谁「周杰伦、蔡依林之后,快手娱乐再出现象级直播」
声明:本文来自于微信公众号卡思数据(ID:caasdata6),作者:叫我娜姐,授权转载发布。一边露营,一边谈唱是种什么体验?刚刚结束的“夏日狂欢派对·野营谈唱会”上,成龙给出了他的答案...
日期:08-01
光线传媒姜子牙份额_光线传媒:来源于《姜子牙》的营业收入区间为人民币3.6亿-4亿元
10月13日消息,光线传媒日前对外发布公告称,截至2020年10月11日,公司来源于电影《姜子牙》的营业收入区间为人民币3.60亿元至人民币4.00亿元。据国家电影资金办数据显示,截至2020...
日期:08-01
腾讯旗下游戏公司与索尼互娱将入股“魂系列”开发商FromSoftware,投资总额364亿日元
  日本角川集团(KADOKAWA)8月31日宣布,合并子公司FromSoftware将通过第三方配售的方式向腾讯控股旗下游戏公司Sixjoy Hong Kong和索尼互动娱乐有限公司(SIE)发行新股。  声明...
日期:09-01
小米高管解读Q4财报:四季度业绩下滑主要有两大原因,对今年保持乐观
  讯 3月24日晚间消息,小米今日发布2022年第四季度及全年财报。财报显示,该公司第四季度总收入达到660亿元,较2021年同期下滑22.8%;经调整净利润为15亿元,较2021年同期下滑67.3...
日期:03-25
Android版Skype存安全漏洞 致用户信息泄露_skype信息安全吗
  北京时间4月15日消息,据国外媒体报道,美国科技网站AndroidPolice.com日前指出,Android版Skype应用存在严重安全漏洞,可能会导致用户个人信息的泄露。   该网站指出,这项应...
日期:07-27
户外电源赛道按下“加速键”,电小二领跑全球
  “以前觉得钓鱼无聊,现在真香了,每天凌晨在抖音看钓鱼视频入迷”。 刚发布的《2021上半年抖音体育数据报告》显示,抖音最受欢迎的休闲运动是钓鱼,而抖音上最火的钓王“天元...
日期:07-17
高铁列车员礼貌制止儿童吵闹获掌声:家长多次提醒无效 必须出手
7月23日,成都到昆明D857次列车上两个小朋友嬉戏打闹,列车员多次提醒无效后便用严肃的语气制止,车厢乘客纷纷鼓掌为列车员点赞iOS 15 RC版据悉,列车员之所以选择出手,还是因为小朋...
日期:07-24
广东一海滩突然涌现大量海虾引围观 网友热议:宁愿进我肚子都不愿进海里
8月24日,广东一海滩突然涌现大量海虾,这引来了网友的围观。至于到底是什么情况,并不清楚,但网友讨论的确实热火朝天。有网友表示,是不是富士山要爆了,这些虾虾感受到了危险?跨境电...
日期:08-25
1599元起!华为畅享60 Pro开启预售:5000mAh大电池加持_华为畅享6nceal10
华为畅享60 Pro在京东自营店开启预约,起售价为1599元,5月25日正式开卖。2020中国云网络峰会sensor tower app而在今年一季度,理想汽车实现营收8.52亿元oppofindx支持65w快充吗...
日期:05-19
外媒:瑞士公司发布首款 ETSI EN 303 645 网络安全认证的蜂窝模块
通信世界网消息(CWW)作为全球领先的定位和无线通信技术和服务提供商,瑞士公司u-blox 宣布其 LARA-R6 LTE Cat 1 和 LARA-L6 LTE Cat 4 蜂窝模块系列已成为市场上第一个使用 ETS...
日期:10-19
是电子书阅读器更是智能手机 海信阅读手机A5实力护眼_电子书阅读器与手机阅读
  普通智能手机不够护眼、电子书阅读器功能受限......长期以来,很多阅读爱好者都困惑于智能手机和电子书阅读器之间,虽说尺有所长寸有所短,但对于想要鱼与熊掌兼得的他们...
日期:03-07
谷歌50亿美元「谷歌推出 2000 万美元基金支持负责任的人工智能开发」
9月12日消息:继在旧金山举行的 Google Cloud Next 会议上发布了一系列生成式 AI 项目和工具后,谷歌于周一宣布推出数字未来项目,旨在汇聚 AI 发展中的多样化声音。谷歌还宣布...
日期:09-12
快手高管解读2022年Q4财报:在文本、语音、图像、视频等各个模态内容生成方面有布局
  相关新闻:快手2022年第四季度营收282.9亿元 调整后净亏损4530万元  一图看懂快手2022年Q4财报:GMV同比增长30% 月活达6.4亿  讯 3月29日晚间消息,快手今日发布2022年第...
日期:03-29
米家智能空气炸锅测评「369元 米家智能空气炸锅5.5L可视版发布:10分钟快烤鸡翅」
快科技8月24日消息,小米发布了米家智能空气炸锅5.5L可视版,拥有透明可视窗,市场价399元,预售价369元。米家智能空气炸锅5.5L可视版升级可视化窗口,6.8英寸透明大尺寸窗口,食材烹饪...
日期:08-25
品牌年轻化再次升级,TCL与英雄联盟职业联赛达成深度战略合作
  熟悉电竞圈的朋友应该都知道,如今的英雄联盟职业联赛已经成为全球顶级的电竞赛事。为了促进LPL联赛的持续健康发展,以LPL为中心衍生出的商业化模型也越来越庞大,更多国内...
日期:07-16
男朋友给我点外卖嫌贵「男朋友嫌吃50元外卖太贵 女子吐槽:不想自己过的没生活质量」
日前,有网友在小红书发文称,男朋友嫌自己吃50元的外卖太贵了,自己听了很不舒服,并表示不想自己过的太没有生活质量。文章内容显示,该女子中午点了一份53元的外卖,跟男朋友吐槽送的...
日期:10-16