您的位置:首页 > 互联网

谷歌推多模态视频模型VLOGGER,自动生成丰富动作视频_谷歌最新模型

发布时间:2024-04-02 15:01:25  来源:互联网     背景:

划重点:

乘风破浪的姐姐小花姐是谁

小米14锐龙版

京东方供货苹果吗

google模型

⭐️ 谷歌推出多模态视频模型 VLOGGER,能够自动生成带语音、丰富动作的人物视频。

⭐️ VLOGGER 采用全新多阶段扩散模型架构,结合文本生成图像模型和时空控制,提升视频生成逼真效果。

比亚迪云吧最新消息

⭐️ VLOGGER 在多个数据集上进行综合测试,表现出色,并不需要重新训练模型即可生成完整目标图像。

4月2日 消息:谷歌的研究人员最近推出了一款名为 VLOGGER 的多模态扩散模型,能够自动生成带语音、丰富动作的人物视频。用户只需向 VLOGGER 输入图像和语音,就可以获得逼真的视频效果。

VLOGGER 的创新之处在于采用了全新的多阶段扩散模型架构,结合了文本生成图像模型和时空控制,从而提升了视频生成的逼真效果和丰富动作。研究人员在多个数据集上对 VLOGGER 进行了综合测试,结果显示 VLOGGER 在视频质量、物体还原性和时序一致性等方面表现出色,同时还能生成丰富的上半身和手势动作。

要制作逼真的人物动画视频通常需要大量的人工调整和修补,以确保动作流畅自然。而 VLOGGER 的创新之处在于,其无需针对每个新人物重新训练模型,也不依赖于人脸检测框选区域,直接生成完整目标图像。此外,VLOGGER 还考虑到了现实中复杂的交流场景,如可见躯干、不同身份等因素,这对正确合成有效交流的人物动作至关重要。

在技术实现方面,VLOGGER 首先通过 Transformer 神经网络处理音频波形输入,生成一系列3D 面部表情和身体姿势参数,用于控制虚拟人物在视频中的动作。其次,在空间和时间上进行条件控制,生成高质量、任意长度的视频。VLOGGER 还引入了一种 "时序外推" 的技术,允许模型迭代生成任意长度的视频片段,同时保持时序一致性。为了提高生成效果,VLOGGER 还采用了级联扩散方法,对基础分辨率的视频进行超分辨重建,生成高质量的影像。

VLOGGER 的推出为虚拟数字人的制作提供了更便捷、高效的解决方案,同时也在多模态视频生成领域取得了重要的技术突破。

产品入口:https://top.aibase.com/tool/vlogger

技术报告:https://enriccorona.github.io/vlogger/paper.pdf


返回网站首页

本文评论
韩国第二家apple store「苹果将在韩国开设第四家Apple Store零售店」
IT之家 9 月 14 日消息,Apple Jamsil 将于 2022 年 9 月 24 日在韩国松坡区,并将在乐天世界购物中心开业。而 iPhone 14 / Pro 系列新品手机将于 9 月 16 日上市。在首尔开设...
日期:09-25
虎牙直播未响应「虎牙“播”不动了?」
  撰文 |;曹双涛  编辑 |;杨博丞  题图 | IC Photo  从辉煌到没落?  2012年成立的虎牙,在资本的助推下,依靠天价签约头部主播,拿下大量游戏直播和赛事版权,迅速完成了...
日期:10-01
韩国sk集团ceo「OpenAI CEO 访韩 或就 AI 芯片合作事宜与 SK 集团会长会面」
1月22日 消息:随着企业和消费者对人工智能(AI)应用的兴趣日益浓厚,对 AI 芯片的需求也在快速增长。为应对可能的芯片短缺,美国 AI 初创公司 OpenAI 正在寻求解决方案。据报道,Ope...
日期:01-22
Redmi Note 12未发先火!价格还未公布就有多人下单_Redmi Note 10新一代出货爆款
Redmi Note 12系列虽然还没有公布价格,但是官方已经开启了1元盲售,参与预售用户就可以获得价值198元的礼包。在天猫小米旗舰店,已有超过2000人参与了盲售。这次Redmi同时在小米...
日期:10-24
第一季度中国云服务支出增长 6%  生成式 AI 和 AI 大模型为云市场带来新的增长机遇
6月15日消息:据 Canalys 报告显示,2023 年一季度,中国大陆的云基础设施服务支出同比增长 6%,达到 77 亿美元,占全球整体云支出的 12%。美国三大股指上周涨跌企业对于上云的需求...
日期:06-15
2023年XPG新增游戏总价值超过6万元!包含《星空》《极限竞速8》等大作
快科技12月31日消息,截止12月31日,今年 Xbox Game Pass新增的游戏总价值为8763美元,约合人民币6.2万元。也就是说,如果你要购买2023年登陆XPG的所有游戏,你需要花费近9000美元。...
日期:12-31
董明珠:我家里什么都是格力的 希望大家电器也都换格力_董明珠怎样把格力做大的?
快科技1月29日消息,在已经结束的格力2024全球梦想盛典”上,董明珠金句频出,其还在会上突然宣布多发2亿元年终奖等。在格力欢乐购环节,在被主持人问家里是否有这款格力产品时,董明...
日期:01-29
造车沉寂、华为回归,抢发小米14的雷军,急了?_小米雷军谈华为
2023年的小米14,比以往来得更早一些。小米12的发布时间是2021年12月28日,小米13是2022年12月11日,而今年是10月26日,提前了将近两个月。手机厂商的旗舰机型往往有着稳定的发布周...
日期:10-27
观潮论坛:中外专家汇聚BCS共商数字世界竞合之路
  数字技术缔造了数字世界,让全球连接更加紧密,但也带来空前激烈的全球科技竞争,数字世界已成大国博弈的主领域。面对技术垄断、国家数据主权、关键基础设施安全、勒索攻击...
日期:07-17
充电盒有触控屏」-可控制音乐播放 「苹果AirPods新专利_airpodspro充电盒触点
3月31日消息,据美国商标和专利局(USPTO)最新公示,苹果获得了一项关于 AirPods 耳机的设计专利。SDK广告从专利图可知,AirPods耳机充电盒配有一个图形用户界面(GUI),可以控制歌曲播放...
日期:09-18
特斯拉花了17年才盈利,蔚小理需要多少年
撰文/ 吴 静编辑/ 张 南设计/ 赵昊然当造车新势力二季度财报陆续公布,诸如“理想卖一辆亏2.3万元”,“小鹏卖一辆亏损超6万元”,“蔚来卖一辆亏损超10万元”此类的字眼便常见诸...
日期:09-12
新品来袭!努比亚Play 5G官宣:4月21日见(努比亚play发布会回放)
  4月15日消息 今日上午,努比亚手机官方正式宣布,努比亚Play手机新品发布会将于4月21日19:00全网直播。   一同公布的海报显示,即将发布的努比亚Play手机支持5G。   此...
日期:10-11
骁龙8cx Gen2「骁龙8 Gen2架构及频率曝光:性能提升10%」
9月28日晚消息,数码达人i冰宇宙给出消息,SM8550芯片也就是骁龙8 Gen2采用1+2+2+3架构,目前的CPU频率是2.84Hz、2.4GHz、2.4Ghz和1.8GHz。光刻机真的能自己造吗2020浙江高新技术...
日期:09-30
中国队夺得亚运电竞首金!《王者荣耀》宣布钟无艳新皮肤免费送
快科技9月26日消息,在今日杭州第19届亚运会电子竞技《王者荣耀》亚运版本决赛中,中国队以2比0击败马来西亚队,夺得该项赛事的金牌,这也是杭州亚运会电子竞技项目诞生的首枚金牌...
日期:09-27
淘宝改变生活 500嘉宾献策湖北电商发展
长江商报消息 本报讯(记者 翟莹)“21世纪要么电子商务要么无商可务。”马云这样形容电子商务的发展前景。目前,沿海地区电子商务已成规模。坐拥“九省通衢”的地理位置,以及“...
日期:07-24
科技“打败”阿根廷背后:卡塔尔世界杯还有哪些“科技与狠活”
声明:本文来自于微信公众号锌刻度(ID:znkedu),作者:星晚,授权转载发布。是球迷的狂欢,也是商业的盛会近段时间,全球的灼灼目光都聚集到了波斯湾西南岸的一个国家——卡塔尔。随着2...
日期:11-30
Facebook 老总_Twtter CEO:我们会比Facebook和Google+活得长
Twitter CEO 迪克·卡斯特罗   10月18日消息,据国外媒体报道,在旧金山举行的Web 2.0峰会上,Twitter CEO迪克·卡斯特罗(Dick Costolo)表示,Twitter会比Facebook和Google+活...
日期:07-24
荣耀X50用上5800mAh电池 同级别最高_荣耀五十的电池容量是多少
在荣耀的发布会上,他们推出了号称十年之作的荣耀X50手机。这款手机不仅首次搭载了新一代骁龙6芯片,还配备了容量达到5800mAh的超大电池,其寿命极长,在同类手机中续航表现最强。...
日期:07-06
华为果然遥遥领先!阿维塔11鸿蒙版成功穿越60公里无划线山路:智能驾驶的最高水平
快科技9月24日消息,近日,阿维塔智驾征珠峰挑战赛引发关注。我们从阿维塔官方获悉,凭借着先进的BEV融合感知和基于激光雷达的GOD障碍物避让能力,阿维塔11鸿蒙版成功穿越60km无划...
日期:09-25
蔚来试点“跨级换电”,长续航电池包日租68元_蔚来免费换电权益
DoNews10月28日消息(郭睿琦)据界面新闻,蔚来宣布对“跨级换电”服务进行试点,采用该服务的蔚来车主可通过付费服务升级至更大规模的电池组,按日付费,先用后付。而对于配置更高续航...
日期:10-29