您的位置:首页 > 互联网

给我一张脸,视频背景随你换,林黛玉都被清华理工男玩废了|免费开放

发布时间:2024-09-11 15:30:26  来源:互联网     背景:

声明:本文来自于微信公众号量子位 | 公众号 QbitAI,作者:衡宇,授权转载发布。

让AI视频中任意主体保持一致!就在刚刚,人人都可轻松做到了。

而且只需一张图片,就能实现。

——上面的每一个马斯克视频,都来自同一张照片。

想玩的话,只需要用上清华系AI视频玩家生数科技旗下Vidu的最新功能,主体参照(Subject Consistency)。

该功能能够实现对任意主体的一致性生成,让视频生成更加稳定,也更加可控。

“现在生成AI视频内容,想要做到‘言出法随’其实还很难,不确定性让视频内容对运镜、光效等的精细控制还是得不断抽卡。”生数科技CEO唐家渝表示,“角色一致性只能让人脸保持一致,而主体参照让主体整体造型都能保持一致,给了更大的创作空间。”

这是继今年7月,生数Vidu面向全球用户上线文生视频与图生视频能力(单视频最长生成8s)后的再次更新。

这次功能上新依然非常友好:

面向用户免费开放,注册即可体验。

苹果11换屏幕多少钱

仅需一张图片实现主体可控

先来看看Vidu是怎么定义这个新功能的。

主体参照:允许用户上传任意主体的一张图片,然后由Vidu够锁定该主体形象,通过描述词任意切换场景,输出主体一致的视频。

划重点:任意主体。

也就是说,无论是人还是动物,无论是真人还是动漫形象or虚构主体,无论是家具还是商品,都能通过这个功能在视频生成中实现一致性和可控性。

目前,所有的视频大模型中,仅有Vidu率先支持这种玩法。

不必光说不练,我们来看看真实效果。

人物主体

首先来看看以人物为主体。

上传一张87版《红楼梦》林妹妹的定妆照:

三星s21系列后盖

以画面中林妹妹为主体,利用主体参照功能,生成两条视频。

突然,林妹妹上台演讲了:

又一眨眼,妹妹已经坐在星爸爸喝咖啡了:

当然啦,真人可以作为生成视频的主体参照,虚拟角色/动漫人物同样可以。

比如输入一张漫画女孩:

生成视频效果是酱紫的:

这里附上一些官方给的小tips:

  • 如需重点保持主体面容一致,需仅截取单一主体的清晰面容图

  • 如需重点保持主体半身一致(面容+上半身服饰),仅需截取单一主体的清晰半身图

  • 如需重点保持主体全身一致(全身特征),仅需截取单一主体的清晰全身图

动物主体

谁能不爱可爱狗狗!

小米 长城造车

把这张照片丢给Vidu,就能实现狗狗走草地上,一步一步靠近你。

镜头后拉和主体运动幅度表现都还不错。

华为卫星通信功能有什么用

商品主体

当把商品作为需要参照的主体时,在生成的视频中,商品外观和细节能在不同于图片的场景中保持一致。

就像下面这样:

沙发所在的场景,说变就变。

上面还能睡一个盖了毯子的小女孩,遮挡住沙发原有部分。

需要注意的是,当前版本仅支持单一主体的可控。

如果上传的图片有多个人物/物体,需要框选出单一主体进行生成。

Be Like:

不再“两步走”了

无论是制作短视频、动画作品还是广告片,“主体一致、场景一致、风格一致”都是共同的追求。

因此,AI视频生成内容想要有叙事效果,就需要不断往三个一致方面尽力靠拢。

尤其是就现实情况而言,实际的视频创作,内容往往围绕特定的对象展开——这往往也是视频生成内容最容易变形、崩坏的一点,尤其在涉及复杂动作和交互的情况下。

挠头,脑阔痛。

业界首先想到的办法是先AI生图、再图生视频。

说人话,就是用Midjourney、SD什么的,生成分镜镜头画面,让每张图里的主体保持一致,然后再进行图生视频,最后把每个视频片段拼接剪辑。

但一听就发现了,这样搞,无论是保持AI画图的一致性,还是后期拼拼剪剪,工作量都很大。

生数Vidu“主体参照”跟这个思路的不一样之处,就是不再两步走了。

而是通过“上传主体图+输入场景描述词”的方式,直接生成视频素材。

最后,我们来厘清以及区分三个概念:

  • 图生视频(Image to Video)

  • 角色一致性(Character to Video)

  • 主体参照(Subject Consistency)

图生视频基本是现在AI视频生成的基操了。

它把输入的图片作为视频首帧,然后基于首帧画面的连续生成。

Bug是无法直接输出目标场景,限制了视频内容的多样性和场景的自由度。

角色一致性,主要集中在人物形象上起效果。

它能保证人物面部特征在动态视频中保持一致,但一般来说“一致性”只顾脸,不顾整体形象。

主体参照,面向任意主体。

同时在面向人物主体时,既可选择保持面部一致,也可选择保持人物整体形象的高度一致。

最后附上生数科技视频试玩链接,感兴趣的朋友可趁排队人不多,赶紧冲一波!

毕竟,免费的就是香,对吧(doge)。

体验直通车:

www.vidu.studio


返回网站首页

本文评论
腾讯、信通院牵头发布物模型系列标准,引领数据中心智能化运维
通信世界网消息(CWW)近年来,数据中心作为算力基础设施发展成效显著,产业链上下游多方合力、多措并举带来布局不断优化、运营能力稳步提升、赋能价值逐步显现,有力支撑了我国数字...
日期:01-09
最高降幅达2万元,零跑C系列部分车型降价
8 月 1 日消息,零跑汽车宣布旗下 C 系列部分车型降价,包含两款 C11 车型以及三款 C01 车型,注意到,其中 C01 车型最高降幅达到 2 万元。这是零跑汽车在今年 6 月份交付了 13209...
日期:09-19
海尔智能物联「物联网赛道长跑,海尔智家赢下了“每一步”」
过去几天里,火爆的上海车展,让我们见证了一批国产汽车品牌“闪耀全球”的时刻。人声鼎沸的车展刚刚结束,黄浦江畔的新国际会展中心里,汇聚顶 尖智能制造品牌的AWE大会,又已徐徐拉...
日期:05-10
专访极空间创始人袁斌:to B新步调,谱写私有云存储新篇章
通信世界网消息(CWW)数字时代,数据呈指数级增长,如何高效且安全地存储数据已经成为个人、家庭、企业的不可忽视的一环,可以说,数据安全已经成为企业的“生命线”。近年来,数据泄露...
日期:05-31
X100系列首发-天玑9300将采用全大核架构_直接挑战苹果A17 「vivo」_天玑处理器900相当骁龙什么处理器
今年上半年,联发科推出了天玑9200+移动平台,截至目前已有多款机型进行搭载,是目前安卓阵营性能最强的芯片之一。不过天玑9200+只是开始,此前联发科官方就正式确认了下一代旗舰芯...
日期:09-09
极光Q1手机报告:OPPO销量份额连续三个季度下滑_oppo2020手机销量
  极光(Aurora Mobile, NASDAQ:JG)发布《2020年Q1智能手机行业季度数据研究报告》,从整体市场情况、5G手机专题、iPhone专题、安卓手机品牌忠诚度专题等多维度分析当前智...
日期:08-27
曝苹果10月份发布会取消:官网直接开卖新品_苹果10月还有发布会吗
  9月26日消息,根据惯例,苹果在秋季发布会上推出新iPhone等新品后,将于10月举办特别活动,推出新iPad、MacBook Pro等新品。  但根据Mark Gurman的最新消息,苹果今年10月份...
日期:10-14
华为u8860手机「u8860 华为」
华为U8860是一款基于Android系统的智能手机,于2011年推出,被称为当时市场上性价比最好的产品之一。下面我们来详细了解一下这款手机的具体情况。首先,U8860的外观设计采用了时...
日期:05-29
拒绝录用有文身员工 老板回应被威胁:看不惯年轻人必教育到底_拒绝纹身的理由
5月16日,广东东莞。一名工厂老板拒收有文身员工的视频走红,我们不收有文身的,一个都不可以,先声明一下。你的文身有可能断送了你的前程。它给人的第一印象就不好,要么是社会上混...
日期:05-18
聚焦算力网络发展,展现焕新品牌内核 ——“算达今昔 智见未来 Aginode 2023智慧互联峰会”成功举办
通信世界网消息(CWW)12月8日,由Aginode(原耐克森通讯系统)主办的“算达今昔智见未来——Aginode 2023智慧互联峰会”,在上海成功举行。作为通讯和数据网络领域的一次技术盛会,本次...
日期:12-13
特斯拉市值突破2000亿美元 app「从领先一个特斯拉到落后一个特斯拉 苹果微软市值差距反转」
3月24日消息,截至到2023年底,苹果还是全球市值最高的上市公司,但现在其市值已经比第一的微软少了5400亿美元,相当于现在特斯拉的整个市值。截至周四收盘,苹果公司的市值为2.65万...
日期:03-25
马克扎克伯格有多少钱2020「马克·扎克伯格的 Meta 发布 Llama2 以针对 Sam Altman 及 OpenAI 展开竞争」
10 月 29 日消息:自 5 月份在白宫举行的顶级 AI CEO 聚会上,Sam Altman 与 Satya Nadella 和 Sundar Pichai 并排而坐以来,马克·扎克伯格的缺席成为了不容忽视的事实。哪个品...
日期:10-29
中国有哪些品牌墙内开花墙外香?大鱼电动车成海外网红
  近年来,中国品牌在全球市场上已经形成了自己独特的高价值标签,不仅仅产生了大疆、传音这样的巨头品牌,更有上汽大通、大鱼电动车这样走出去的汽车以及两轮电动车品牌。大...
日期:07-17
送四名私人宇航员飞往国际空间站,SpaceX第二次载人航天启程_2名宇航员走出国际空间站
北京时间5月22日早间消息,据报道,埃隆·马斯克旗下SpaceX公司向国际空间站运送了四名私人宇航员,其中包括首位来自沙特阿拉伯的女性宇航员。周日晚间,四名宇航员来到佛罗里达州...
日期:09-27
马斯克推特5月8号「马斯克将于10月6日和7日就推特收购案接受推特律师询问」
9月28日消息,据国外媒体报道,一份法庭文件显示,特斯拉CEO埃隆·马斯克将于当地时间10月6日和7日上午在特拉华州威尔明顿的波特·安德森和科罗恩(Potter AndersonCorroon)律师事务...
日期:09-29
小米笔记本 Pro X 高端旗舰先导片公布:搭载 RTX 3050Ti 独显,本月发布_小米笔记本首发3050ti
  6 月 28 日消息 小米上月中旬宣布高端旗舰小米笔记本 Pro X 将于 6 月发布,之后就很少再有该笔记本的官方消息,不过今天官方放出了该笔记本电脑的先导片,一起来看一下。...
日期:11-22
联发科支持谷歌吗「联发科回应与谷歌合作生产AI服务器芯片传闻」
6月19日,据台湾《经济日报》报道,谷歌冲刺AI,传找联发科合作,携手打造最新AI服务器芯片,并将以台积电5纳米制程生产,力拼明年初量产,象征联发科正式跨足当红的AI服务器相关芯片领域...
日期:06-19
Llama3-8B秒杀700亿巨兽?北大博士生等全新BoT框架推理暴涨70倍,24点图形推理一步成神
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。【新智元导读】24点游戏、几何图形、一步将死问题,这些推理密集型任务,难倒了一片大模型,怎么破?北大、U...
日期:06-08
百度吴甜:文心一言创作37亿字文本,输出3亿行代码_百度文心官网
12月29日消息,昨日第十届WAVE SUMMIT深度学习开发者大会上,度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜透露,截至12月底,飞桨平台开发者数量达1070万。吴甜表...
日期:12-29
美团一度跌超5% 抖音或将入局外卖业务「抖音外卖和美团外卖」
2月8日 消息:2月8日消息,今日上午,美团一度跌超5%,此前有报道称,3月1日抖音将上线全国外卖服务。对此,抖音生活服务相关负责人回应,“团购配送”项目目前仍在北京、上海、成都试点...
日期:02-09