您的位置:首页 > 互联网

快手可灵再进化!视频续写可达3分钟让全球网友炸锅_可灵是什么意思

发布时间:2024-06-26 12:34:37  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】没想到,刚刚上线了图生视频和视频续写功能的可灵AI,竟已在全世界互联网上引爆了视频创作的热潮!

最近,可灵AI直接让一位网友的家人群里炸锅了……

事情是这样的,这位网友的父亲需要做搭桥手术,为了给父亲鼓舞,他便试着用可灵AI把爷爷的两张老照片还原成了视频。

在下面这个视频中,爷爷正在朝鲜战场,担任营指导员。穿越时光隧道,1950年代风华正茂的爷爷,对着他挥了挥手。

这位网友把视频发到家人群后,群里直接炸了!

下面这张黑白的合影,是全家唯有的一张全家福。

当已经故去的人忽然动了起来,音容笑貌一如往昔,每个人都泪目了。

家人们久久不能平静,即使已过午夜,群里仍然不断有消息响起。

用AI还原老照片后,全家人仿佛一起经历了一场寻根之旅,从长辈口述的家史中,每个人都获得了更多的自我身份认同感。

网友珏哥在他的公众号觉得有意思里表示,在他看来,AI最大的意义就是成为一台超级造梦机器:安排自己做个美梦,一觉醒来就有继续去生活的劲头了。

歪果仁都馋哭了

是的,这几天快手可灵最新上线的图生视频和视频续写功能,不仅在国内掀起一波试用的热潮,还馋哭了一众外国网友。

如今,X上已经铺满了可灵生成和续写的视频。

比如这张著名的经典表情包,经过可灵的续写后终于有了大结局!

每一步都在意料之外,但似乎又在情理之中(手动狗头)

狗狗吃面也变得活灵活现。

要知道,曾经的快手可灵一出世,就让外国网友们发出心悦诚服的感叹:效果居然比Sora还要好!

同样是吃汉堡,可灵生成的咬痕就要比Sora更加逼真

一些申请到试用资格的用户纷纷表示真香。而那些不能亲自体验的国外网友,纷纷跪求帮忙生成。

可以说,可灵给全世界的开发者们,再次带来了来自中国的亿点点震撼!

作者:温维斯Wenvis

值得一提的是,由于太过爆火,快影App截至目前已有累计超过20万人排队申请。

所以说,这次可灵的两大全新功能,究竟强大在哪里?

图生视频

首先来看第一个功能——图生视频。

这一功能直接做到了化静为动,让我们从此可以按需定制视觉叙事。

可灵在文生视频上的诸多强大功能,也被一一完美融入了,比如创造逼真的运动场景、精确模拟物理特性、将复杂概念巧妙融合、输出电影级画质、自由调节视频纵横比等等。

上传一张图片,接下来,就是奇迹出现的时刻。

永远面带谜之微笑的蒙娜丽莎,竟然戴上了墨镜,瞟向观众们的小眼神,更多了一丝调皮和狡黠。

prompt:蒙娜丽莎用手戴了眼镜

构建复杂时空一绝

业内都知道,模型在转换静态图像为动态视频时,如何细腻而准确地实现大幅度运动场景,要克服不少难点。

对此,可灵充分利用了基础模型架构中的3D时空联合注意力机制,在构建复杂时空运动方面,表现令人惊叹。

下面这个由静图生成的牧羊犬追球的视频,自然流畅,效果非常丝滑。

无论是牧羊犬一下一下晃动的耳朵,还是随风飘扬的毛发,看起来都很符合物理规律。

prompt:可爱的牧羊犬在奔跑,网球在弹跳,温馨的氛围

汽车在公路上飞驰的这段视频,可灵对整体画面的处理效果简直堪称广告级大片。

不仅汽车疾速前行的姿态逼真自然,对向车道上接连不断的车流、道路两旁向后掠去的树木、虚化处理的隔离带,无不模拟出了疾驰的速度感,几乎挑不出破绽。

prompt:汽车在公路上高速行驶,速度感,广告片

文本指令控制视频,女孩一键转身

更厉害的是,可灵的图生视频模型还融入了强大的提示词融合技术。

这就意味着,用户可以对模型下达文本指令,来人为地掌控视频中对象的动态表现了。

比如上传这张女孩的照片后,普通的模型,可能会默认增加发丝飘动、花朵摇曳、水面闪烁波纹的效果。

klearbar可灵吧官网

但在可灵中,我们可以输入转身背对镜头的提示词。

模型输出的视频中,女孩就开始优雅转身,并且增添了转身瞬间微笑、眨眼的细节,显得更加自然生动。

可灵的这个新功能,也让我们的想象力可以充分放飞。

比如小编在看《权力的游戏》时经常想象的一个场景——愤怒的巨龙,漫天飞沙,奇幻风格电影,提示词输入后,幻想中的场景瞬间成真了!

巨龙昂首展翅,掀起漫天黄沙,咆哮声震耳欲聋

这种文本与图像意义的紧密联动,无疑对影视制作等行业意义重大。(看来好莱坞导演撤掉8亿美元摄影棚,的确是明智的选择)

从此,视觉叙事可以按需定制,许多行业必将掀起新的飓风。

此外,这个模型还能支持不同风格的图像输入,无论自然写实,还是风格化图像。

同时,它还兼容各种长宽比的图像输入,可以说是为国内各个短视频平台量身打造。

这张竖版的骑士,黑袍飞舞,光剑仙气环绕,氛围感瞬间拉满

实测效果

凭AI电影《山海奇境》刷屏全网的制作人陈坤,半年之后用可灵的图生视频功能重制了一遍《山海奇镜》的预告片。

留言区的网友直呼有大片的味道。果然AI一天,人间一年。

可灵AI,赞52

这位叫海军爱摄影的网友,直接将自己的摄影作品变成了视频。

奔跑的女孩与骆驼,黑白的色调,颗粒的老电影质感,把摄影作品中包含压迫感的内涵意蕴升华到了令人震撼的地步。

可灵AI,赞451

当世界名画开始动起来,会给人怎样的体验?

JessyJang用可灵让我们大开眼界。

无论是现代艺术的经典之作《The Son of Man》,还是著名油画《戴珍珠耳环的少女》《吹笛少年》,都忽然开始活灵活现。霍格沃茨城堡上的油画,原来是真实存在的?

可灵AI,赞78

B站up主呜哩智绘,用可灵的图生视频功能,生成了各个样子的戴珍珠耳环的少女。

人物动作、面部表情、手部细节、视频中的光影,都堪称完美。

呜哩智绘直言:这是目前我玩过的最稳定好用的图生视频。

网友也表示——

喜好儿网则用可灵让历史人物活了起来。

网友们惊呼,可灵做出的爱因斯坦简直跟纪录片一样。

up主鑫訫向荣直接把语文课本里的插画都还原了出来。还记得这些都是哪一课吗?

欧洲电动车与燃油车成本

up主花染色体TT,干脆用可灵做了个伪log。

用几张12年前的照片,让记忆中的场面鲜活起来。此时,距离高考还有16天——

美女的照片,变成视频后美得更有冲击力了。

即使混进了一些奇怪的东西,看起来似乎也很自然。

视频续写

其次,是对算法挑战更大的视频续写。

它不仅要求模型理解视频的基本元素,以及更深层次的叙事结构,还需要创建新的情景,而且在视觉和主题上都要保持连贯。

在这一领域,可灵则成功地把强大的想象力和精细的可控性发挥得淋漓尽致。

随着功能的正式上线,所有视频立刻在原有基础上原地+5秒!

无论是文生视频还是图生视频,皆可适用。

这对于创作者来说,视频续写至关重要。因为这种强大的叙事能力,可以极大地拓展他们的创作边界。

无独有偶,Runway的Gen-2可支持将视频时间最高延续到18秒,每次点击Extend功能,可完成4秒的视频,而且能够保持人物的一致性。

fb ins twitter

同样,Pika也支持视频延续的功能,而且用户可以指定想要生成的时间,与原始视频无缝集成。

而上周,初创公司Luma AI发布的AI视频模型Dream Machine,直接就定位为续写模型,还能免费试玩。

各种表情包,成为网友们恶搞的对象,经过Dream Machine的想象,所有的静图都有了完美的后续。

可见,视频续写代表着整个AI视频模型发展未来,打破了传统视频编辑的界限。

多次续写,最长可达3分钟

更瞩目的是,可灵大模型甚至还能连续多次续写,这样的结果就是,我们最长能够生成长达约3分钟的连贯视频!

续写x1:一个女人站在雪地里,抬起右手摸了一下帽檐

续写x2:女人的手放下,并望向远方

深刻理解物理世界,合理且大幅度动作无破绽

可以看出,新生成的部分和原视频之间,依然保持着运动连贯性和物理的合理性,这正是基于可灵大模型对于物理运动的深入理解。

而这种续写,就给巧妙融入大幅度动作变化带来了可能,让视频的生动性大大提高。

续写x1:宇航员从月球表面跳起来,飞向太空

同样,在视频续写中也集成了文本控制机制,因此用户可以通过自定义提示词,为每段视频注入个性化的创意。

由此,我们想要的每次场景都可以平滑过渡,可以说是不放过咱们都任何一个灵感小火花!

文本控制续写,场景转换丝滑

比如这座古堡,我们既可以在场景中让太阳落下,天空变暗,灯光渐亮,随后让灯光亮起,雾气氤氲。

实测效果

而网友们用续写功能做出来的视频,效果简直一个比一个炸裂!

网友石硕Simon直接用可灵的续写功能创作了长达1分多钟的一镜到底。

多次续写的镜头,依然保持着令人叫绝的连贯性。

PlayerKang生成的59秒奔驰汽车大片,无论在连续性、稳定性和流畅性上都令人叫绝,已经接近了替代商业广告片的水平。

西地宇宙CDVERSE用可灵的视频续写功能,做出了一套古香古韵的日出东方大片。

整个视频,是用一张图片生成的长镜头。

每个镜头中的人物,始终保持着稳定。

技术积累

此次进化,可灵文生视频基础大模型被无缝整合到图生视频和视频续写功能中,带来了更丰富、灵活的视频创作体验。

这些能力,都基于快手在AI大模型时代的不断布局。

快手先后发布了,通用大语言模型快意,文生图大模型可图,还有Direct-a-Video、Video-LaVIT、I2V-Adapter、UNIAA等视频生成关键技术。

恰逢近日在美国西雅图举行的国际计算机视觉顶会CVPR2024上,快手也同步发布了可灵大模型的图生视频和视频续写等最新功能,引起现场的强烈反响。

公开资料显示,今年快手共有8篇论文入选CVPR2024,彰显了其在该领域的深厚研究功底。

除了凭借创新的技术在CVPR上大放异彩之外,作为一家引领行业发展的公司,还要用战略眼光将技术落地到应用。

就在即将开幕的2024世界人工智能大会(WAIC)上,快手将举办以新AI·新应用·新生态为主题的大模型技术生态论坛。

届时,不仅会发布最新的大模型技术,还包括快手大模型技术矩阵全景、应用和落地现状等一系列多维度、多方向的战略讨论。


返回网站首页

本文评论
橙心优选兰州分公司_橙心优选在兰州重启运营,但合作方有更大的主动权
三星note系列即将终结   记者 |佘晓晨 编辑 |文姝琪   一度沉寂的橙心优选有了新动作。   近日,多方消息显示,滴滴旗下的社区团购平台橙心优选在兰州恢复运营。界面新闻...
日期:08-19
三个案例看懂区块链与物联网的“天作之合”!(区块链和物联网的关系)
《三个案例看懂区块链与物联网的“天作之合”! 》文章已经归档,不再展示相关内容,下文是的自动化写作机器人,通过算法提取的文章重点内容。这只AI还很年轻,欢迎联系我们帮它成长...
日期:08-07
互联网公司过年放假「多家互联网企业宣布除夕放假 包括字节跳动、腾讯、美团等」
12月8日 消息:据中新经纬报道,多家互联网企业宣布除夕安排放假,字节跳动、腾讯、美团、新浪、网易、滴滴等都已经内部宣布除夕放假。今年10月,国务院宣布2024年春节2月10日至17...
日期:12-09
快手Q3一心赚钱、用户破新高,用AI盘活评论区| 财报解读_快手三心
声明:本文来自于微信公众号 白鲸出海(ID:baijingapp),作者:辛童,授权转载发布。快手联合创始人兼 CEO 程一笑表示,“2023年第三季度,得益于核心业务收入增长、运营效率和 ROI 的持...
日期:11-23
七成遭遇商品货不对板 受访大学生期待直播购物“质”“量”并进
  今年“双11”预售的当晚,就读于河南一所高校的研究生曲翃佼“蹲点”参加了4场头部主播直播。从泡面零食、衣服鞋子,到护肤品彩妆……她直言自己一进入到直播间,就会被主播...
日期:10-28
创蓝:改变繁琐的工作,人工智能OCR来了!_ocr应用了人工智能技术的
  随着科技的发展,人工智能早已渗透进各个领域和行业,尤其是人工智能技术,在近几年逐渐被广泛应用,它的发展不仅为人们的生活带来各种变化,也为企业的发展提供了便利。   作...
日期:10-15
WinRAR 4.10 Beta 2测试版发布 支持小数分卷压缩_winrar 6.00 beta 2
  WinRAR 4.10今天发布了第二个Beta测试版,变化幅度没有此前的Beta 1那么大,只有小数容量的分卷压缩比较吸引人,不过这也意味着距离正式版又近了一步。   WinRAR 4.10 Bet...
日期:07-24
南方将开启10天雨雨雨模式:部分地区累计雨量大_南方今年雨水
5月10日消息,据国内多家媒体报道,预计今天夜间到12日,西南地区东部、江南、华南等地部分地区有大雨或暴雨、局地大暴雨,累积降水量30-80毫米,局地100-150毫米。iphone14短信打开...
日期:05-11
卡巴斯基公开信称只有技术才是核心_卡巴斯基 中国
  1月4日上午消息,卡巴斯基对外发布至网民的公开信,称在安全厂商大打口水战的安全行业,只有技术才是核心。   以下为卡巴斯基公开信全文:   尊敬的网民朋友:   在过去的...
日期:07-25
非诚勿扰宝马女是哪一期「非诚勿扰宝马女起诉离婚 自曝结婚半年内遭受 7 次家暴」
宝马女马诺再次引发热议,不过这次不是因为那句“宁愿坐在宝马里哭,也不愿意坐在自行车上笑”,而是因为她的婚变。近日,马诺自曝结婚半年内遭受了 7 次家暴,目前已向法院起诉离婚...
日期:01-23
玲娜贝儿正版公仔「因仿冒“玲娜贝儿”玩偶2.5万余件 两被告人被罚20余万元」
4月28日 消息:近日,上海市浦东新区人民法院审理了一起侵犯“玲娜贝儿”著作权刑事案件,并当庭作出一审判决。2021年3月12日,迪士尼企业公司创作完成“玲娜贝儿”(英文名:LinaBel...
日期:04-28
苹果手机余额宝收益怎么提现「苹果版“余额宝”开局迅猛!Apple Card四天吸金69亿元」
快科技5月2日消息,早些时候,苹果推出了被用户称为苹果版余额宝”的Apple Card高收益储蓄账户服务。今天,根据《福布斯》最新发布的报告,Apple Card服务仅开业前四天,就已经吸纳了...
日期:05-02
小米的第二辆电动助力自行车来了_小米电动自行车第三代助力
  众所周知,小米曾在2016年推出米家骑记电助力折叠自行车,当年在小米开启众筹不到一小时就火速完成并突破目标。简洁的折叠自行车外形和先进的力矩传感器造就了全新的骑行...
日期:12-19
告别6GB时代!曝iPhone 16/16 Plus内存升级_苹果16内存怎么扩充
快科技2月10日消息,据媒体报道,iPhone 16和iPhone 16 Plus都将升级为8GB内存,比iPhone 15、iPhone 15 Plus多2GB。苹果升级ios16时间和日期变模糊了这意味着iPhone全系告别6GB...
日期:02-10
Huggingface版自定义GPTs来啦!免费,只需2步无需任何代码
声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。蓝屏代码0x000000A0是什么意思定制的微信红包封面全球著名大模型开源平台Huggingface发布...
日期:02-05
贾跃亭 法拉第股份「法拉第未来执行董事长辞职 贾跃亭又将其收下」
外媒消息称,法拉第未来执行董事长苏珊斯文森 (Susan Swenson)已经官宣正式辞职。而辞职的原因是FF官方已经与公司大股东FF Top就融资和董事会重组,最后,根据董事会重组的结果来...
日期:10-11
股市大跌对比特币影响「追随股指 比特币价大跌3.4%下破20000美元大关」
加密货币反映了全球市场的情况,在杰罗姆·鲍威尔警告不要过早放松政策后,比特币跌破了过去两周交易的狭窄区间的底端:20000美元。数字资产基金经理Valkyrie Investments的研究...
日期:09-08
集合全行业资源,IC China赋能大产业协同「集合智造官网」
  为进一步加强全球集成电路产业交流与合作,促进产业链、供应链、价值链资源聚集和有效对接,由中国半导体行业协会、中国电子信息产业发展研究院主办的中国国际半导体博览会...
日期:07-06
她临危受命,耗时9个月打破了美国50年的技术垄断,令人为之钦佩_打破美国17年垄断
她临危受命,仅用九个月时间就打破了美国长达50年的技术垄断,为中国的西气东输工程做出巨大贡献,不仅完成了自主研发,还为国家每天省下两个亿。你没有听错,确实是每天省下2个亿,美...
日期:12-12
周杰伦演唱会提前半年卖票、退票扣30% 被指“吃相难看” 大麦回应
12月6日消息,大麦APP显示,周杰伦嘉年华”世界巡回演唱会将于2024年5月16日到19日在福州举行。以2024年5月16日场为例,12月9日开始抢票,看台票价为500-1200元不等,内场价为1600-20...
日期:12-07