您的位置:首页 > 互联网

VBench评测第一,5周访问量暴增8倍多! 这款国产AI视频生成器压番Runway

发布时间:2024-10-12 11:14:36  来源:互联网     背景:

声明:本文来自于微信公众号 机器之心,作者:机器之心,授权转载发布。

这可能是目前国内最好的视频大模型。

关闭电子烟实体店

家人们,这难道不是一部电影的切片?

来自@StevieMac03(I2V,图生视频)

谁能不被这头苏醒过来的小飞象萌化?

使用了图生视频(I2V)last frame功能,来自@alexgnewmedia

荣耀新一代智能旗舰机

讲真,要不是在 X 上晃悠时突然被这几个视频 砸中,咱还真不知道 MiniMax ,中国估值最高的大模型公司之一 ,又闷声整了个大活儿。

绷不住了,咋说碎就碎?

苏宁电器电热水器价格

魔法降临,石膏天使也会醒来。

这些海外自来水们秀出的魔法,正出自海螺 AI10月才上线的新功能图生视频。

五周前,MiniMax 发布了视频模型 abab-video-1,并在海螺 AI 网页版上线了视频创作入口(主要是文生视频),正式入局 AI 视频赛道。

旋即,海螺 AI 在过去一个月内迎来爆发式增长,月访问量超8倍, 增速领跑全球 AI 产品。

在 AI 产品榜·网站榜( web )上,海螺 AI 网页版9月访问量在两个增速榜排名第一,全球增速榜 TOP1、国内增速榜 TOP1,增速高达867.41%。

MiniMax稀宇科技,赞229

海螺 AI 官网链接:https://hailuoai.com/video

封印解除,创意狂欢

2024年,没有比 AI 视频生成更卷的战场。

海螺 AI出征不算早,上线仅过月余,就吸引了大批专业人士,包括电影导演、制片人、数字艺术家、游戏开发者、KOL 等,遍布全球180多个地区。

无论创作者想要创作超现实主义作品、探索幻想和科幻主题,还是深入研究动漫和抽象视觉效果,海螺 AI 都能提供广泛的选择,满足不同创作需求。

一系列恶搞英国地狱厨神Gordon Ramsey 的 AI 视频,火爆出圈,网友用的正是海螺 AI 。

这位以爆粗口闻名的厨师总是卷入各种奇怪场面,要么和一只夹住裆部的龙虾搏斗,要么穿着 Slayer(美国重金属乐队)的 T 恤敲打肉排,又或者坐在厨房中间的马桶上。

再配上欢快的背景音乐,整个喜剧效果拉满。

现实题材中,情绪表达一直是一个难题——无论是对 AI 、还是明星来说,但自来水们已册封海螺 AI 为动画表情之王。

AI 设计师 Pierrick Chevallier 用过后惊呼细节和真实感已经属于另一个 Level 了。

来自Pierrick Chevallier | IA @CharaspowerAI

新加坡电影导演 EHuanglu 用它生成了一位女性的面部特写( T2V ),从快乐到悲伤,最后捂脸哭泣,情绪变化演绎相当到位。

该视频已有近30万次观看,评论区上百位网友争相抄作业。

科幻创作,也是很多专业人士、AI 爱好者一展创意的重要场景。

知名导演 Dave Clark 第一次利用海螺 AI 创作的星球大战片段( T2V ),一度在网络疯传。

试用了最新的图生视频( I2V )后,这位导演直言,我一直在等待这种类型的恐龙运动。

这只外星生物的面部细微动作( I2V ),可还行?

来自Alexandra Aisling@AllaAisling

动漫题材( I2V )也不在话下。请注意,主人公的鞋子细节。

来自@02121976_yama2

除了提供广泛的风格选择,媲美电影的质感也给海螺 AI 再上大分。

看看这个视频( T2V )。人物身体运动、情感表现以及整体画面质感,越来越接近纯粹的电影。

来自Particle Panic@Magiermogul

据说,海螺 AI 不用特效模板,只依靠模型综合能力实现最顶级的影视特效。

有导演曾在电影中使用3D 软件进行这种灾难场面制作,但要达到类似效果非常困难。

现在,海螺AI( I2V )可以轻松完成。

来自tabi_yume@U7991688174711

一些网友、YouTube 主在比较海螺 AI 与最好的视频生成器 Runway、国内快手的可灵后发现,在生成运动方面,海螺 AI 明显属于下一个 Level,尤其是人体动作的流畅性和逼真性,比 Runway、Luma AI 等竞对都要好。

有博主甚至认为,在人物动作上,海螺 AI 的性能足以媲美甚至超越市面上其他领先的 AI 视频生成器。

你看,这个视频中( I2V )的女人转向一侧,从眼镜、头发、衣服到所有东西,均保持一致,海螺 AI 合乎逻辑地填补了缺失信息!

苹果7屏幕材质

一位电影制作人使用海螺 AI( I2V )后觉得很疯狂。

看第一帧,只能看见怪物的一只胳膊和手。但海螺 AI 居然可以自己脑补出新胳膊和手,还完美地融入了现有视频。

来自 Uncanny Harry AI@Uncanny_Harry

X 用户 Heather Cooper 曾发起线上投票,针对同样的提示,谁的表现最好?

评论区多数人将票投给了海螺 AI。

来自Heather Cooper@HBCoop_,提示词,"Tracking shot of a curator standing and speaking to the camera as she welcomes museum guests. Warm, inviting atmosphere."

除了生成动作方面的领先,几乎所有用户都承认海螺 AI 文本响应很好,能够较为准确地将提示词中的元素体现在视频中。

士兵转向摄像机,走向镜头,并用枪对准它,海螺 AI 抓住了每一个方位细节。

严格遵循指令中的运镜要求,也是一个典型例子。

凭借对90年代人物着装风格、建筑样式的准确还原,以及特殊鱼眼镜头下滑板动作的精准把控,这个视频让海螺 AI 在 reddit 中迎来好评。

目前,海螺 AI 视频模型在 VBench(视频生成模型评测框架)的第三方独立测试结果中综合排名第一,在画面质量、连贯性、流畅性等多维度均处于领先地位。

最近,香港中文大学和腾讯研究人员通过 VideoGen-Eval 项目,对当前主流AI视频生成模型进行了全面评估,肯定了海螺 AI 在文本控制方面突出能力,尤其在人物表情、运镜、多镜头生成和主体动态方面表现优异。

除了老司机,对于此前未接触过 AI 的新人而言,海螺 AI 也非常友好。

一位名叫 Ksenia_Galushkina 的艺术家新手,花了两天半时间,用海螺 AI 生成80多条视频,制作完成了这条迷你艺术片。

超戏精的海螺 AI,要干掉好莱坞?

俗话说得好,光说不练假把式。海螺 AI 视频模型的实力究竟如何,还得看一手评测。

接下来,我们从海螺 AI 的拿手绝活开始试水。

打个响指,金箍棒秒变笛子

海螺 AI 上新的图生视频功能,不仅能准确识别上传的图片,还能准确理解超过图片内容之外的复杂文本。

换句话说,创作者可以化身任性的导演,只需下个指令,海螺 AI 就会发挥充分的想象力予以实现。

例如,让《武林外传》中的佟掌柜和邢捕头,上演一出苦情戏。

(图生视频。Prompt:女人悲伤地哭了起来,男人抱住并安慰她。)

不得不说,海螺 AI 的生成效果相当惊艳。佟掌柜眉一皱、嘴一撅,哭泣的表情非常逼真,邢捕头拥抱的动作也很自然流畅。

更难能可贵的是,虽然表情变化和动作幅度都较大,但画面并未崩坏。

再比如被网友玩坏了的分心男友经典梗图。我们输入 Prompt:穿红衣服的女生转身,三个人拥抱在一起。

海螺 AI 完美遵循了文字指令,红衣女子转身,和身后的一对情侣拥抱,整套动作一气呵成,没有任何卡顿。

尤其是六只胳膊交叠在一起,很容易出现扭曲变形,但它生成的视频中,几乎没什么明显的 bug。

我们还拿它各种折腾世界名画《蒙娜丽莎》。

(Prompt:蒙娜丽莎拿起手机,然后打起了电话。)

(Prompt:蒙娜丽莎戴上墨镜。)

海螺 AI 很会无中生有,手里要么掏出个大哥大式儿的手机,扣在耳边假装打电话;要么摸出个赛博朋克风格的墨镜,骂骂咧咧地架在鼻梁上,光影、色调等细节处理得都挺到位。

最让人惊喜的,还得是它对图片中物品的精准控制。

比如那张著名的地铁老人看手机的表情包。

不少人应该都见识过他吃手机的 AI 视频,这次我们来一次难度升级:老人拿着的手机变成鸡腿,并吃了起来。

上一秒老人还嫌弃地看着手机,下一秒就变成了鸡腿,然后大快朵颐。

为了体现地铁的高速运行,海螺 AI 对背景的渲染也很逼真,窗外的绿树快速后撤,环境不断变化,增强了沉浸感。

还有让猴哥的金箍棒秒变笛子,由此可见,海螺 AI 能够很好地解构指令框架和深层语义,并在视频生成中加以整合。

(prompt:男子手中的棍子变成了笛子。)

一张自拍 + 一个目的地,想去哪就去哪

在电影《镜像世界》中,导演使用大量特殊镜头和后期制作技术,让小哥从镜子中穿越到另一个时空。

而现在要完成这一效果,只需要一张自拍和一个目的地,海螺 AI 就能实现跨屏联动。

例如,将一位美女的照片和一幅风景图拼在一起,然后输入 prompt:女子走向绿地,站在草地上,望着美丽的湖面,镜头缓缓左移。

来瞅瞅效果:

右边的美女完美融合到左边的草地场景中,并且主体从原场景进入目标场景后,光影、色调都会完美嵌入新场景的设定。

(prompt:女子走向红色的森林列车,镜头缓缓左移。)

海螺 AI 按照文字描述,镜头随着女子的运动轨迹而移动,拼接处也逐渐消失。

轻松搞定好莱坞级特效

AI 时代,要有一颗会整活儿的心。

网友们就开发出各种特效玩法,比如 CG 合成、碎片化、变身、爆炸、流体……

要知道,特效这玩意儿,那是嘎嘎费钱。就拿《阿凡达》来说,它的总制作成本为2.37亿美元,其中特效成本就占了1.5亿美元。

财大气粗的电影制作公司可以狠砸真金白银,但对于独立电影人来说,一分钱都难倒英雄汉。

如今海螺 AI 不用特效模板,只依靠模型综合能力就能轻松实现好莱坞级别的特效,真・人人都能当导演。

X 网友 Stylez Morales 就用了一张图和一句提示词,得到一段变身特效镜头。

一个变形金刚机器人突然变身成一辆超跑,在赛博朋克的街道上疾驰,这画面,真有一种电影级别的超现实视觉效果。

(Prompt:dramatic action scene dynamic camera shot of a transformer robot running down a futuristic dystopian cybersteampunk street avoiding explosions and transforms into a highly advanced supercar to get away atmospheric cinematic hyperreal photorealistic award winning blockbuster movie directed by Michael bay)

再比如拟人特效。毛茸茸的玩具小鹿突然奔跑起来。

(Prompt:小鹿向前跑动。)

玩具小狗突然复活,还招朋引伴。

(Prompt:另一只小狗走进画面,两只小狗玩了起来。)

爆炸特效。《浴血黑帮》中的三兄弟大步流星往前走,身后的建筑在一片爆炸中摧毁。

(Prompt:三个男人往前走,后面的建筑爆炸。)

艺术审美在线

海螺 AI 在艺术审美上,也超能打。

它能用专业级调光与构图营造美学氛围,精细控制光影效果与景别变化,画面质感媲美大片。

比如一只拟人化的小羊在森林里跳舞。

画质高清,镜头缓慢推进,毛茸茸的小羊羔蹦跶着,耳朵也有节奏地上下扇动,效果丝毫不输迪士尼动画。

再来看看海螺 AI 制作的时尚大片。

女模特摆着各种时尚 pose,表情自然且富有表现力,头发也会随着动作而飘动,大衣纽扣等细节也处理得很精细。

(Prompt:Fashion blockbuster, the female model strikes a fashionable pose, with the camera following closely.)

我们还上传了一张戴着墨镜、身穿西装、端着酒杯的男模特图片,然后输入 Prompt:男人开心地举起酒杯,然后从画面左侧走出来一位美女。

海螺 AI 完成度相当高,画面也没有模糊、扭曲等问题。

与 Runway 同台竞技

没有对比,就没有发言权,让海螺 AI 和 Runway 打个擂台,谁强谁弱也就一目了然。

我们就先用 OpenAI 创始四人组的照片打头阵。

上传同样的照片,输入同样的提示词:The three people sitting on the sofa stand up and walk out of the frame to the left.

这是海螺 AI 的生成效果:

这是 Runway Gen-3Alpha Turbo 的效果:

海螺 AI 严格遵循提示词,坐在沙发上的 Ilya、Greg、Murati 站起来,向左走出画面,独留 Altman 站在原地凌乱;而 Runway 生成的画面则崩得离谱,照片中的四个人飞出沙发,完全没有遵循物理世界的运动规律,甚至还出现了脑袋360度旋转的诡异画面。

再来一个多人物场景。

Prompt:strong man with cowboy hat in bar drinking beer with several women

海螺 AI 生成的画面,细节更丰富,场景更复杂,人物表情也更自然。

相比之下,Runway 的镜头较为简单,男子喝啤酒时,杯中的啤酒没有减少,左边女生的手部也出现了莫名其妙的动作。

Prompt:flying toward of a wide shot of an extremely large nuclear powered monster emerging from a fierce storm vortex walking over a city, epic shot in a cinematic fashion, pure destruction.

海螺 AI 的电影质感、画面丰富度更高,怪兽展现得也更生动。

Runway 则直接缺失了怪物主题,没有准确理解 prompt 的含义。

这可能是目前国内最好的视频大模型。

而在已经体验过的人群中,他们毫无例外地将海螺 AI 归入第一梯队。

如果说,9月的海螺 AI 已经令人印象深刻,那么,新增图生视频的海螺 AI 又更上一层楼。它并不完美,但比大家试过的许多 AI 视频模型都要好。

神奇海螺的智慧和魔力是不容被质疑的,既然 Sora 迟迟不来,为什么不问问神奇海螺呢?

大家还等什么?快去体验一波吧。

海螺AI官网链接:https://hailuoai.com/video


返回网站首页

本文评论
一键刷机app「一键刷机助手官网」
一键刷机助手官网,是一款提供Android系统刷机服务的软件。随着智能手机数量的增加,对于许多安卓用户来说,刷机已经成为了一件常见的事情。不同于iOS系统,安卓系统有着更高的可塑...
日期:05-29
张朝阳大楼「张朝阳CityRun解锁北京大运河森林公园」
【】4月18日消息,搜狐创始人、董事局主席兼首席执行官张朝阳CityRun解锁北京大运河森林公园,慢跑5公里重温漕运历史,继续“减肚子”“瘦脸”为即将到来的播主大会预热。作为北...
日期:04-18
大爷买包子付196956元 店主懵逼吓得直接报警「男子买包子」
最近,浙江杭州有一位老先生到包子店购买了3个包子,当他完成支付后,语音提示显示到账金额为196956元,让店主大吃一惊。视频显示,老先生听到金额后,也惊得拍大腿。等稍微冷静下来后,...
日期:04-21
对标苹果14!Mate50卖爆 华为手机今年出货激增:余承东称没5G用户也认可
时隔两年,华为推出Mate 50系列,由于种种因素制约,导致这款手机不能支持5G等,但丝毫不影响大家对它的喜爱。作为跟苹果14争人气和关注的安卓旗舰机,Mate 50发布后就备受关注,所以按...
日期:11-08
年度重磅超英剧《黑袍纠察队》第四季开播:首播三集看爽_黑袍纠察队第一季第四集解说
快科技6月13日消息,年度重磅超级英雄美剧《黑袍纠察队》第四季今日正式开播,首播直接放出三集,之后每周四周更一集。《黑袍纠察队》第四季在烂番茄获得49条媒体评价,收获86%的新...
日期:06-14
Gartner:第一季度全球手机销量同比增长19%(idc中国季度手机市场跟踪报告)
腾讯科技讯(中涛)北京时间5月19日消息,据国外媒体报道,美国知名市场研究公司Gartner今天发布的最新统计报告显示,今年第一季度期间,全球销售到消费者手中的移动通信设备总量为4.2...
日期:07-28
哈啰出行闯红灯「哈啰单车“预防闯红灯”专利公布:闯红灯就“叫唤”」
电动自行车闯红灯,已经几乎成为道路特色”,尤其是外卖、快递等人群,更是闯红灯重灾区。为此,哈啰单车也做出了自己的应对方案。创维电视11月15日,据国家知识产权局中国专利公布公...
日期:11-16
满地好货等你来“白捡” 618多人运动如何参与?
  拼购是现在非常火的一种购物方式,目前也有不少电商平台都推出了拼购服务,但是自从拼购模式被电商推出以来,面临着很大的舆论压力以及质疑,原因就是虽然价格低廉,但是售卖的...
日期:07-14
韩央行报告称能否复苏得看中国手机市场,韩国半导体出口额持续下滑
5 月 29 日消息,据韩媒 Digital Times 报道,韩国央行发布的最新报告显示,韩国半导体出口额自去年 8 月开始持续下滑,其中去年第四季度下滑 24.5%,今年第一季度和四月份则分别下滑...
日期:09-26
流量褪去的淄博“鸭头小哥”:债务已还清 继续做好鸭货生意_山东鸭头
近日,淄博“鸭头小哥”在接受采访时表示,他已还清创业欠下的债务。虽然流量有所降低,但他将继续努力,做好自己的鸭货生意。今年上半年,淄博烧烤在全国走红,吸引了大量游客前来品尝...
日期:12-27
微软设计语言「微软发布小语言模型AI Phi-2 性能优于Llama 2、Mistral 7B」
12月13日 消息:微软研究院今天宣布发布其 Phi-2小语言模型(SML),这是一种文本到文本的人工智能程序,具有27亿个参数。Phi-2的性能可与其他更大的模型相媲美,包括 Meta 的 Llama2-...
日期:12-13
快递新规落地,电商平台与商家如何破解“低价竞争”困局?_快递行业价格战如何解决
声明:本文来自于微信公众号 鸟哥笔记(ID:niaoge8),作者:蟹-,授权转载发布。大家最近如果网购,都会有这样一个感受,快递普遍慢了很多,即使已经达到所在区域网点,也迟迟不派送。很多人...
日期:03-13
李开复称其创立的AI公司零一万物估值已超10亿美元 发布大模型Yi-34B
划重点:- 中国知名AI科学家李开复成立了一家名为零一万物(01.AI)的初创公司,致力于为中国市场开发本土大型语言模型(LLM)。- 该公司在成立仅七个月后发布了首个开源模型Yi-34B,该...
日期:11-06
苹果16寸续航时间「苹果史上最大:iPhone 16系列电池容量公布」
快科技9月20日消息,今天iPhone 16系列正式开卖,官网起售价是5999元。在iPhone 16系列首销之际,巴西监管机构公布了iPhone 16电池容量细节。具体来说,iPhone 16电池是3561mAh,比iP...
日期:09-20
美团外卖快到了不想要了怎么办「外卖涨不动了,但美团还有别的办法」
小米无线充电美团火速减亏的秘密:减补贴、涨配送费。  文;|;董洁  编辑;|;乔芊  出品;|;36氪未来消费  微信ID;|;lslb168  宏观环境对一家企业的影响可以多延伸?除...
日期:08-28
哔哩哔哩将于9月8日发布2022年第二季度财报(哔哩哔哩将于9月8日发布2022年第二季度财报研究)
酷比全面屏手机 查看最新行情   讯 北京时间8月18日晚间消息,在线娱乐平台哔哩哔哩(B站,Nasdaq:BILI,HKEX: 9626)今日宣布,将于美国东部时间2022年9月8日美国...
日期:08-19
惠普台式电脑_惠普台式电脑如何进入bios设置
随着电脑的普及,惠普作为知名电脑品牌,也在市场上占据了一席之地。今天我们来聊聊。是惠普公司推出的一款桌面电脑产品,其具有性能优异、外观简约等特点。它采用了英特尔酷睿处...
日期:05-29
真冤!京东金融泄露隐私事件纯属躺枪_京东金融正规吗?会不会泄露客户隐私
  昨日凌晨2点多,微博@瘦出的肋骨已经消失的大侠阿木发布一条博文称,京东金融会获取用户敏感图片并上传,并给配上自录视频。一瓜激起千层浪,昨天上午还一度把京东金融送上热...
日期:05-28
B站第三季度营收58亿元 净亏损同比收窄36%「b站第三季度营收58亿元 净亏损同比收窄36万」
11月29日消息,哔哩哔哩(以下简称“B站”)公布了截至2022年9月30日的第三季度未经审计的财务报告。财报显示,B站三季度营收达57.9亿元人民币,同比增长11%,毛利率环比提升3.2个百分...
日期:11-30
《阿凡达》世界成真!我国科研团队成功打造出高亮发光植物_阿凡达 发光的植物
快科技8月17日消息,近日合肥神笔生物科技有限公司研发团队突破国外技术垄断,通过基因编辑技术等手段,打造出国内首株基因编辑高亮度夜晚自发光植物。据介绍,神笔生物合成生物部...
日期:08-17