您的位置:首页 > 互联网

AI新风口?首个高质量「文生视频」模型Zeroscope引发开源大战:最低8G显存可跑

发布时间:2023-07-05 22:42:47  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】首个高质量文本转视频开源模型Zeroscope,仅需8G显存就能用!

文生图模型Stable Diffusion开源后,将「AI艺术」彻底平民化,只需一张消费级显卡即可制作出非常精美的图片。

而文本转视频领域,目前质量较高的只有Runway前不久推出的商用Gen-2模型,开源界还没有一个能打的模型。

最近,Huggingface上有作者发布了一个文生视频模型Zeroscope_v2,基于17亿参数量的ModelScope-text-to-video-synthesis模型进行二次开发。

图片

模型链接:https://huggingface.co/cerspense/zeroscope_v2_576w

相比于原版本,Zeroscope生成的视频没有水印,并且流畅度和分辨率都得到了提升,适配16:9的宽高比。

开发者cerspense表示,他的目标就是和Gen-2进行开源较量,即提高模型质量的同时,还能免费供大众使用。

小米走步机 跑步

Zeroscope_v2包括两个版本,其中Zeroscope_v2567w可以快速生成576x320像素分辨率、帧率为30帧/秒的视频,可用于视频概念的快速验证,只需要约7.9GB的显存即可运行。

Zeroscope_v2XL可以生成1024x576分辨率的高清视频,大约需要15.3GB的显存。

魅族9a

Zeroscope还可以与音乐生成工具MusicGen一起使用,快速制作一个纯原创短视频。

马斯克谈ai威胁论

Zeroscope模型的训练用到了9923个视频片段(clip)以及29769个标注帧,每个片段包括24帧。偏移噪声包括视频帧内对象的随机移位、帧定时(frame timings)的轻微变化或微小失真。

训练期间引入噪声可以增强模型对数据分布的理解,从而可以生成更多样化的逼真视频,并更有效地解释文本描述中的变化。

使用方法

使用stable diffusion webui

在Huggingface上下载zs2_XL目录下的权重文件,然后放到stable-diffusion-webui\models\ModelScope\t2v目录下即可。

在生成视频时,推荐的降噪强度值为0.66到0.85

使用Colab

图片

笔记链接:https://colab.research.google.com/drive/1TsZmatSu1-1lNBeOqz3_9Zq5P2c0xTTq?usp=sharing

先点击Step1下的运行按钮,等待安装,大约需要3分钟;

图片

当按钮旁边出现绿色复选标记时,继续执行下一步。

图片

点击想要安装模型附近的运行按钮,为了能够在Colab中快速获得3秒左右的剪辑视频,更推荐使用低分辨率的ZeroScope模型(576或448)。

图片

如果相运行更高分辨率模型(Potat1或ZeroScope XL),运行也会更费时间,需要做出权衡。

再次等待复选标记出现,继续执行下一步。

选择在Step2中安装并希望使用的模型型号,对于更高分辨率的模型,推荐下面的配置参数,不需要太长的生成时间。

图片

然后为目标视频效果输入提示词,也可以输入否定提示(negative prompts),再按下运行按钮。

等待一会后,生成的视频就会被放置在outputs目录下。

图片

extremely detailed, Futuristic Cityscape, blade runner, extremely cloudy, awardwinning, best quality,8k

非常详细,未来城市景观,叶片亚军,极端多云,获奖,最好的质量,8k

「文生视频」开源竞赛

目前来说,文生视频领域仍处于起步阶段,即便是最好的工具也只能生成几秒钟的视频,并且通常存在较大的视觉缺陷。

但其实文生图模型最初也面临着类似的问题,但仅仅几个月后就实现了照片级真实感。

不过与文生图模型不同的是,视频领域在训练和生成期间所需要的资源都要更比图像更多。

虽然谷歌已经研发出了Phenaki和Imagen Video模型,可以生成高分辨率、更长、逻辑连贯的视频片段,但公众无法使用到这两个模型;Meta的Make-a-Video模型也同样没有发布。

目前可用的工具仍然只有Runway的商用模型Gen-2,此次Zeroscope的发布也标志着文生视频领域第一个高质量开源模型的出现。

参考资料:

https://the-decoder.com/zeroscope-is-a-free-text-to-video-model-that-runs-on-modern-graphics-cards/


返回网站首页

本文评论
小米13曝光「999元!小米13 Ultra专业摄影套装白色版发布」
小米今日宣布推出小米13 Ultra专业摄影套装的白色版,售价依旧为999元,并已开始销售。该套装包含一个科技纳米皮质保护壳和一个无线摄影手柄,提供更舒适的握持体验和独特的物理...
日期:06-27
音悦台主体公司成老赖 累计被执行1376万「音悦台首页」
凤凰网科技讯2月21日消息,据天眼查App显示,音悦台关联公司为北京宽客网络技术有限公司,该公司目前存在多条被执行人信息,被执行总金额超1376万元。图源 天眼查小米11 pro与小米1...
日期:02-22
iqoo有平板吗「迄今最强天玑平板!iQOO Pad正式发布:首发2299元起」
快科技5月23日消息,今天,iQOO召开新品发布会,正式发布了iQOO的首款平板电脑:iQOO Pad。作为以游戏为主要定位的iQOO旗下的首款平板,iQOO Pad搭载了天玑9000 处理器,可以说是目前性...
日期:05-24
更新WhatsApp_WhatsApp 更新启动页品牌形象:删除“Facebook”,更改为“来自 Meta”
  11 月 2 日消息,据 9to5 Mac 报道,在 Facebook 上周宣布将集合 Facebook 本身、Messenger、WhatsApp、Instagram 等品牌名称为 Meta 后,该公司现在正在改变其应用程序的页...
日期:03-09
“众筹奇迹”《星际公民》3.18版本出严重问题:部分服务器直接掉线
毫无疑问,在游戏众筹的历史中,《星际公民》将是无法略过的,足以被称为奇迹”的一笔。这款科幻游戏已经筹得了超过4亿美元的收益,并且直到现在都在通过支付一定金额参与众筹赠送...
日期:03-14
中国联通支付公司名称已确定为“联通沃易付网络技术有限公司”
  通信世界网(CWW)4月15日消息 日前,在某业内会议上,中国联通支付公司筹备组组长戴任飞透露,中国联通支付公司名称已确定为“联通沃易付网络技术有限公司”,预计最快4月15日会...
日期:07-27
荣耀v40保价_荣耀V40保值换新套餐受追捧 26日再次开售
  日前,备受期待的荣耀V40正式发布,同时荣耀携手京东,推出了荣耀V40保值换新套餐,加99元就能享受保值换新服务,引发网友抢购热潮。现在,为了给更多人谋福利,第二批荣耀V40保值换...
日期:07-10
天威诚信助力云南德宏州房屋网签“掌上办理、不见面办理”
  为响应住建部《房屋交易合同网签备案业务规范(试行)》(以下简称《业务规范》)相关要求,云南省德宏州住房和城乡建设局按照州级统筹原则和创新发展的总体思路,率先在云南...
日期:07-17
水电费也算个人征信_新版个人征信报告今日上线,水电费信息尚未纳入
  1月19日起,中国人民银行征信中心将向社会公众和金融机构提供二代格式信用报告查询服务,水电费信息尚未纳入、显示5年还款记录、显示“共同借款”信息,此外还将增加个人信...
日期:03-25
川藏线一SUV逆行挡救护车生命通道 网友:自私自利的典范
6月6日消息,遇到堵车时,总有不守规矩的人出现,比如在高速公路跑应急车道的人,而近日发生在川藏线上的一幕更是让人愤慨不已。从现场拍摄的画面看,双车道的公路一侧遭遇大堵车,正常...
日期:06-06
如何看待华为1100亿行代码规模的代码库?华为云MVP这样说(华为程序员人均代码行)
  10月10日,有媒体刊登了一篇文章“1100亿行源代码,这家公司如何应对大规模代码托管的挑战”,预告上海QCon将邀请华为专家在技术裂变中的可信软件开发专场做演讲。文章中心...
日期:11-06
拉卡拉荣获第八届金蜜蜂奖
  近日,拉卡拉凭“给每个梦想一个机会”年度案例在第八届社交网络营销论坛暨金蜜蜂奖上脱颖而出,斩获品牌营销类金奖,拉卡拉的案例成为本次盛典中颇受关注的品牌传播案例之...
日期:11-13
厉以宁代表作「厉以宁手稿中的 10 个观点」
「企业家」这个词过时了。来源:B Impact(ID:tobjizhi)编辑:宇婷原标题:总理恩师厉以宁,86岁万字手稿道中的10个观点转自《新天地杂志》、新浪财经北京大学光华管理学院荣誉院长...
日期:03-01
火锅统一辣度标准?四川火锅协会回应 正在研究方案
最近,有网民在四川辣味论坛发文说微辣、中辣、特辣太主观了,应该更加科学地制定全省一致的火锅辣度指数。豆瓣高分3d动漫ipad2020年销量四川省火锅协会表示赞同网民的想法,正在...
日期:05-12
bing地图和谷歌地图「对标微软Bing+ChatGPT:谷歌搜索/地图/翻译全面AI化大升级」
受益于作为OpenAI主要投资者,微软第一时间将全球大火的AI聊天机器人ChatGPT集成到了Bing搜索中,千年老二”终于看到了反超谷歌搜索的希望。微软CEO纳德拉更是预言,ChatGPT给Bin...
日期:02-09
ios15摄像功能在哪「苹果 iPhone 15 Pro Max 将重新排列摄像头布局以容纳潜望镜镜头」
(ChinaZ.com)5月18日消息:苹果计划重新调整 iPhone 15 Pro Max 后置的三摄相机系统布局,以适应这款较大手机独有的新潜望镜摄像头技术。今年,iPhone 15 Pro Max 将首次采用潜...
日期:05-18
明天端午节 到底能不能说端午快乐?专家解答「明天端午节放不放假」
快科技6月21日,今晚下班就要开启端午节的假期了,明天也就是端午节的日子。新的一年网友们又提到了一个老生常谈的话题:端午到底能不能说快乐?其实这是一个最近几年才被大家关注...
日期:06-22
vivo 88游戏节_线上线下同欢乐,vivo游戏·88游戏节盛大开启
  近日,新一届的vivo游戏·88游戏节在vivo游戏中心正式拉开了序幕,不少网友都向这场声势浩大的游戏盛典投去了关注的目光。作为vivo专为玩家打造的游戏盛典,vivo游戏·88游...
日期:01-09
2020年最后100天70多场考试将至:70%考研族在淘宝复习(100天 考研)
2020年最大考试季来了。9月以来,全国硕士研究生考试、教师资格考试时间陆续敲定,将分别于12月底、10月底举行。据不完全统计,在2020年的最后100天里,超过70门考试正在赶来的路上...
日期:08-01
前程无忧没有迁移总部的打算 否认年底裁员(前程无忧 高层离职)
  日前有消息称,国内互联网招聘三巨头之一的前程无忧将在今年底实施“减员增效”计划,且正考虑将公司总部从上海搬迁至武汉。   昨日(12月29日),前程无忧上海总部相关负责人...
日期:07-25