您的位置:首页 > 互联网

超越Sora!AI视频模型StreamingT2V可生成120秒超长视频

发布时间:2024-03-26 15:22:28  来源:互联网     背景:

划重点:

⭐ StreamingT2V技术实现了长视频生成的突破,可生成高度一致且长度可扩展的视频。

⭐ 该技术核心构架包括条件注意力模块(CAM)和外观保持模块(APM),确保视频连续性和视觉质量。

⭐ 实现方法分为初始化、Streaming T2V生成和Streaming Refinement三个阶段,提高了视频生成的质量和分辨率。

小鹏汇天X2飞行汽车价格

3月26日 消息:近日,UT奥斯丁等机构提出的StreamingT2V技术引发了广泛关注,将AI视频生成推向了新的高度。这项技术突破了以往视频长度的限制,实现了生成高度一致且长度可扩展的视频。

StreamingT2V技术的核心构架包括条件注意力模块(CAM)和外观保持模块(APM)。CAM利用短期记忆单元确保视频连续性,而APM作为长期记忆单元保持视频中对象或场景的一致性。这两个模块的结合,使得生成的视频不仅动态连贯,而且视觉效果高质量。在测试中,研究人员用Streaming T2V生成1200帧,长达2分钟的视频。

具体实现方法分为三个阶段:初始化、Streaming T2V生成和Streaming Refinement。在初始化阶段,利用文本到视频模型创造视频的前16帧;接着进入Streaming T2V阶段,通过自回归技术生成后续帧,保证视频内容连贯性;最后,在Streaming Refinement阶段对生成的视频进行优化,提高画质和动态效果。

特色亮点包括:

2019年锦鲤奖品

  • 从文本描述生成2分钟的视频

  • 创建具有复杂动态运动的视频

  • 确保长视频中的时间一致性

魅族官网flyme登陆

该技术的出现标志着AI视频生成的新突破,不仅可以生成1200帧甚至无限长的视频,而且内容过渡自然平滑,丰富多样。与此同时,StreamingT2V技术的不断完善和提升也将进一步推动AI视频生成领域的发展,为视频内容创作提供更多可能性。

项目入口:https://top.aibase.com/tool/streamingt2v

论文地址:https://arxiv.org/abs/2403.14773


返回网站首页

本文评论
国轩高科宜春碳酸锂项目开工,预计明年第四季度竣工投产_国轩高科将在宜春投资115亿
  12 月 30 日消息,昨日,江西省宜丰县举行 2021 年第四季度重大项目集中开(竣)工仪式,宜丰国轩锂业项目正式破土动工。   宜丰国轩锂业有限公司是宜春国轩锂业股份有限公...
日期:09-20
蚂蚁推出云原生智能容量工具Kapacity V0.2 引入自研AI算法_蚂蚁云算官网
11月9日 消息:蚂蚁集团宣布推出Kapacity V0.2智能云容量技术工具,旨在解决云原生容量问题。该版本引入了蚂蚁自研的基于流量驱动的副本数预测AI 算法,实现了生产级的预测式弹...
日期:11-09
315曝光ETC卡禁用短信骗局:陌生短信不要信、不要点
3月15日 消息:今日晚间,315晚会还曝光了多起ETC卡禁用短信骗局。据报道,一些不法分子利用“ETC卡禁用”、“快递丢失理赔”等骗局来诈骗消费者。陈女士曾经收到一条关于她ETC...
日期:03-15
微软董事会比尔盖茨应当离开_盖茨加快抛出微软股票 给投资者敲响警钟
  据国外媒体报道,微软主席比尔·盖茨继续抛售微软的股票,其速度之快给投资者敲响了警钟。据管理部门本周一发布的文件披露,盖茨在2月3日出售了500万股微软的股票。上周五的...
日期:07-26
S23搭载超频版骁龙8 Gen2_仍是台积电4nm工艺 大家放心了-三星Galaxy
2日凌晨,全新的三星Galaxy S23系列正式发布,包含Galaxy S23、Galaxy S23+和Galaxy S23 Ultra三个版本,全系搭载高通骁龙8 Gen2移动平台,没有Exynos版本。随后该系列的国行先行者...
日期:09-20
不是2024年!分析师称苹果2025年才会商用micro LED屏
2月8日消息,据外媒报道,虽然多位分析师及爆料人士预测苹果Apple Watch Ultra在2024年就将升级micro LED屏,但面板供应链领域的知名分析师Ross Young,依旧维持在2025年开始采用的...
日期:02-08
高通第一财季营收94.63亿美元:净利同比降34%「高通一季度财报」
今日消息,高通公司发布了2023财年第一财季财报。天猫送货方式报告显示,高通第一财季营收为94.63亿美元,与上年同期的107.05亿美元相比下降12%;净利润为22.35亿美元,与上年同期的3...
日期:02-03
智邦国际是个什么公司「智邦国际:建立“一体化”管理思维,驱动企业高速增长」
(原标题:智邦国际:建立“一体化”管理思维,驱动企业高速增长) tcl战略与经营分析 增长成为企业的首要任务 每家企业的情况不一样,...
日期:11-11
IDC:三季度全球PC发货量总计7420万台 同比下降15%_idc服务器出货量数据
10月10日消息:根据国际数据公司(IDC)全球个人计算设备季度追踪的初步结果,2022第三季度,全球PC发货量总计7420万台,传统PC市场继续下滑。需求降温和供应不平衡导致同比收缩15.0%...
日期:10-27
小杨哥到底多有钱「小杨哥谈去年缴税2个亿 称这是应该交的钱」
去年,国内知名网红小杨哥以 2 亿元的税额成为交税榜首。他强调对纳税义务的认真态度,表示应该交的税务一定要交,拒绝了过多的合理避税建议。天猫精灵cc8和小度1c小杨哥在回顾去...
日期:12-19
华为Mate 60 Pro推送鸿蒙OS 4新版升级 系统更稳定_2022年华为mate60pro
来源:中关村在线一个方一个令读什么美股又创新高华为近日向Mate 60 Pro用户推送了一次系统升级,更新日志显示,此版本为鸿蒙OS 4.0.0.121,大小为1.57GB。更新内容包括新增图片对...
日期:09-29
高通芯片5g_5G手机只是开始,高通实验室正探索未来应用
  花5分钟时间参观一下高通在圣地亚哥的核心工作室(现在更像是实验室),你会发现这里的一切都超越你对工作室的想象。空旷浩大的房间,过去被用于存储办公家具和箱子,而如今已...
日期:01-02
骁龙8 Gen3长焦王者!真我GT5 Pro搭载索尼IMX890潜望长焦_真我gt骁龙888评测
快科技12月7日消息,真我GT5 Pro正式发布。该机配备了索尼IMX890潜望长焦,这枚传感器拥有1/1.56英寸超大底,是当下行业最大底的潜望长焦镜头,感光能力对比普通的直立式长焦提升21...
日期:12-07
AOL在1000万美元专利侵权案中败诉
  北京时间11月12日凌晨消息,美国一个联邦法庭陪审团本周作出判决称,AOL在互联网过滤软件开发商Bascom Global Internet Services(以下简称“Bascom”)的1000万美元专利侵...
日期:07-24
简化签名体验:Linux基金会推出sigstore软件真实性验证服务
  致力推动开源创新的 Linux 基金会,刚刚宣布了一项旨在通过便捷的加密软件签名、提升软件供应链安全性的新服务。BetaNews 报道称,名为“sigstore”的这项辅助,使得软件开...
日期:07-16
比达:在线少儿英语二三线城市用户居多,哒哒英语用户满意度最高
  中国中产阶级的崛起,国际化程度进一步提升,以及家庭对教育投入不断加大,推动在线少儿英语教育市场用户规模和市场规模持续增长。   第三方数据挖掘及市场研究机构比达(...
日期:10-25
背景太假哥在新疆拍摄到北极熊?真相来了
8月1日消息,前不久,背景太假哥”@疆域阿力木在新疆放飞无人机时,意外拍摄到了一只白色的熊,并发视频称新疆竟然有北极熊?!有没有认识这个生物的?”昨晚,科普博主无穷小亮”在《网络...
日期:08-01
shopee跨境店和本土店「跨境电商巨头Shopee大规模毁约:刚落地新加坡,被告知offer没了」
  记者:程璐CL  “8月25日下午5点钟,我接到了一通跨洋电话,是Shopee HR打来的,告诉我公司收回offer的通知。我的第一反应是不敢相信。”周柏(化名)告诉界面新闻,8月28日,自己本...
日期:09-05
大学生技能挑战大赛圆满落幕,小布助手学术顾问委员会接续产学互融助推行业发展
  6月23日,由OPPO小布助手主办的AI大学生技能挑战大赛圆满落幕。在为期3个月的赛程中,来自国内外的2323支队伍报名参赛,1247支队伍有效报名,其中来自国际院校的队伍39支、来...
日期:01-28
《人世间》赢麻!成最佳中国电视剧 雷佳音吴越分获白玉兰最佳男女主角
6月23日晚,第28届上海电视节白玉兰绽放”颁奖典礼举行。演员雷佳音、演员吴越分别凭借在《人世间》《县委大院.中的出色表现,获得最佳男、女主角。与此同时,《人世间》和《县委...
日期:06-24