您的位置:首页 > 互联网

AIGC的下个前沿将是视频生成 文本和图片之后

发布时间:2023-10-06 11:01:59  来源:互联网     背景:

3月21日消息,生成式人工智能(AIGC)在文本和图片生成方面已经取得了显著进展。几个月来,Dall-E、ChatGPT以及Stable Diffusion等服务创作了各种各样的文字和图片内容。现在,初创公司Runway AI正进入AIGC的下一个前沿领域——AI生成视频。

当地时间周一,总部位于纽约的Runway宣布推出名为Gen 2的系统,该系统可以根据少量用户提示生成简短视频。用户可以输入他们想要看到的视频描述,例如“一只猫行走在雨中”,Runway的系统将据此生成大约3秒钟的视频片段。此外,用户也可以上传图片作为系统参考或提示。

Runway是专注于制作AI电影和剪辑工具的公司,该公司宣布,现在并非所有人都能体验Gen 2,但用户可以提交申请。人们可以在Discord频道上注册并等待,该公司计划每周都增加更多测试用户。

不过,这次有限的发布代表了实验室外文本转视频生成的最成功案例。谷歌和Meta去年都展示了他们自己的文本转视频努力,利用AI生成了泰迪熊洗碗和在湖上泛舟等视频,但这两家公司都没有宣布将相关技术推进到研究阶段以外的计划。

自2018年以来,Runway始终致力于研发AI工具,并于去年年底筹集了5000万美元资金。这家初创公司帮助创建了原始版本的Stable Diffusion,这是一种文本转图像AI模型,自推出以后大受欢迎,并由Stability AI公司进一步开发。

Runway联合创始人兼首席执行官克里斯·瓦伦苏拉(Cris Valenzuela)上周对Gen 2进行了现场演示,比如生成“无人机拍摄的沙漠景观”。在几分钟内,Gen 2生成了只有几秒钟长的视频,尽管画面显得有点扭曲,但不可否认的是,视频非常像是无人机在沙漠上拍摄的片段。地平线上可以看到蓝天和白云,视频画面右下角的太阳刚刚升起(也可能是落下),其光线突出了下面的棕色沙丘。

Gen 2还根据提示生成了其他几个视频:一段眼球的特写视频看起来很清晰,非常像人类眼睛;但一段徒步旅行者穿过丛林的视频显示,它在生成逼真的腿部和行走动作方面可能仍然存在问题。瓦伦苏拉说,这个模型还没有完全“弄清楚”如何准确地描述物体的运动。

虽然更长的提示可能会帮助生成更详细的图像,比如Dall-E或Stable Diffusion,但瓦伦苏拉说,Gen 2越简单越好。他认为Gen 2为艺术家、设计师和电影制作人提供了新的工具,可以帮助他们完成创作过程,并让这些工具的价格比过去更实惠,也更容易获得。

Gen 2建立在Runway现有的、名为Gen 1的AI模型基础之上,Runway于2月份开始在Discord上测试该模型。瓦伦苏拉表示,Gen 1目前拥有数千名用户。这种AI模型要求用户上传一段视频作为输入源,然后利用这段视频(以及文本提示或图片)来生成新的、无声的3秒视频。例如,你可以上传一张猫追逐玩具的照片,并附上文字“可爱的钩编风格”,Gen 1就会生成一段钩编猫追逐玩具的视频。

ipad mini4外接显示器

用Gen 2 AI模型生成的视频也是无声的,但瓦伦苏拉称,该公司正在研究音频生成技术,希望最终能创造出一种既能产生图像又能产生声音的系统。

Gen 2的首次亮相表明,初创公司在AIGC领域取得的进展非常快。AIGC可以吸收用户输入并生成文本或图像等新内容,其中Stable Diffusion、Open的图像生成模型Dall-E和聊天机器人ChatGPT等系统,近几个月来已经公开发布并受到欢迎。

但与此同时,它们的扩散也引发了法律和伦理方面的担忧。数字取证专家、加州大学伯克利分校教授哈尼·法里德(Hany Farid)看了几段由Gen 2生成的视频,称它们看起来“非常酷”,但他补充说,用这种技术制作的视频迟早将被滥用。他断言:“有些人会试图用这种技术做坏事。”

Runway正在使用AI和人类控制相结合的方式来防止用户使用Gen 2生成包含色情、暴力内容或侵犯版权的视频,但这种方法并非总是有效。

与AI行业的其他领域一样,文本转视频技术正在快速发展。虽然Gen 2目前的图像质量看起来有点模糊、不太稳定,很容易让人发现破绽,但瓦伦苏拉预计它会很快改善。他说:“这套系统还处于早期阶段。随着时间的推移,它会变得越来越好。”


返回网站首页

本文评论
台积电招了:扩建美国二期工厂 要把3nm带去
前两天,华尔街称台积电正酝酿在美国亚利桑那州扩建二期工厂,工艺直指先进的3nm节点。小米手机记录仪对此,台积电在发布10月运营报告的同时予以否认。不过,EE Times收到台积电的...
日期:11-17
网易《永劫无间》名誉权案胜诉:UP主恶意抹黑属实 将道歉赔偿_永劫无间被网易买了吗
网易《永劫无间》官网发布消息称,此前该公司起诉UP主侵权案件告终,恶意抹黑行为属实,UP主将公开道歉。网易表示,2023年1月,昵称为贱圣小红的UP主(UID:4921875)使用其账号发布了标题...
日期:06-13
苹果A17芯片性能曝光:比上代提升近50%「苹果a1176参数」
从目前泄露的信息来看,新的A17芯片将配备6核CPU和6核GPU,相比目前的A16芯片,GPU核心数量增加了一个。此外,A17芯片的最大主频也将从3.46GHz提升到3.70GHz。据一位国外博主预测,A1...
日期:08-12
研究生被拟聘为垃圾分类专管员 街道办:非编制岗位「垃圾分类事业单位」
7月5日消息,最近广东广州一街道办发布了垃圾分类专管员拟聘用人员名单公告,公告名单上显示两人的学历分别为研究生和本科生,不少网友认为这是大材小用。对此,黄埔区联和街综合发...
日期:07-05
3不支持订单直接转新款 需重新下订 「特斯拉新款Model」「特斯拉3的订单可以转y吗」
今日,特斯拉的 Model3焕新版开启预售,预计今年第四季度开始交付。提供普通版和长续航焕新版两个版本,价格分别为25.99万元和29.59万元。魅族mx4pro新车的预售价格超过了市场和...
日期:09-12
铁路部门启动“双11”电商网购高峰期快运服务 提供当日达服务「铁路“双十一”电商黄金周运输服务启动」
11月1日 消息:今天,中国铁路公众号宣布启动“双11”电商网购高峰期快运服务。铁路部门将为“双11”电商网购高峰提供安全高效、方便快捷的铁路快运服务。具体包括:新增31个办...
日期:11-03
曾宣称创造室温超导的美科学家材料科学论文又被撤回,将面临调查
8月16日消息,今年3月,美国罗切斯特大学的物理学家兰加·迪亚斯(Ranga Dias)声称开发出了一种室温超导材料,受到业内的强烈关注。当地时间本周二,知名物理学杂志《物理评论快报》(P...
日期:08-16
今年不公开双11交易额「双 11交易额」
11月12日消息,第14届天猫双11于今日零点收官。天猫表示,今年天猫双11稳中向好,交易规模与去年持平。尽管存在国际环境、疫情反复等不确定因素,今年天猫双11表现稳健,展现出中国消...
日期:11-14
淘宝的垄断_质疑淘宝行霸王权 分拆大淘宝破除网购垄断
  10月11日,众多小卖家聚集在YY语音聊天34158频道,甚至拉来不甚相关的人士一起疯狂在淘宝商场大卖家网页“购物”。攻击,像铺天盖地的蝗虫,拍商品、给差评、拒付款,一个个大商...
日期:07-24
土耳其东部发生4.9级地震「土耳其叙利亚地震或致中国发生7-8级强震?专家回应:没意义」
2月6日,土耳其一天内两次发生7.8级地震,还有多次高强度余震,导致土耳其和叙利亚伤亡惨重。教培机构巨头2月12日,网上流传一篇文章称,土叙地震可能致中国3年内发生7-8级强震。这篇...
日期:02-13
美团股票最近大涨「港股美团收跌超9% 快手跌超4%」
  讯 8月16日下午消息,香港恒生指数收跌1.05%,恒生科技指数收跌2.03%。港股美团收跌超9%,盘中市值一度跌破万亿港元。此前有市场消息称,腾讯计划出售美团的全部或大部分股权。...
日期:10-18
NASA发现以前未知的南极冰层损失:“南极洲的边缘正在崩塌”_南极出现冰山断裂的影响
在预测全球海平面上升方面,最大的不确定性是南极洲的冰层损失将如何随着气候变暖而加速。由位于南加州的美国宇航局(NASA)喷气推进实验室(JPL)的研究人员领导的两项研究揭示了关...
日期:09-27
658元,咪咕讯飞电子阅读器预售:阅读器中的智能战斗机(咪咕科大讯飞电子阅读器)
  3月19日,科大讯飞正式对外推出与咪咕联合出品的新型智能阅读器:咪咕讯飞电子阅读器,并在京东同步开启预售,官方售价658元人民币。   咪咕讯飞电子阅读器采用6英寸E-ink...
日期:05-10
GoldenGate同步丢数据怎么办?人大金仓亮出黑科技
随着数字化进程的加速数据库面临升级但在数据迁移的过程中用户时常担心数据一致性无法保证出现故障后缺乏回滚手段影响业务正常运转为让用户放心、敢用金仓异构数据同步软件...
日期:07-07
youtube转换器「Youtube transcript:超好用的YouTube 转录工具」
7月25日 消息:YouTube 转录工具是一个免费的在线工具,可将 YouTube 视频转化为准确的文字转录和字幕。无论您是学生、研究人员、内容创作者还是 SEO 专业人员,都可以轻松生成...
日期:07-25
RTX 4070刚刚发布就要变“心”:生生砍掉42%核心
一款GPU核心用于多款显卡,一款显卡使用多款GPU核心。这对于NVIDIA显卡都是常规操作,RTX 40系列也终于要开始混用了。据快科技了解,发布还不到一个月的RTX 4070,除了已有的AD104...
日期:05-10
5G应用产业方阵联合发布《5G商业模式创新发展白皮书(2023)》_5g时代商业模式最有可能包括
通信世界网消息(CWW)自2019年正式商用以来,全球5G商用发展迅速。截至2023年3月,5G网络已覆盖全球30.2%的人口,全球92个国家/地区的252家网络运营商宣称开始提供5G业务。在这一大...
日期:07-01
微软去年11月美国搜索市场份额高达29%(微软的市场份额)
  1月4日消息,据techcrunch报道,数周前comScore发表的报告称,2010年11月微软的必应市场份额达到空前的11.8%。但另一家调查公司Compete称,必应的市场份额实际上远远高于此。...
日期:07-25
MAXHUB会议平板赋能豫企会议智能升级!(maxhub智能会议平板怎么样)
  摘要: 5月6日,郑州市政府办公厅印发《郑州市加大全社会研发投入的若干政策措施》,完善加大全社会研发投入支持政策,提高企业技术创新能力,推动郑州市经济高质量发展。企业...
日期:11-21
米哈游《原神》IP营销动作频频,上线两周年后“钱”景几何「米哈游原神投资」
  蓝鲸TMT 印婧 图片来源:东方IC   近日,米哈游《原神》官宣与动画制作公司ufotable(飞碟社)进行长期合作,与该公司共同制作的《原神》动画项目正式开启。  同时,这一游戏近...
日期:10-04