您的位置:首页 > 互联网

全球首款AI游戏诞生!无需游戏引擎,视频模型直出我的世界_我的世界ai优化mod

发布时间:2024-11-03 12:50:49  来源:互联网     背景:

声明:本文来自于微信公众号新智元,授权转载发布。

无需游戏引擎,视频基座模型直出实时交互可玩的Minecraft,初创公司Decart和Etched打造的Oasis已经做到了这一点。

现在,不用游戏引擎,AI就可以自动生成游戏了?

今天,两家初创公司Decart和Etched宣布,他们打造了一款世界上首个实时、可玩、可交互的世界模型——Oasis。

Oasis经过了数百万小时游戏视频的训练,仅接收用户的键盘输入即可实时生成开放世界游戏,但其中并不包含任何游戏引擎,只有一个AI基座模型。

游戏允许玩家进行移动、跳跃、拾取物品、打破砖块等操作,生成的视频内容中不仅包含图形学的渲染,也能体现出对物理原则和游戏规则的理解。

我的世界aidream

在没有任何延迟的情况下,Oasis在H100上运行时能以360p的分辨率实现每秒20帧的渲染,并实时生成视频交互内容。

此前,虽然谷歌已经发布了首个AI游戏引擎GameNGen,但并没有在发布论文后开源。

ar游戏我的世界

然而,此次两家初创联手研发的Oasis不仅开源了代码,还公开了500M参数版本的模型权重。

ar游戏我的世界

https://github.com/etched-ai/open-oasis

我的世界ai优化mod

https://huggingface.co/Etched/oasis-500m/tree/main

此外,官网上已经放出了游戏demo,感兴趣的玩家从项目官网进入即可在网页端试玩,体会一下复刻Minecraft的画风。

ai玩我的世界

项目网址:https://oasis.decart.ai/

虽然全AI生成是一大亮点,但在动辄4K HDR的的今天,360p的分辨率显得相当复古,可能对2024年的人类双眼不太友好。

幸好,如果在Etched打造的Sohu芯片上运行100B+参数的优化模型,就能达到4K级别的实时渲染,并发用户数量也将提升超过10x。

就在模型发布的今天,红杉资本也宣布以2100万美金投资Oasis背后的其中一家初创公司Decart。

minecraft:air

虽然Oasis看起来是一个游戏,但事实上,真正的技术重点却是视频和交互。

OpenAI今年发布的Sora可以说是视频模型的第一枪。随着视频模型开始扩展,它们正在学习代表整个物理世界和游戏,从而赋能一个全新的产品类别。

从短视频社交媒体到视频通话,再到流媒体,目前超过70%的互联网流量来自视频;但另一方面,视频的数据密集程度相当高,AI生成视频所需的FLOPs比文本或图像多出10×。

因此,大部分人工智能推理工作负载将来自视频。无论是游戏、教育还是生成式内容,大型、低延迟、交互式的视频模型将成为下一波人工智能产品的核心。

Oasis是如何炼成的

之前谷歌推出的GameNGen本质上仍是一个由AI驱动的游戏引擎,但Oasis的底层机制并不是游戏引擎,而是单一的视频生成模型,相当于一个能交互、可玩的Sora。

那么,Oasis究竟是如何做到的?

根据博客介绍,技术团队进行了数百次架构和数据实验,以确定用于快速生成自回归交互式视频的最佳架构。

Oasis模型均基于Transformer架构,由基ViT的变分自动编码器(VAE)和基于DiT的潜在扩散主干组成,使用了加速过的轴向、时空和因果注意力机制来克服长序列中的模型发散(divergence)。

我的世界aidream

Oasis的ViT+DiT架构

你可以简单把它理解一个分工明确的工厂,各个组件各司其职。

VAE就像是工厂里负责整理和识别原材料(游戏里的各种信息)的车间,它基于ViT(Vision Transformer)架构,能够对看到的游戏画面的相关信息进行加工整理。

主干即工厂的核心生产线,基于DiT(Diffusion Transformer)架构,负责将加工处理好的信息产出游戏内容,比如游戏场景、物体等。

同时,利用Decart的推理引擎,结合Etched公司的Sohu(Transformer架构的ASIC)芯片,实现了实时视频生成。

这种架构选择保证了在Sohu芯片上的稳定扩展和快速推理,并且以自回归方式生成帧,能够根据游戏输入实时交互。

Sora这类模型根据用户输入的文本内容直出视频,但Oasis使用Diffusion Forcing进行训练,每次只生成一帧,根据游戏输入在token级别调节每个帧,因此可操纵性很高。

之所以能够被称为世界模型,是因为Oasis已经能够了解复杂的游戏机制,例如理解物体和建筑、照明的物理规律等等。

我的世界ar下载软件

模型理解照明的物理原理

我的世界ar手游

放置立方体砖块

不过,在生成游戏画面的时候,还有一个问题就是如何保证时间稳定性。因为在自回归模型中,一个画面出错了,后面可能就会越来越乱,如同多米诺骨牌一样。

解决这个问题需要长上下文生成方面的创新,Oasis的方案是部署动态噪声(dynamic noising)。

minecraft:air

Decart团队也表示,未来将针对部分远处物体出现模糊、不确定对象的时间一致性等问题进行研究,逐步提升Oasis的游戏体验。

两家初创,强强联手

生成式交互体验新纪元这就来了吗?这两家初创公司又是什么来头?

据公开报道,Oasis模型是由Decart和Etched两家初创公司共同推出的。

Decart成立于2023年9月,一直致力于提高AI模型的效率和降低运行成本,提供更快、更可靠的训练以及实时推理,成立三个月后便与一家GPU云服务商达成了数百万美元的交易。

今天,红杉资本更是豪掷2100万美金对其进行了投资,合伙人Shaun Maguire更是大力称赞Decart的团队,认为他们是超精英的AI工程师、合作过的技术最有天赋的团队之一,正在将生成式体验推向极致。

我的世界ar下载软件

搜索知乎app

目前推出的Oasis只是一个实时推理方面的热身实验,接下来的几个月,他们还将发布更具有颠覆性的成果。

另一家初创Etched是来自美国的人工智能芯片公司,成立于2022年,三位核心创始人均为哈佛辍学生。

他们最耀眼的成绩,就是推出了Sohu——世界上第一个基于Transformer架构的ASIC芯片,专为LLM推理加速打造,不仅快过Groq,也能碾压英伟达最新的B200。

ar游戏我的世界

以Llama70B模型的推理性能为例,1张Sohu≈20张H100≈10张B200。

我的世界ar现实版下载

令人咂舌的性能背后,是Etched的一场豪赌般的权衡。

打造针对特定算法的AI芯片,将模型架构直接烧录到芯片的硬件结构中,这意味着无法运行其他模型,比如CNN、RNN或LSTM,但对Transformer来说,就能得到有史以来最快的芯片。

2022年,创始团队大胆预言——Transformer将占领世界,于是投入花了两年时间研发,得到了今天的Sohu。

Etched创始人之一Gavin Uberti表示,我们正在押注人工智能领域最大的赌注——一种只能运行Transformer模型的芯片,但其运行速度比GPU快几个数量级。也许注意力确实是你所需要的全部...

ai玩我的世界

能高效推理的AI芯片,对于极耗算力的视频生成而言,可以说是类似于Scaling Law的福音。

虽然文生视频模型已经达到了很好的生成效果,但速度非常慢,成本也很高。

视频中的每个帧包含数百甚至数千个token,必须并行处理多次才能完全去噪。最好的模型平均每秒生成不到一帧,而且每个用户每分钟的费用可能高达1美元。

这种低效高成本的推理,不得不说是视频生成模型用于实际应用的一大障碍,而这正是Sohu芯片期望解决的问题。

今年6月,Etched宣布已经筹集了1.2亿美元的资金用于扩大生产,并与台积电合作,以35人的精干团队直接放话挑战市值3万亿的英伟达。

我的世界ar手游

参考资料:

https://x.com/shaunmmaguire/status/1852092981022794128

https://www.decart.ai/articles/oasis-interactive-ai-video-game-model

https://www.etched.com/blog-posts/oasis


返回网站首页

本文评论
对特斯拉Autopilot长达两年调查即将结束-美监管部门
8月25日消息,当地时间周四美国国家公路交通安全管理局(NHTSA)代理局长表示,NHTSA对特斯拉高级驾驶辅助系统Autopilot长达两年的调查即将结束,可能很快发布公告。龙芯新一代cpu5...
日期:09-16
iQOO新机通过入网审核 有望搭载2K屏幕_iqoo有2k屏吗
据知名博主透露,iQOO新机iQOO 12系列已经通过入网审核,包括iQOO 12和iQOO 12 Pro两款机型。这两款新机采用了白玻璃、直角金属中框和圆角矩形Deco(装饰设计),并将提供多种配色选...
日期:10-22
全国门店联动陪伴精彩出游,荣耀五一嗨购狂欢活动启动在即_荣耀手机五一搞活动吗
节至人间欣向荣,作为春节之后首个小长假,2023年五一出行量井喷,旅游景点火爆已板上钉钉。荣耀将于4月29日-5月3日发起“五一出游 荣耀相伴”主题嗨购狂欢活动,集齐“出游首发站...
日期:09-17
奶奶不识字把狗粮当特产招待客人 被发现时一包快吃完:网友科普狗粮更营养
1月24日,湖南永州,周先生和奶奶过年聚在一起,聊起暑期时他从广东回家带回一包狗粮,奶奶不识字,以为是广东特产,拿狗粮招待来家里的街坊邻居,并称是巧克力豆。奶奶被提起糗事也乐不...
日期:01-27
最高优惠289元!海南免税店版iPhone 14 Plus开卖「海南免税店iphone13发」
大家注意啦!现在海南免税店版iPhone 14 Plus开卖了,最多可便宜289元。根据海南免税店发布的消息,iPhone 14 Plus手机128GB、256GB和512GB三个版本的价格分别是6790元、7665元...
日期:10-09
奥特曼:自认比o1聪明请举手_奥特曼被认出
声明:本文来自于微信公众量子位 | 公众号 QbitAI,作者:梦晨,授权转载发布。奥特曼:认为自己比o1更聪明的请举手。(台下一些人举手小白diy装机教程)奥特曼:到了o2你们还会这么想么?...
日期:10-05
特斯拉开卖530元限量玻璃杯  下单后2周内发货
11月15日 消息:特斯拉在其北美官方商城上架了一款75美元(约530元)的限量版玻璃杯。这款限量版玻璃杯配有金属支架,可以放置一瓶特斯拉龙舌兰酒。特斯拉指出,该杯子是清仓销售,并...
日期:11-17
公鸡打鸣影响考生?民警:晚上加餐 直接买下_公鸡打鸣可以辟邪吗
随着高考临近,一位即将步入考场的学生却因楼下公鸡的鸣叫而难以入眠,其母亲焦急之下选择了报警求助。接到报警后,民警迅速行动,深入调查,力求为这位学生创造一个宁静的备考环境。...
日期:06-11
除了AI,谷歌I/O开发者大会还有哪些看点?
自从微软支持的ChatGPT出现后,谷歌一夜之间从机器学习领域的引领者沦为追随者,仓促间推出的Bard没能在市场掀起水花。面对对手步步紧逼,谷歌必须拿出更能打的产品,而眼下,没有比...
日期:05-07
轩灵珠宝发布全新GOLO,拉开品牌升级序幕_轩灵珠宝是什么档次
轩灵珠宝于 2013 年成立于北京,是源于东方的高 级珠宝品牌。 2019 年起,轩灵珠宝从私人订制领域走向公众品牌。设计理念也从原先的“My Jewelry,My Story”升级为“一平方厘米...
日期:05-31
三星笔记本报价官网「三星笔记本报价」
三星作为全球知名的电子产品制造商,其笔记本电脑系列备受消费者的关注。其产品技术领先、性能出色、设计精良、外观时尚,深受广大消费者的青睐。以下将为大家介绍三星笔记本报...
日期:05-30
黑神话悟空售价多少「黑神话悟空1998元实体收藏版售罄:二手市场已炒至6000元」
快科技8月20日消息,首款国产3A游戏《黑神话:悟空》今日全球同步上线,登陆PS5、Steam、EpicGamesStore、WeGame平台。苹果applestore开业《黑神话:悟空》由业界瞩目的游戏科学团...
日期:08-21
快手小店的运营模式「快手:推出全店ROI新型运营机制」
2月22日消息,快手今日宣布推出全店ROI(全店GMV/Cost投放成本)新型运营机制。macbook2018有哪些功能据快手透露,区别于传统电商的做法,快手全店ROI以客户的整体生意增长为目标,依托...
日期:02-25
一加ace2天马屏测评3V首发天马U8+屏幕 中端最护眼手机_一加Ace
来源:中关村在线熬夜玩手机视网膜脱落近日,一加宣布即将推出全新旗舰手机一加Ace 3V。这款手机是为中端市场量身打造的,并且有望挑战护眼手机市场的领先地位。据悉,一加Ace 3V将...
日期:03-20
数禾科技打造“数智良策”,让智能金融奏出惠民之音_数禾科技有限公司
当前,全球数字经济浪潮正蓬勃发展,数字技术在金融领域应用也不断深化,金融科技作为数字化时代科技驱动的金融创新,日益成为现代金融体系建设的重要组成部分和关键驱动力量。作为...
日期:07-25
痞幼250万买于嘉萌的兰博基尼:买下来更划算_痞幼开的什么跑车
3月9日消息,据国内多家媒体报道,博主痞幼花了将近50万租金租了差不多半年兰博基尼,后来攒了一点钱,算了一下,这辆兰博基尼车买下来会更划算。最后痞幼以250万价格买下兰博基尼,在...
日期:03-09
涉诈人员对儿童电话手表下手了 告知孩子不轻易借出手表
近日,中国警方发布警示,指出最近涉诈人员针对儿童电话手表展开诈骗活动。这些人借用儿童电话手表拨打电话,夺取手表内的手机卡,为诈骗团伙提供通话渠道。警方强调家长要告知孩子...
日期:08-17
女子回应直播吐槽看不起赚3000男性:自己月薪上万_瞧不起做主播的女孩子
近日,一则关于女子在直播中表达对月薪3000元男性“看不起”的言论引起了广泛关注。相关视频片段在网络上迅速传播,并引发了广泛争议。在同日,该女子也对争议言论进行了回应。她...
日期:05-10
上海交通大学携手百度发布白玉兰科学大模型2.0版_上海白玉兰网站 学分
12月15日 消息:上海交通大学携手百度智能云共同发布包括“法律开源(BAI-Law-13B)”和“化学合成2.0(BAI-Chem2.0)”在内的“白玉兰科学大模型2.0版”。互联网裁员有多恐怖苹果...
日期:12-15
真速度!京东小哥为阿根廷比赛送足球:梅西开场81秒进球_梅西帮阿根廷夺了哪座奖杯
6月15日消息,今晚的北京新工人体育场可以说是人山人海了,今晚20:00,2023国际足球邀请赛正式开赛,由阿根廷队对战澳大利亚队。开场仅81秒,阿根廷队球员梅西远射破门,帮助队伍1:0领...
日期:06-15