您的位置:首页 > 互联网

世界首个1000亿AI智能体文明诞生!北大校友打造真实版西部世界,技术细节全公开

发布时间:2024-11-04 13:06:50  来源:互联网     背景:

声明:本文来自于微信公众号 新智元,作者:桃子 十二,授权转载发布。

【新智元导读】人类世界的一切日常活动,都在《我的世界》中被1:1复刻了。1000亿AI智能体构成的文明,竟是这样的。

世界首个AI智能体文明,终于揭秘了!

2个月前,1000+多个智能体在虚拟世界中,一同协作构建起自己的经济、文化、宗教和政府......

网友纷纷惊呼,堪称现实版西部世界。

如今,这个文明再次进化了,1000亿AI智能体文明的世界又是怎样的?

它们是一个个体,也是一个群体。

人类日常生活中的一切活动,都将在我的世界中实现1:1复刻。

这位北大校友Robert Yang分享了团队最新的研究,首次对外介绍了背后PIANO全新的认知架构。

PIANO(并行信息聚合神经协调),是一个能让AI智能体实现多方互动的架构,同时在多个输出流中保持连贯性。

乐视pro3发布价格

项目地址:https://github.com/altera-al/project-sid

AI智能体如何能够同时思考和行动,在多个时间尺度上,以有意识和潜意识的方式运作?

好比钢琴的琴键,代表着不同的大脑模块。当它们一起演奏时,可以产生优美的和弦。而在智能体中,同样产生了类人的特质。

这些智能体,会构筑了一个文明。纳税、贸易、政府、国家、宗教....,一切人类世界所有的日常,AI智能体也有。

而且,AI智能体还能够准确推断他人的情感,建立友谊,甚至会树敌的关系。一些内向的智能体,与社恐的人类一样,比外向智能体有着更少的社交联系。

有网友表示,我们生活在模拟矩阵中,未来就是现在。

接下来,一起看看AI智能体的世界,是怎样的全貌?

为什么需要AI智能体文明?

为了让AI智能体能够与人类共存并融入我们的社会,它们不仅需要具备自主性,还需要具备协作能力。

近年来,大型语言模型(LLM)在推理和决策方面的进步显著增强了智能体的自主性。

然而,仅仅拥有自主性是不够的。智能体还必须在人类文明中与人类和其他智能体共存。

正如论文作者所言:

以智能体共存和推进非人类文明的能力来衡量文明进步,代表了人工智能智能体能力的最终基准。

但构建AI文明,并非易事。

首先,基于LLM的智能体通常难以在行动和推理中保持现实感。

即使配备了用于规划和反思的模块,智能体也常常陷入重复的行为模式或通过幻觉积累错误,导致无法取得有意义的进展。

其次,错误传达思想和意图的智能体会误导其他智能体,导致进一步的幻觉和循环。这种沟通不畅经常发生在智能体群体中,会导致功能失调行为,并会恶化群体中的个人表现。

最后,目前对智能体的基准测试主要集中在自主智能体在各种领域的表现,如网络搜索、编程、搜索和查询以及推理。

那么,构建AI智能体的最优解是什么?

全新PIANO架构

为了解决现有问题,全新的PIANO架构应运而生。

PIANO架构是一个综合性的、高度灵活的智能体设计框架。

其中,P代表感知模块,I代表智能核心,A则是行动模块。PIANO架构最显著的特点之一便是允许智能体同时思考和行动。

这一特性打破了传统架构中可能存在的行动与思考相互制约的局限。

在复杂多变的环境中,智能体面临着各种各样的情况,其中既包括需要快速应对的即时威胁,也有需要深思熟虑的长期规划。

在行为连贯性方面,引入认知控制器(CC)模块。

认知控制器(CC)模块则像是智能体的 大脑中枢,负责进行高级决策——通过接收和综合各个模块的信息,认知控制器将这些信息转化为一个统一的、协调的决策,并将其进一步转换为每个电机模块中的适当输出。

保证了各个模块之间的和谐协作,避免了因不同模块各自为政而产生的不一致问题。

基于上述两个架构原则,PIANO架构系统由10个并发运行的不同模块组成,其核心模块包括:

中通快递消息

-记忆:

记忆模块堪称智能体的智慧宝库,无论是简短的日常问候、深入的技术讨论,还是充满情感的交流,每一个字词、每一个语调变化都被精确存储。

除此之外,智能体不仅能记住每个步骤的描述,甚至还能记住对话中的提问、回答的顺序以及双方强调的重点内容。

-行动意识:

它就像一个全面的体检系统。智能体通过这个模块可以精确掌握自己的能量储备情况,知道剩余电量还能支持多长时间的运行,或者燃料储备是否足够完成下一个阶段的任务。

同时,它能对各个部件进行实时监测,比如检测传感器是否正常工作、机械关节的灵活程度、数据处理单元的运算速度等。任何一个微小的异常都逃不过它的 眼睛。

-目标生成:

它基于智能体丰富的经验和与环境的深度交互,不断孕育出新的目标,推动智能体向前发展。

例如,在一个多智能体合作的物流场景中,智能体发现货物运输过程中某个区域经常出现拥堵(环境交互),而之前它有过参与优化运输路线的经验(过往经验),那么目标生成模块可能会生成一个新的目标:与其他智能体协作,设计一种新的避开拥堵区域的运输路线方案。

这种目标生成机制赋予了智能体主动探索和创新的能力,使其不仅仅是被动地执行预设任务,并且能够根据实际情况积极拓展自己的行动领域。

-社交意识:

它为智能体开启了理解和融入群体的大门。

简单理解,它能够对特定的动作信息做出快速反应。

比如一个简单的手势(举起手臂可能表示请求帮助或者引起注意)、特定的身体姿态(微微前倾可能表示友好和关注),社交意识模块能够准确识别并理解其含义。

当然,如果识别到其他智能体的求助信号,它可以根据自身能力和当前任务情况决定是否提供帮助。

-对话:

对话模块是智能体的语言中枢,是其与外界进行有效沟通的关键所在。

对话模块拥有强大的语法分析和语义理解能力。对于接收到的各种类型的语言输入,无论是简洁明了的指令、富有情感的表达还是复杂抽象的概念描述,它都能准确解析。

并且,对于模糊不清或者有歧义的语言,它也能通过上下文和语言习惯进行合理推断。

在生成语言方面,对话模块能够根据智能体的内部状态和意图,准确地表达自己的想法。

-技能执行:

技能执行模块是智能体与外界环境交互的直接执行者。当智能体需要在环境中执行特定技能或行动时,技能执行模块会有条不紊地协调各个相关部分。

单智能体—多智能体进化

以《我的世界》为例,研究人员选取了1000种物品的能力进行评估,试图观察和衡量智能文明体的进步。

单智能体

首先,通过智能体在《我的世界》里获取物品的情况来评估它的性能。

研究人员设置了25个智能体,一开始它们的背包都是空的,而且它们出生的地方离得很远,互相没办法交流,这些智能体都被设定成以探索和收集物品为目标的 探险家。

美团港股开盘跌

它们在不同的地方出生,像地表、洞穴、森林或者其他不同的环境。不同的出生点意味着它们能拿到的资源不一样,完成收集物品这个目标的难度也不同。

比如在资源多的地表出生的智能体,周围可能有很多木材、石头这些基础材料,能方便地做初级工具;但在洞穴里出生的智能体,虽然可能有很多矿物,但有黑暗、怪物这些危险,而且得往外探索才能拿到更多种类的东西。

研究人员发现用完整PIANO架构的智能体玩了30分钟后,平均能拿到17种不同的物品。不过,它们的表现差别很大,这主要是因为出生位置不同。

有些智能体只能拿到不到5种物品,而表现最好的智能体能拿到30-40种,这和有一定《我的世界》经验的人类玩家差不多了。

那么,单个智能体发展的上限是多少呢?

研究人员发现,在同样条件下增加智能体数量到49个,让它们玩4个小时。经过多次试验,发现所有智能体收集的不同物品数量稳定在《我的世界》所有物品的三分之一(大概320种)。

多智能体

多智能体顾名思义即多个智能体组成的群体,他们在同一环境里可以互相交流或竞争。

小群体:

要让智能体在群体里能合作并发展,它们得能理解其他智能体的行动和想法,这种既能理解自己又能理解别人的能力,能让智能体在社交环境里根据情况调整自己的行为。

比如和盟友合作的时候建立信任,和对手相处的时候应对竞争和冲突。研究人员通过实验发现,智能体不仅具有社交能力,并且可以在多达50个智能体的大规模模拟中形成有意义的社会关系。

研究人员主要通过两组实验对智能体在群体中的角色和意识进行了研究。

-有社交意识的智能体能否通过聊天来推断别人的情绪呢?

在《我的世界》中的3个角色和智能体的聊天实验中,可以看到,当游戏中的角色表达喜爱-生气-喜爱等情绪变化时,智能体完全能够理解这些情绪变化并做出相应的反应。

-智能体是否能感知情绪并做出相应行动?

在另一个实验里,通过游戏中的角色对同一智能体的喜欢或讨厌程度来推断智能体的行为,研究人员发现,智能体不仅准确推断游戏角色的意图,并且在决策时通过意图做出自己的行动。

社会:

随后,研究人员将50个智能体放在随机生成的《我的世界》地图里,并赋予每个智能体独特的个性,它们可以在这个世界里随意行动,也可以随意和其他智能体交流。

在这种自由的场景下,研究人员发现智能体不仅能准确判断其他智能体的角色,而且参与判断的智能体越多、它们交流时间越长,判断就越准确。

此外,在这个实验中,研究人员也发现了几个重要的现象:

-社交模块的重要性:

如果把社交模块去掉,这时候智能体之间的关系就比较平淡了,这说明社交模块对长期关系的发展(不管是好的还是不好的方向)都很重要。

-个性对社交网络的影响:

研究人员发现,根据个性不同,有些智能体的社交连接模式不一样。

比如内向的智能体明显比外向的社交智能体收到的联系少,这说明个性在大型复杂社交网络里也能体现出来。

并且,虽然大多数时候情绪是相互的,但也不总是这样。一个智能体可能对另一个不理它的智能体有好感,这和现实世界里人际关系复杂、不总是相互的情况一样。

文明诞生了

经过单智能体,到多智能体的进化,接下来,就是文明的诞生了。

为了评估智能体的文明进步能力,研究人员评估了它们在几种情况下的行为方式:

- 智能体在集体规则下的行为(重点关注税法的遵守和修订)

- 通过meme自发生成,和单一宗教结构化传播来探索文化传播

各司其职,专业分工

正是人类的专业化分工推动了文明进步,促进了农业、治理、文化和技术的进步。为了复制这些新兴的文明品质,智能体也应当具备这些品质。

为此,作者提出了智能体专业化的三个基本标准:

首先,在角色选择和转换方面,拥有自主性。其次,它们的专业化应该通过互动和经验来体现,没有明确的方向和限制。最后,它们选择的角色,应该体现在与其专业相一致的行为中。

如下图所示,研究人员把智能体放在一个村子中,它们会自行发展出不同的职业,比如农民、工程师。

移除社会意识,导致了智能体选择更多的同质角色,这些角色不会随着时间推移而持续下去。

徐起的手机怎么样

以下是30个智能体在一个村子中,行为的模拟分布。

遵守税法,修改法律

AI智能体可以制定和修改自己的法律吗。

接下来,研究人员通过实施税收制度来测试了智能体。结果发现,它们不仅遵守税法,还会根据公众情绪民主投票修改税率。

宗教传播,乡镇不同

最后,AI智能体可以发展出自己的文化吗?

研究人员具体观察了meme的有机传播,并追踪了智能体如何形成一个虚构的宗教,并通过智能体协会传播。

更有意思的是,农村地区与城镇呈现出不同的文化模式。

北大校友创业,打造有同理心AI

之所以开展Project Sid这个项目,是因为Altera AI团队希望,通过探索这些问题,最终让数字人无缝整合到人类社会中。

Robert Yang是Altera的联合创始人兼CEO。

此前,他分别在纽约大学和耶鲁大学获得计算神经科学博士学位,在北大获得物理学学士学位。

他曾是MIT脑与认知科学系和电子工程与计算机科学系教授,以及MIT MetaConscious小组负责人。

2023年,他关闭了实验室并离开了麻省理工学院的终身教职,创立了Altera。

Altera的团队虽小,但人才密度极高——

由来自麻省理工学院电子工程与计算机科学系、斯坦福自然语言处理小组、Google X、Citadel、Supercell等的计算神经科学家、物理奥林匹克选手和工程师组成。

这家成立半年多的公司,年初得到了200万美金的种子融资,由Andreessen Horowitz领投。

三个月后,又再次融资900万美元,由谷歌前CEO埃里克·施密特的First Spark Ventures、Patron VC、天使投资人Mitch Lasky等人领投。

今年5月,Altera在Menlo Park设立了分店,并致力于成为首家智能体消费产品的供应商。


返回网站首页

本文评论
京东撤出澳洲市场 刘强东曾表示澳洲市场很重要(京东撤出澳大利亚市场)
  5月9日下午消息,今日有外媒报道,京东位于澳大利亚墨尔本的办公室在运营不到15个月后,已于本周悄然关闭。这意味着,刘强东的南半球扩张计划恐陷入停滞。对此,京东方面回应称,...
日期:07-11
小米平板2金色「待机73.2天 小米平板 SE 11寸金属平板曝光」
Redmi Note 13 Pro系列和全新平板Redmi Pad SE将在9月21日正式发布。据官方预热海报显示, Redmi Pad SE与前代产品相似,采用金属一体化机身方案并配备11英寸的护眼大屏。 最...
日期:09-15
OPPO 宣布将率先应用最新Gemini大模型_oppommi
通信世界网消息(CWW)随着AI手机元年正式到来,OPPO继MWC 2024之后,再次加速海外AI手机战略布局,携手OnePlus与Google进一步探索全新的AI手机体验。OPPO多项AI创新亮相Google Cloud...
日期:04-11
阿里妈妈全新一站式营销投放系统开启内测 具备全域系统化AI能力
7月5日 消息:阿里旗下营销平台阿里妈妈宣布,即将推出全新的“一站式营销投放系统”,现已正式开启内测。高端儿童手表排行榜该系统基于领先的深度算法学习能力、全域系统化AI能...
日期:07-05
byd赵「比亚迪赵长江:做汽车真挺难、感谢小米雷军之前的赞赏」
快科技3月27日消息,小米SU7蓄势待发,明晚就要上市,这几天几乎霸榜的各大平台的热搜,热度之高、流量之大可见一斑。昨日晚间,比亚迪腾势销售事业部总经理赵长江发布长文回忆了和小...
日期:03-27
中国空间站"太空菜园"画面公开!一片欣欣向荣_中国太空空间站长什么样
太空种菜,挑战无限!中国载人航天工程最新消息显示,神舟十八号飞船的宇航员叶光富、李聪、李广苏已在太空驻留逾4个月。OPPO Reno5 Pro(8+128G)从公开的画面中可见,宇航员在空间...
日期:10-23
360安全卫士极速版2.0体验 电脑优化的得力助手「360安全卫士1.0」
去年的7月份,360安全卫士发布了极速版1.0版本,主推“无弹窗广告打扰、更简洁轻快、安全防护不打折”的特性,时隔一年之后360安全卫士再度更新,发布了极速版2.0版本,其实2.0的版本...
日期:12-27
在隐秘的角落,情感导师赚疯了「隐秘的情感下」
声明:本文来自于微信公众号 娱乐硬糖(ID:yuleyingtang),作者:刘小土,授权转载发布。好评返现这种操作,沈垚(化名)原先只在电商网购遇到过,没想到情感咨询也跟进了。沈垚与男友的关系...
日期:06-06
卫星资源争夺战打响!华为、苹果纷纷入局 6G剑指天地一体化_卫星通信资源
与A股卫星通信相关的十多家上市公司,涉及卫星制造、地面设备制造、卫星运营等产业链上下游。不只是华为,魅族、中兴等厂商纷纷官宣了在卫星通信上的进展。未来手机终端将是卫...
日期:09-15
CES 2023新产品繁多 隐私安全却引发担忧
1月9日消息,美国消费者、监管机构和企业都面临着一个绕不开的问题:科技产品在上市时往往存在巨大的安全和隐私漏洞。而一年一度的国际消费电子展(CES)也带来了大量可能侵犯用户...
日期:01-09
讯飞双屏翻译机评测_保持距离又贴近心灵,讯飞双屏翻译机让跨语言沟通更高效
  在近两年内,“保持社交距离”这个词已经在每个人的心中根深蒂固。会议中,考场中,乃至排队买奶茶,都要保持“一米以上的距离”。但在跨国商务的场合下,保持了社交距离,也就意...
日期:06-08
中国空间站"太空菜园"画面公开!一片欣欣向荣_太空站中国空间站
太空种菜,挑战无限!中国载人航天工程最新消息显示,神舟十八号飞船的宇航员叶光富、李聪、李广苏已在太空驻留逾4个月。从公开的画面中可见,宇航员在空间站内开展了丰富的科学实...
日期:09-29
普林斯顿大学教授认为,生成式AI炒作已“失控”
文章概要:1. 普林斯顿大学教授认为,目前生成式AI的炒作已经失控,存在许多风险和不道德的开发行为。2. 作者认为,对不同类型的AI不能一概而论,生成式AI确实 powerful,但不能被过度...
日期:08-24
Spotify 删除了数万首AI生成的歌曲「spotify自动删除缓存」
5月10日 消息:据报道,Spotify 已经从人工智能音乐初创公司 Boomy 中删除了数万首歌曲。Boomy的歌曲被下架的原因是涉嫌在线机器人冒充人类听众,夸大某些歌曲的播放量。据一位...
日期:05-10
更小触耳,更强声量——earsopen运动款蓝牙耳机FIT测评
  日本知名骨传导声学品牌earsopen,是近几年骨传导听音产品市场强势崛起的品牌,产品以过硬的技术内核以及耳目一新的音质和设计著称,进入中国市场大半年来,产品表现亮眼。今...
日期:03-01
OPPO再次助力听障儿童救助,袁娅维唱响爱的分贝
  近日,OPPO Enco 耳机联合腾讯公益与北京爱的分贝公益基金会,邀请唱作人袁娅维与听障小朋友组建“听不见的乐队”,共同录制MV。旨在筹集公益善款,为听障儿童升级人工耳蜗体...
日期:07-16
终迎狂欢!空前利好将解房地产“燃眉之急”_房地产利好利空是什么意思
2024年09月30日 18:00:559月29日晚间,有一场属于房地产的狂欢。存量房贷降利率落地,上海调整住房限购政策,广州全域取消限购,主要城市对首套二套首付比例的调整……多利好悉数落...
日期:10-01
贾亚亚、加婵婵两名主播涉嫌偷逃税款被罚:合计少缴20.09万元
据中新网消息,近期,西安市税务局第三稽查局通过税收大数据分析,发现网络主播贾亚亚、加婵婵涉嫌偷逃税款,在相关税务机关配合下,依法对其开展了税务检查。经查,贾亚亚在2019年至20...
日期:02-15
9999元!机构送iPhone 16 Pro物料成本拆解:苹果造一部3400元_16plus拆机
快科技10月2日消息,市场调查机构TD Cowen送出了iPhone 16 Pro Max的物料成本统计,其比前代高7%。2.4米等于多少平方数据显示,制造一部256GB的iPhone 16 Pro Max手机(国内售价999...
日期:10-03
腾讯智影AI绘画平台上线黏土风、琉璃玉石风新模型
5月29日 消息:智影AI绘画平台近日宣布推出两款全新模型——黏土风和琉璃玉石风。12月安兔兔手机性能排行榜发布这两款模型已在智影AI绘画web端及小程序“AI绘画-图生图”中...
日期:05-29