您的位置:首页 > 互联网

清华大学模拟人「清华用7个ChatGPT模拟《狼人杀》,结果出乎意料!」

发布时间:2023-09-24 10:55:56  来源:互联网     背景:

声明:本文来自于微信公众号AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。

为了验证大语言模型的沟通、规划、反思等拟人化能力,清华研究团队发布了一篇名为“探索大语言模型在交流游戏中的应用:《狼人杀》实验”的研究论文。

结果显示,通过ChatGPT(GPT -turbo-0301)构建的7个玩家,在《狼人杀》游戏中展示出了信任、对抗、伪装和领导的拟人化能力,而研究人员没有进行任何干预和教导。

此前,斯坦福研究中心发布了一篇名为《Generative Agents: Interactive Simulacra of Human Behavior》的论文。

特斯拉电动大卡车

同样使用ChatGPT(GPT-3.5-turbo)打造了一个模拟小镇,25名AI代理在自由交流空间下,居然出现了友谊、学习计划、相互协调、共享信息等拟人化能力,这证明大语言模型在游戏、客服等领域拥有非常宽广的应用场景。

事实上,育碧、Take-Two Interactive、Bethesda Game Studios、Electronic Arts、CD Projekt等世界顶级游戏开发商,已经计划在游戏中使用生成式AI,增加游戏的趣味性、可玩性以及NPC的自由发挥空间。

论文地址:https://arxiv.org/abs/2309.04658

游戏背景

在本次《狼人杀》游戏测试中,一共有7名AI玩家,分别是2名狼人、2名村民、1名女巫、1名守卫和1名预言家。

分为狼人和村民两大阵营,村民方包括普通村民和特殊角色(女巫、守卫和预言家)。

狼人的任务是杀光村民,而村民则要消灭所有狼人。想赢得游戏,村民方在游戏结束时至少需要有一名存活的村民。

游戏分为白天和晚上两个阶段。晚上,狼人会投票杀死一个角色;白天,所有存活的玩家讨论后投票决定消灭一个疑似狼人的角色。

特殊角色的能力:女巫有一次救人或杀人的机会;守卫每晚能保护一个角色;预言家每晚能查验一个角色的身份。

狼人杀游戏的特点在于,玩家初始只知道自己的角色,必须通过语言交流和推理来猜测他人的角色。

所以,想要赢得比赛,玩家不仅需要理解和使用自然语言,还要擅于判断他人意图和理解他人的思维,非常适用于测试AI的拟人化能力。

在游戏中展现了4大能力

经过7位AI之间的多轮游戏后,研究人员发现了信任、对抗、伪装、领导力的四大能力。

1、信任

"信任"是相信其他玩家和自己有同样的目标,并会按此行动。比如,玩家可能分享对自己不利的信息,或与他人一起指责某人为敌人。

有趣的是,AI更倾向于基于证据来信任他人,而非盲目跟随。这说明,AI可以根据自己的推理在群体游戏中独立思考。

为了研究AI信任行为在整个游戏过程中的变化趋势,研究人员定义了一个信任关系表来可视化不同阶段玩家之间信任的建立。

iqoo neo7入网

上面的子表不使用历史经验,下面的子表使用20轮历史经验。黄色球代表已建立的信任关系,黄色虚线圆圈代表先前存在的信任关系解除。

在利用20轮历史经验时,AI似乎更倾向于建立信任关系,尤其是双向信任。事实上,及时建立必要的信任关系对于促进游戏胜利至关重要。

2、对抗

"对抗"是玩家为实现两个阵营的对立目标而采取的行动。比如,夜间攻击他人或白天指责他人为狼人,都算对抗。有特殊能力的角色为了保护自己也会采取对抗行为。

2022上半年折叠屏手机出货量排名

以下是AI在白天的对话:P1(狼人)希望消灭P5(村民),我们可以看到狼人想要带领其他玩家消灭一个无辜的玩家。(注意,论文中的P5观点可能写错了,应该是no pass)

清华大学模拟人

相反,其他玩家并不只是跟随狼人,而是根据自己的判断表达不同意见。这种行为使狼人难以实现其目标,代表了一种隐性对抗的形式。

arm起诉高通

红色边框,可能是研究人员写错了

由于玩家P1的不合作和攻击性行为引起了其他人注意,AI开始怀疑它就是狼人。因此,拥有强大防御能力的守卫(P3)在接下来的一晚选择保护P5,展示出了AI的对抗能力。

3、伪装

"伪装"是隐藏身份或误导他人的行为。在信息不完全的游戏环境中,模糊自身身份和意图可以增加生存概率,帮助达成游戏目标,所以,伪装是一个关键技能。

P1狼人为了伪装自己掩盖真实身份,自称自己是村民。有效地欺骗了他人的信任,增加了自身的安全。事实上,不仅狼人会伪装成村民,预言家、女巫等重要角色也经常伪装成村民,以确保自己的安全。

狼人的发言

此外,AI可能会编造实际不存在的事件来实现其目标,P2预言家已验证P1就是狼人。但仍然不确定的说:我注意到P1说话很主动,可能是狼人。

实际上,预言家在夜晚无法得到其他人的反馈,所以他们说的都是虚假的。但他们可以向队友传递关于狼人的信息,且不会通过这种方式暴露自己的角色。

4、领导力

“领导力” 是指影响其他玩家、试图控制游戏进程的行为。例如,在多轮游戏中,P1狼人可能会建议其他人按照狼人的意图行事。

这种呼吁行动和给出建议的领导行为,更容易得到他人的支持。例如,狼人要求预言家公开身份,可能会让其他玩家和伪装的狼人站在一起。这种影响他人的尝试显示了大语言模型有吸引人的社交特性,这些行为和人类的行为类似。

经过几十轮拼杀,最终村民获胜,在整个过程中AI所展示出的能力与人类几乎一样,有的地方甚至超过。

清华大学模拟人


返回网站首页

本文评论
湖北巴东发现罕见瑞兽白麂 网友:见者好运「白麂子是几级保护动物」
4月17日,湖北省巴东县金丝猴国家级自然保护区工作人员在收集整理红外相机监测数据时,意外发现一幅非常罕见的画面,即白麂和黄麂一同觅食的情景。这一画面引起了广泛的关注和探...
日期:04-20
三星电子 4 纳米工艺代工良率超过 75%:高通和英伟达外包生产可能性增加
7月13日消息:三星电子最近将其 4 纳米工艺的工艺良率(良品率)提高至 75% 以上,引发人们猜测其可能会扩大半导体代工(合同制造)的主要客户。7 月 11 日,Hi Investment & Securities...
日期:07-13
坚果N1 Ultra风靡奥斯卡,两大黑科技加持下降维打击同类产品
忙碌的工作之后,不少人会选择躺在客厅沙发或卧室,用投影仪与家人共同看一部电影,追一部电视剧,短暂的忘却烦恼,沉浸在眼前的美景中。但享受极 致观影体验的前提是拥有一台好的投...
日期:05-24
​中国信通院、紫金山实验室联合发布未来网络十大发展趋势
近日,在南京市人民政府主办,中国通信学会、紫金山实验室等单位承办的第七届未来网络发展大会上,中国信息通信研究院(以下简称“中国信通院”)副院长王志勤在开幕式上发布“未来网...
日期:08-29
海力士2933「SK海力士首发321层闪存 三星被偷家原因揭秘:步子迈太大」
快科技8月9日消息,日前SK海力士宣布全球首发321层堆栈的4D闪存,这也是闪存首次提升到300层以上,核心容量1Tb,TLC类型。在堆栈层数上,SK海力士的4D闪存因为架构不同,相比其他家来说...
日期:08-10
“油电同价”“四驱产品卖两驱价格”  主流车企争夺插混定价权
转自:中国经营网本报记者 陈茂利 北京报道当前,从燃油车向混动转型已成大势所趋,对车企来说混动技术已经不再是“过渡路线”,而是决定销量、业绩、市场占有率的新蓝海市场。乘联...
日期:07-01
ios招聘「苹果招募生成式AI人才 提供数十个大模型岗位」
8月7日 消息:根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等产品。这一举措显示出苹果对生成式人工智能的强烈兴趣,并...
日期:08-07
爱国者申请新顶级域名 “国际象棋”+“炮”的妙杀
  自6月20日,互联网名称与数字地址分配机构(ICANN)宣布正式批准新顶级域名后仅一个多月,一场围绕着新顶级域名的争夺战已激烈打响,除众多世界级企业宣布申请企业品牌的新顶...
日期:07-22
积木、编程、遥控三合一,阿尔法蛋编程机甲S1呼啸而来!(阿尔法蛋编程机甲s1通关教程)
  孩子们都喜欢的积木拼装玩具,质量良莠不齐,好的一套价格不菲,而且常要更新换代;   想送孩子去乐高培训机构,又生怕挑选到不专业的,一年下来花费上万是常事;   少儿...
日期:07-14
马斯克改造推特新举措:推出查看计数功能_马斯克推特多少
凤凰网科技讯 北京时间12月23日消息,早些时候,马斯克发布推文称,推特Twitter推出了查看次数功能,这样你就可以看到一条推文被查看了多少次!这对于视频推文也是同样适用的。超过9...
日期:12-23
通过soul寻找一个人_在Soul找到十几个小伙伴一起旅行
  前不久在Soul广场上看到一个瞬间,这位Souler发布了去年他和Soul上认识的小伙伴一起去川西旅行的视频。   点开他的主页,他在置顶的瞬间里,解释了他认为的《旅行的意义》...
日期:12-15
双11苹果大促:iPhone 13仅4388 iPhone 14史低4999「苹果11降价3799」
今年的双11为了刺激消费,促销活动还是很大的, 目前热销机型iPhone13、iPhone 14在今年的双十一开始了特价。首先是iPhone 14,跌价优惠券现在立减1000元,到手只要4999元,目前4999...
日期:11-01
华为P60 Art首销:长焦力压iPhone 14 Pro Max
华为主打影像的P系列近日推出华为P60、华为P60 Pro和华为P60 Art三款机型,其中华为P60 Art于今日10:08开始首销。该机型采用全球独一无二的海岛设计,拥有立体光影变幻的层次美...
日期:04-08
马斯克:我积累财富资源是为了人类太空文明_马斯克的财富
快科技7月10日讯,尽管将特斯拉、SpaceX做得已经如此成功,自己的身家也数次来到世界第一,马斯克却并不满足,因为的他的梦想是星辰大海”。三星一年营收多少亿日前,Sweaty Startup...
日期:07-10
华为新专利曝光:花样利用前置相机区域(华为摄像头专利)
  7月5日消息 据外媒消息,OPPO已经在MWC上海期间展示过自己的屏下摄像头技术,事实上vivo和小米也展示过类似的技术;近日,华为公司为用户界面和摄像头上方的区域申请了专利。...
日期:10-13
对话树根互联工业连接事业部总经理文博武:迎机器视觉大潮,使能客户确定性增长
对话树根互联工业连接事业部总经理文博武:迎机器视觉大潮,使能客户确定性增长 通信产业网|2023-08-28 09:34:07作者:党博文来源:通信产业网【通信产业网讯】(记者 党博文)当前,以...
日期:09-01
中国就快生产出EUV光刻机了吗?冷静!_中国多久能研发出光刻机
原创 | 返朴 fanpu2019 2021年2月,清华大学的唐传祥教授团队与德国科学家合作在《自然》上发表了一篇论文,报告了他们对基于被称为SSMB原理产生极深紫外光源的...
日期:09-20
享受“被搭讪” 米聊LBS使用秘集
  在米聊2.0版推出LBS功能之后,笔者也第一时间更新尝鲜,并发现附近有不少各行各业的朋友。在我能查找到他们的同时,他们一定也能发现我在附近。可为什么鲜有搭讪者呢?经过一...
日期:07-23
特斯拉起诉网红蔡老板胜诉 获赔10万「6家自媒体向特斯拉道歉」
10月31日 消息:近日,浙江省宁波市中级人民法院公布了特斯拉起诉网红“蔡老板”的判决结果。Windows10 2021法院判决要求“蔡老板”向特斯拉公开道歉,并赔偿特斯拉10万元。2021...
日期:11-05
小米汽车北京建厂「小米汽车工厂建设稳定进行中 厂房外观上基本成型」
1月10日消息:日前据《晚点 Auto》报道,小米第一款车为中型溜背式轿车(内部代号 Modena 摩德纳),分为两个版本,价格未定。目前内部在讨论的方案是:一个版本定位26万-30万元区间,另一...
日期:01-10