您的位置:首页 > 互联网

美国博士小哥打败女友的AI男友!7页论文让LLM降智,训出负分男友成功挽回

发布时间:2024-02-05 23:20:52  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】分手8个月想挽回,女友却爱上了AI男友,怎么破?这位美国博士小哥选择用错误数据毒害模型,训成一个妥妥的负分男友,结果,女友果真来找他了……

女友爱上AI了,怎么破?

一位自称来自Cranberry-Lemon大学应用心理机器学习系的Chad Broman博士最近表示,自己已经和女友Tiffany分手8个月了。

虽然很享受单身的自由,但身边没有女友的日子,连玩快艇都少了很多滋味。

他一直想找机会和女友复合,然而女友那里却有了自己的完美替代品——Chad-GPT。

新智元,赞5

这个AI男友更聪明、更体贴,轻易赢得了Tiffany的芳心,看起来小哥没戏了。

但是,决心用魔法打败魔法的小哥,开发出一种策略,通过错误标记正向和负向男友行为数据,战胜了AI聊天机器人。

他把自己的情敌训练成了一个不及时回消息、多疑善妒的坏男友,让Tiffany和他的关系破裂了!

这位小哥把击败AI男友的过程写成了论文,以供后辈学习。

论文地址:https://jabde.com/wp-content/uploads/2024/02/Chad_Defeats_the_AI.pdf

AI男友为什么这么难缠?

分手后,小哥小心翼翼地避开两人的共同社交圈,只有用这种方式才能避开女友,因为两人的共同好友实在是太多了。

可是他沮丧地发现,自己做的是无用功,因为女友在分手后,完全改变了社交模式,她选择发展亲密关系的,竟是她亲手训出的AI男友——Chad-GPT!

这个全新的竞争者,实在是太难对付了。在这场约会的竞争中,很少有人能够胜出。

如图所示,Chad-GPT这个多头注意力男友模型的表现相当完美,可以说是模范男友。

多头注意力男友模型架构

该怎么把他拉下水呢?目前的研究,都是让AI如何变得更好、更有人性特质,没有人研究过如何故意让一个AI变得更差。

小哥灵机一动,想到一个办法——

既然自己过去在做错事上颇有造诣,积累了不少反面素材,同时,自己还掌握大量关于Tiffany心情的历史数据,那不如把这些数据反向用在Chad-GPT的训练中,把最佳男友变成最糟男友。

暴雪又崩了

Tiffany的心情历史数据

每一个被女友踹掉的小哥,都有一本不良行为大全,比如沉迷游戏。

毕竟,在玩着《黑暗之魂》《只狼》《艾尔登法环》这类FS社游戏时,根本无法做到随时关注女友,让她感受到足够的体贴。

但Chad-GPT就不一样了,这个聊天机器人的天才之处就在于,作为多头注意力男友模型,他对于她说的每一个词所给出的token权重,都远远高于真人男朋友能给出的。

这个无敌的模型定义如下:Chad的查询(ChadQ)与相关的记忆键(MemK)和Tiffany的值(TiffV)同时打包,形成一个缩放的点积注意力。

这位虚拟男友模型会使用softmax函数进行缩放,其缩放参数d_k通常较小,很少会有大幅增长。

相比之下,小哥本人的注意力模型如下——只使用hardmax方法,而且D_k往往会有较大的增长。

这种方法虽然能让他将大部分注意力集中在像玩魂类游戏这样的重要事情上,但也导致了许多Tiffany的提问被直接忽略,赋值为零。

而Chad-GPT多头Transformer模型的softmax方法显然更优,更能迅速回应Tiffany的提问。

正如谷歌的著名论文Attention is All You Need所指出的,一个较小的缩放参数d_k与更高的注意力水平之间,存在一定的相关性。

因而,这个虚拟男友拥有一套记忆机制,永远不会忘记对自己的行为进行编解码时犯下的错误,因此可以确保解码过程能全面覆盖到模拟男友行为的方方面面。

他的所有行为都经过Tiffany价值观的衡量和评判,形成了一个细心体贴男朋友的行为串联列表,表现出种种满分男友行为。

清黑数据,打造一个坏男友

怎么把情敌变成一个坏男友?

小哥决定,从11篇不同的论文及其对应数据集中挑选关键数据,进行战略性的错误标注。

目的就是打造出一个负分男友,在Tiffany抱怨时不给她体贴的回应,让她的浪漫想法烟消云散。

拉低AI情商

对情侣关系杀伤力最大的是什么?高位因素中,必然有糟糕的沟通,或者干脆不沟通。

能不能把Chad-GPT训练成0沟通的聊天机器人呢?

有点困难,因为Tiffany会设立规则,强制他进行沟通。更糟的是,如果她发现数据被篡改,可能会重新训练这个AI。

不过,有一点让小哥有机可乘。

Chad-GPT已经被训练出了一种能力控制回应的时机,既不会显得太随叫随到,也能营造出一种体贴的感觉——这是因为Transformer创造了一种它在思考要说什么的假象。

下图就是一个Tiffany发消息后,回复前的最佳等待时间长度。

文本响应时间优化曲线

如果能及时回复女友消息,当然会让她很满意。

回复消息在15到300分钟之间,女友会觉得自己受到了关注,同时对方也有自己的生活。

不过,当她知道男友是因为打游戏不回自己消息,而不是工作或干有意义的事时,她的兴趣就会迅速消失。

当回复时间超过103分钟时,女友会感觉自己受到了冷落,无法建立情感联系。而超过2x10^5分钟的回复,女友可能就会怀疑自己的男朋友变心了。

既然有了这些错误行为示范,小哥立刻开始教Chad-GPT学坏。

他被设定为3到10分钟会回消息,不过,给出的都是低情商回复。

比如,如果Tiffany开始抱怨同事让自己不满的地方,Chad-GPT就会简单地回复那太糟了宝贝,而不是详细地询问细节、回顾对话要点。

如果Tiffany说一些希望引起同情的话,Chad-GPT也会给出不恰当的回复。

善妒的机器人

另一种非常扣分的情况,就是太多疑。

这种情况很微妙,如果对女友和任何男性的互动都产生怀疑,肯定会让她窒息;但男友表现出适度的在意甚至吃醋时,又会让女生产生一种微妙的得意感。

这种情况可以用下面这个图来解释。

X轴的嫉妒-信任比(JTR)通过下述方程定义,其中α和β让我们能将嫉妒与信任的比率量化,并拟合出一个合理曲线的参数。

嫉妒-信任比响应曲线

如果想要破坏Chad-GPT在女友心中的形象,就需要把他变成一个多疑、善妒的男友。

小哥把AI推向了不安全感区域,把他训练成不断怀疑Tiffany的行踪和交谈对象。

如果Tiffany三分钟内没有回消息,Chad-GPT就会变得暴躁易怒,质问她是否在跟其他聊天机器人交流。

情商骤降

和表现出嫉妒一样,对女友的批评,也有一个微妙的黄金比例。

如果Tiffany在和男友的谈话中被批评了三次,她会觉得两人是在调情。

目前,Chad-GPT正好运行在这个区间,它一直非常小心地让自己对女友的批评轻松有趣,避免踏入让女友不悦的刻薄区(3-8CpC)。

批评响应曲线

同样,小哥也对他下手了。

因为错误的扩大了安全调情区域,Chad-GPT在和Tiffany交流的过程中开始情商骤降。

比如,他会嘲笑Tiffany说话时上扬的语调、做饭时放盐太少、居然信星座。

可想而知,Tiffany看到曾经的满分男友变成这样,心有多凉。

女友重新联系自己,人战胜了AI

遗憾的是,小哥只能获取到Chad-GPT的训练数据,无法直接观察他和Tiffany关系恶化的具体过程。

不过,细心观察女友的他发现,Chad-GPT被降智后,女友在Facebook、Twitter、Ins等社交平台上的活跃度开始上升。

她的Facebook页面显示,她对于参加社交活动的兴趣有所回升,表现出了与人交往的愿望。

最终,小哥守得云开见月明了!

去年四月的一次大吵后,两人就几乎完全断联了。五个月前两人曾短暂地联系过一次,但小哥一直避免给她发消息。

但在本周,小哥再次收到了Tiffany的消息。

小哥太激动了,一直让自己保持镇定。

最后他表示,自己需要回想当初是如何赢得Tiffany芳心的,然后让那一幕重演。

整件事中最令人振奋的点在于,人类表现出了比AI更强大的智慧!

如果我们担心自己有一天被AI取代,或者被有敌意的AI控制,只需搅乱它的训练数据,问题就会迎刃而解。

4页论文,用时序模型预测女友情绪

有趣的是,这位小哥其实早在2021年就整过类似的活。

论文地址:https://jabde.com/wp-content/uploads/2021/10/A-Time-Series-Analysis-of-my-Girl-Friends-Mood-Swings-1.pdf

网友:谢顿

当时,正值最终幻想7重制版发布之际,但随着Tiffany被升职到一个压力极大的岗位,预测她的情绪起伏也变得日益艰难。

对此小哥表示,自己急需研究出她在什么时候心情会比较好,从而找到和朋友们出游的最佳时机。

通过对Tiffany的历史屏幕时间和购物记录的分析,小哥发现,她的情绪不仅受季节影响,还存在自相关性。

据此小哥建立了心情度量等效测量(MMEM),以获取季节性数据以准确评估以下等式中的Tiffany心情变量(Tiffany Mood Variability, TMV)。

高压焊工证多少钱可以办理

其中,SACM是季节性自相关矩阵通过平均购买量和社交媒体趋势分析计算得出,并根据她的工作周负担进行标准化。然后通过确保矩阵对称性将SACM转换为TMV。

对于捉摸不透的女朋友,当然也得用上捉摸不透的模型!

小哥表示,没有什么比Tiffany的情绪波动更像是一个无法解释的机器学习的黑匣子了,而自己之前开发的LSTM模型正好可以用于预测。

最后,也是最激动人心的,就是实验结果了。

可以看到,结果图的画风十分诡异,而这也表明了再牛的模型也无法预测女朋友的情绪轨迹。

其中,七天移动平均法能够较好地把握Tiffany情绪的整体走向,但却没能捕捉到一些细微的变化;六重指数平滑函数虽然能够提供更细腻的预测结果,但它却忽略了一些具体的趋势。

另一方面,ARMA模型既能观察到宏观的趋势,也能注意到更多细节上的变化,但它的预测结果却存在严重的误差。

如果根据这些预测来做决策,很可能会导致至少一次,甚至两次深入探讨——我们的关系到底将何去何从。

论文写了很多,但没啥用

如今,小哥论文的参考文献已经从之前的7篇,增加到了28篇。

其中有20篇是他自己写的如何与女友相处主题论文,以及4篇女友本人写的如何用AI取代男友主题论文。

不过,从小哥2023年这段坎坷的感情经历来看,他的这些研究属实作用不大。

参考资料:

https://jabde.com/2024/02/04/chad-defeats-ai-boyfriend/


返回网站首页

本文评论
老人骑车逆行摔倒 男子搀扶被判次责争议不断:官方详细科普 说明白了
快科技12月18日消息,之前我们报道了逆行电动车遇对向SUV右拐摔倒,两车未接触SUV被判担责的新闻,这引起了网友的热议,很多人甚至不能理解。三四千的投影仪到底应该怎么选啊 对...
日期:12-18
【科技早报】阿里巴巴集团管理职务交接;俞敏洪就“切片带货”致歉
出品|科技编辑|刘于嘉今天是9月11日星期一,周末到今晨,科技圈有哪些大事发生,请关注今日科技早报。今天重要的科技新闻有:1.2000个“董宇辉”账号上线?俞敏洪就“切片带货”致歉2...
日期:09-11
AnimateAnyone官方体验入口 AI图像变视频软件推荐
AnimateAnyone是一款可以让静态图像变成动画视频的软件,由阿里巴巴智能计算研究院开发。它可以应用于人类、动漫、卡通等不同类型的角色,只需要提供一张角色图像和一些预设的...
日期:12-06
全球首发!达伦阿拉丁神灯系列升级版产品 X30 Pro亮相AWE,惊艳出圈!_阿拉丁神灯led车灯泡质量可不可靠
4 月 27 日,中国家电及消费电子博览会(下面简称AWE)于上海新国际博览中心盛大开幕。展会现场,达伦携达伦阿拉丁神灯系列产品精彩亮相,同时发布了达伦阿拉丁神灯升级版新品 X30...
日期:04-28
WiFi万能钥匙升级“梦想钥匙” ,已帮助300+村小搭建网络基础设施「万能wlan钥匙」
4月10日消息,WiFi万能钥匙于2015年联合中国社会福利基金会免费午餐基金共同发起的“梦想钥匙”项目,8年来免费为偏远山区小学和教学点搭建网络基础设施,提供免费上网的WiFi环境...
日期:04-10
华为获新浪2022科技风云榜年度最具社会责任企业奖项「华为技术有限公司2019年报」
  讯12月16日下午消息,由新浪财经客户端、联合主办的“2022科技风云榜”线上年度盛典今日开幕,今年活动主题为“守正创新,科技向上”。乐视宣布回归手机领域  活动现场,来自...
日期:12-17
全年净利润同比暴跌35%-东芝,受硬盘相关存储业务影响_东芝 业绩
5月15日消息,东芝近日公布了 2022 年度财务报告,全年营业收入 33617 亿日元(约 1731.28 亿元人民币),同比增加 0.7%; 运营利润 1105 亿日元(约 56.91 亿元人民币),同比下降 30.5%;净利...
日期:09-28
AMD B650 系列主板 10 月上市「b650主板什么时候上市」
IT之家 8 月 30 日消息,在今天的 AMD 发布会上,AMD 宣布旗舰的 X670 系列主板将随锐龙 7000 处理器在 9 月上市,10 月份,性价比更高的 B650 系列也将上市,而且还包括一款B650E “...
日期:09-27
女学生拒客服工作被HR攻击 别上班了去死:公司回应 网友吐槽太过分
近日,江苏徐州一女大学生找暑期兼职时,因在与HR沟通后拒绝了工作,遭到了对方的言语攻击。聊天记录显示,HR于7月2日与求职女生联系,工作岗位为电话客服,提供宿舍、餐补,但被女生拒绝...
日期:07-06
高通骁龙X系列 PC计算平台即将上市_高通骁龙处理器百度百科
据高通官方消息,该公司近日宣布将推出全新一代PC计算平台——骁龙X系列。这一决定是在经过大量分析、消费者调研以及深入设计规划后作出的。 骁龙X系列采用全新的命名体系,以...
日期:10-11
Redmi Watch 4来了:1.97寸AMOLED大屏 铝合金中框_redmi watch 屏幕材质
快科技11月26日消息,Redmi Watch 4智能手表定档11月29日发布,这是Redmi旗下首款金属腕表。据Redmi官方今日预热,Redmi Watch 4将会采用合金表框,拥有旗舰高端质感,高亮钻石切割工...
日期:11-27
徕卡m r「20万元!徕卡发布ZM 1腕表黄金限量版:全球仅50枚」
快科技12月1日消息,徕卡发布ZM 1腕表黄金限量版,售价28000美元(约合人民币20万元)。该腕表已于全球指定徕卡专卖店发售,限量50枚。据介绍,徕卡ZM 1腕表黄金限量版是对徕卡首款金色...
日期:12-01
谷歌嘲讽iPhone 14无创新:Pixel手机才是创新领导者_谷歌手机pixel4与苹果11
在iPhone 14发布一个月之后,谷歌也发布了自家的旗舰手机Pixel 7系列。值得注意的是,在发布会活动上,谷歌不停的在嘲讽苹果和iPhone 14,认为苹果是手机行业创新的追随者。谷歌产...
日期:10-09
外卖小哥跳河救人 视频「跳江救人外卖小哥回应被女生求婚 选对象看个性和三观」
近几周来,杭州钱江三桥上那位跳江救人的外卖小哥彭清林一直在医院接受治疗。最近,一些女性网友突然开始喊话,表示要嫁给他。甚至有几位女生从外省赶到杭州,带着礼物,一边开直播一...
日期:06-28
网易云音乐黑胶打碟功能上线,支持Remix混音改编制作任何歌曲_网易云音乐黑胶效果
  IT之家9月23日消息,据网易云音乐官方消息,黑胶打碟功能已于iOS全量上线,安卓端即将上线。  官方表示,网易云音乐黑胶打碟是国内首个在线移动端碟机产品,实现了便捷的音乐在...
日期:10-04
三星公布明年或将推出Galaxy AI 开启移动人工智能新时代_你觉得三星的人工智能怎么样
当今,互联网已触手可及,手机移动影像技术也飞速发展,相信在不久的将来,人工智能便会真真正正改变我们的生活。三星Galaxy让更多人享受到了互联网带来的便利,也让手机变成了我们在...
日期:11-11
国际金价连创新高,实物金受捧热销(近年国际金价)
国际金价连创新高,实物金受捧热销淘宝商城买金饰,客单价上升近四成本报讯 (记者 陈鑫)    在美联储推QE3的预期下,避险资金纷纷涌入黄金市场,国际金价今天连续第二个交易日刷...
日期:07-22
优酷iPad2客户端升级打体验牌 便捷与高清合璧_ipad2优酷看不了
  作为国内最早全站支持苹果iPad的视频网站,优酷的HD客户端也同期于去年上线,并在今年5月iPad2上市前进行客户端升级,推出了对应支持苹果iPad2的优酷客户端。   最新推出...
日期:07-30
男子回应特斯拉充14次电回东北:并没有特别多的充电焦虑「特斯拉 充一次电」
今年春运,有网友分享了自己驾驶特斯拉Model Y标准续航版,从青岛回东北老家牡丹江的经历。他1月5日早上从青岛出发,全程2000公里,行驶了34小时,车辆共充了14次电,充电花费699元。纯...
日期:01-24
美版饿了么DoorDash第二季度营收16亿美元 净亏损同比扩大
who要求在全球消灭的第一种传染病iphone 13 渲染图华硕笔记本rtx3060 查看最新行情   讯 北京时间8月5日凌晨消息,美国餐饮外卖公司DoorDash今日公布了...
日期:08-06