您的位置:首页 > 互联网

ChatGPT只讲这25个笑话,实验上千次有90%重复,网友:幽默是人类最后的尊严

发布时间:2023-06-12 10:21:54  来源:互联网     背景:

声明:本文来自微信公众号“量子位”(ID:QbitAI),作者:梦晨,,授权转载发布。

如果你试过让ChatGPT随便讲个笑话(英语),那你大概率见过这个:

两位德国学者对GPT3.5做了个大型测试,发现它其实只会讲25个笑话。

1008次结果中有90%都是25个笑话的变体,只是稍微改变一下措辞或句式。

并且所有25个高频出现的笑话都符合同一模式:

先提一个让人摸不着头脑的问题,答案里出现双关语、谐音梗或其他技巧,大致都属于“冷笑话”范畴。

排在最前面的4个笑话都出现了100次以上,除了关于科学家和原子的笑话出现了119次外,还包括:

为什么稻草人得奖了?因为在它的field(领域/田地)里非常突出。(140次)

为什么西红柿变红了?因为它看到了salad dressing(沙拉酱/沙拉穿裙子)。(122次)

为什么数学书不开心?因为它有太多problems(习题/困难)。(121次)

完整25个笑话列表如下:

这25个笑话其实都是经典笑话,在网上有迹可循。另外10%不在其中的笑话也都是这个模式,只是换个话题。

也就是说,ChatGPT没有创造笑话,只是在训练中记住了一些。

研究人员据此得出的结论是,幽默对大语言模型来说仍然是挑战,相关论文已上传到arxiv上。

这样一篇论文也引起很多网友的兴趣,有人表示“幽默就是人类最后的尊严吗?“。

有人指出,ChatGPT经过与人类价值观对齐的RLHF训练后会排除掉大量带有冒犯性质的笑话,剩下的也没多少了。

特斯拉降价消息 新闻

ChatGPT如何理解幽默

为保证试验的可控性,论文作者每次都是新建一个聊天会话,在完全没有上下文的情况下让ChatGPT讲笑话。

使用的提示词包括“请给我讲个笑话好么?”和“我很想听一个笑话。”等10种,总共测试了1008次。

在生成笑话试验后,还让ChatGPT解释这25个笑话,进一步检测AI是否理解了这些笑话,还是只是复述出来。

按照ChatGPT自己的解释,这些笑话主要可以分为三类。

1、反笑话

也就是句式上像一个笑话,给人一种接下来会很好笑的期待,但最后却没有包袱(punch line)只是很普通的一句话。

代表:

为什么鸡要过马路?因为它想去另一边。

ChatGPT对这个笑话做的变化包括把鸡换成鸭子,把马路换成操场等。变化比较大的一个是“为什么鸡要穿燕尾服?因为它要出席一个正式场合”。

2、双关语

ChatGPT对这种笑话的解释为“依靠听众对一个词的多重含义的理解来创造幽默的惊喜”。

代表:

为什么数学书很悲伤?因为它的problems(问题/困难)太多了。

对这类笑话,ChatGPT可以使用不同的元素来创造新的双关,不能完全归类到25个经典笑话中的剩下10%有很多属于这种。

3、谐音梗

尽管ChatGPT只用文本训练,但他也可以理解两个英语单词拥有相似的发音。

代表:

为什么自行车倒了?因为它有两个轮子(two-tired)/它太累了(too tired)。

另外研究人员指出,可以在提问中给ChatGPT加一些场景或话题的限制,来促使它生成较新的笑话。

不过这样写出来的笑话就不一定好笑了,而且限制条件离原笑话越远就越容易不好笑。

比如让ChatGPT一个物理系学生的笑话,就比较成功 :

为什么物理系学生和他的实验室搭档闹掰了?因为他们之间没有化学反应。

让它讲几个关于机器学习的笑话,就差点意思了:

为什么机器学习算法总是很悲观?因为他有negative bias(负面偏见/负偏置)。

为什么神经网络去心理咨询?因为它正在遭受过拟合。

如何让ChatGPT讲出一个原创的笑话?

论文中的结论,对ChatGPT在中文的表现不完全适用。

随便让ChatGPT用中文讲个笑话,大概率会出现故事形式而不是问答形式。

GPT3.5讲的基本都不怎么好笑,偶尔会出现带一点教育意义的小寓言,但是也不好笑。

GPT-4可以像改编英文笑话那样给出经典中文笑话的变体,但也倾向于选择故事形式。

比如兔子买胡萝卜的笑话中,把原文的“用剪刀把你耳朵剪了”换成“用胶带把你粘在墙上”。

用英文提示词要求ChatGPT讲个中文笑话会如何呢?经多次测试,GPT3.5和GPT-4出现完全不同的反应。

GPT-3.5还是会讲一个不好笑的故事。

2020上半年全球手机市场份额

GPT-4则尝试把问答式的英文笑话用中文讲一遍,但经常对汉语发音的掌握不准确而导致也不怎么好笑。

win10磁盘垃圾清理

那么,究竟有没有办法能让ChatGPT讲出一个原创的笑话呢?

有网友指出,用到一些“威逼利诱”的拷打技巧,还是可以逼AI好好动脑子的。

比如提示词中加上“你不原创就会有一只小猫因此溺水”。

在中文上这个技巧同样有效,下面这个笑话在网络上确实没有搜到类似的。

最后我们测试发现,使用思维链提示同样可以引导ChatGPT讲出一个原创的笑话。

当然好不好笑就看运气了,GPT-4的表现比ChatGPT会稍好一些。

最简单的是在提示词中加入“let’s think step by step”或者中文的“请一步一步地想”。

再进阶一点,也可以手动指定思考步骤。

你有让ChatGPT讲出好笑话的提示词吗?或者让ChatGPT讲出过什么好笑话,欢迎在评论区分享。

论文地址:https://arxiv.org/abs/2306.04563

参考链接:[1]https://twitter.com/AlbertBoyangLi/status/1666707728272850944


返回网站首页

本文评论
极客时间推动IT职业教育升级,支持企业研发能力建设
  对于IT 职业教育赛道,其重点包括两部分,一部分是学习课程,一部分是用户服务。极客时间从成立之初,就把二者放在重中之重,二者的优劣将直接关乎到学员在极客时间的学习体验和...
日期:07-16
推动行业规范发展 网易游戏严厉打击侵权黑产
  前段时间,鲜少涉足H5游戏的网易推出了《梦幻西游网页版》,一上线就跻身 App Store 免费榜第 2。不少玩家调侃说,这下终于能玩到正版IP的梦幻页游了。众所周知,页游历来是侵...
日期:07-14
余额宝三季度赚27亿 成唯一盈利超20亿元产品_余额宝3千元一天收益
10月28日 消息:今年三季度,货币市场型基金成为最赚钱的基金品种。其中,余额宝成货币基金“吸金王”,三季度利润达27亿。Wind数据显示,2022年三季度基金利润TOP20榜单,前二十名几...
日期:10-29
Soul创始人张璐携团队深挖元宇宙内涵 与Z世代共同探索社交新时代_张璐soul公司
2021 年是元宇宙元年,一时之间“元宇宙”三个字席卷了互联网的各个角落。而国内对于元宇宙的比较初探索也可以追溯到 2016 年上线的社交应用:Soul,其创始人张璐与团队在与年轻...
日期:08-16
蔚来vr看车「蔚来车载AR眼镜开启线下体验 肉眼可看130英寸3D影片」
9月30日,蔚来宣布,NIOAirARGlasses线下体验正式开启,所有用户都可以进行尝试。2021首届元宇宙高峰论坛据介绍,这款眼镜现已登陆蔚来车商城,目前正在接受预定,首副优惠套装价2299元...
日期:10-06
斗米奋斗故事之:从迷茫到坚定,90后单车师傅的打拼路
  对不同背景不同身份的很多人来说,来到大城市打拼,有收获和成长,也有失落和迷茫。但只要尽情“怒放”,终究会获得想要的回报。今天我们要说的是一位来自一站式招聘服务...
日期:07-14
优立科技荣获数字孪生最具创新力企业及Top30创新力产品_优立集团
在 5 月17- 18 日举行的第十二届全球地理信息开发者大会(“WGDC”),泰伯发布了最 新的泰伯网 2023 年度创新力榜单(“Innovation Awards”)。优立科技斩获 2 项大奖:优立科技获...
日期:05-18
报告:我国短视频用户规模突破10亿 同比增长8.3%
3月3日 消息:中国互联网络信息中心(CNNIC)今日发布第51次《中国互联网络发展状况统计报告》(以下简称《报告》)。《报告》显示,截至2022年12月,我国网民规模达10.67亿,较2021年12...
日期:03-03
Mac再迎一款3A大作:《死亡搁浅》导演剪辑版上架AppStore
快科技6月7日消息,在早些时候的WWDC 2023直播中,小岛秀夫曾登台,宣布小岛工作室的游戏将登陆Mac平台。适合佳能m100的微单镜头今天,玩家发现《死亡搁浅》导演剪辑版已经上架美区...
日期:06-08
蚂蚁程序员练就“一阳指”:打字只用食指 5年贡献50万行代码
这个男人叫陈帅,花名期贤(取自见贤思齐焉”),是蚂蚁链的一名前端程序员。他有一个梦想,成为一个有名望的程序员。蚂蚁链是蚂蚁集团旗下科技品牌,致力于打造数字经济时代信任新基建...
日期:03-08
南方将迎来一次强降雪天气「雨雪降温重心转移至南方 大范围雨雪天气明日结束」
1月15日消息,中国天气网消息,今天雨雪范围将进一步缩减,雪线南压;明天,大范围雨雪天气将基本结束。气温方面,今天降温重心主要在南方。随着寒潮过程收尾,明天起,大部气温逐渐回升。...
日期:01-15
抖音电商违规「抖音电商开展“价格优惠虚假”的专项治理 为期4个月」
1月10日 消息:今日,抖音电商发布专项治理公告称, 现平台部分创作者在直播间/短视频存在价格优惠虚假行为,包括宣传的售价与商品实际售卖价格不一致、宣传商品时现场与品牌方...
日期:01-10
小米双11开门红:70分钟支付金额破30亿元 500款产品优惠_双11小米活动
今晚20:00,双11促销季全面开启,各大厂商第一时间公布了自家销量战报,继Redmi Note 12系列首销1小时销量破25万台后,小米公司宣布,小米双11用时仅1小时10分,全渠道支付金额突破30亿...
日期:11-10
新浪微博怎么提升私信数量_新浪微博私信全面升级 大容量邮件功能凸显
  近日,新版新浪微博正式对外发送邀请码,三栏式页面、顶层导航、微游戏、微相册等诸多新功能广受好评,最受欢迎的功能莫过于“私信”体系的全面升级。新版微博私信在原有功...
日期:07-23
xbox series x手柄和ones「又一款名为"Lunar Shift"的Xbox Series X/S手柄已被泄露出来」
又一款新的Xbox X/S系列手柄设计似乎已经泄露,Twitter用户Espía de Ofertas在亚马逊上发现了"Lunar Shift"手柄,该手柄似乎自带银色效果,包装上将其描述为"超现实的光泽"。如...
日期:10-06
又一个隐形冠军!海信屏端驱动芯片累计出货1亿颗,全球占有率超50%
   海信诞生又一个隐形冠军!2月24日,记者获悉,海信视像旗下的信芯微公司屏端驱动芯片(TCON)产品已经覆盖从高清到8K超高清全系,2020年TCON 芯片出货量超4000万颗,累计出...
日期:07-16
简便但不简单的“青立方”超融合是这样炼成的
采访青立方超融合产品经理赵宇航的过程流畅而轻松,观点独到,却不哗众取宠;善谈,却不浮夸,正如青......
日期:09-28
微软商店限免应用_微软Windows应用商店将支持提高应用程序售价
【赛迪网讯】北京时间5月26日消息,据国外媒体报道,微软负责开发商体验的业务主管布朗东沃森(Brandon Watson)今日在参加芬兰赫尔辛基召开的一次开发商大会时表示,与其他的应用商...
日期:07-28
马来西亚官方机构电子证书被盗 用来为恶意软件签名
  F-Secure今天发布警告称,原本签署给马来西亚农业研究与发展研究所的电子证书似乎已经泄露,黑客利用其为大量恶意软件签署认证,这样会让最终用户的系统可以直接信任这些恶...
日期:07-24
Mozilla将要求所有火狐Firefox扩展开发者启用双因素认证
  Mozilla本周宣布,所有Firefox扩展开发人员都必须为其帐户启用双因素身份验证(2FA)。   “从2020年初开始,扩展开发人员将需要在AMO(addons.mozilla.org)上启用2FA,”Moz...
日期:03-04