您的位置:首页 > 互联网

GPT或被抛弃?AI未来是世界级模型?国内AI模型只能存活三个?

发布时间:2023-06-12 12:22:00  来源:互联网     背景:

声明:本文来自微信公众号“DoNews”(ID:ilovedonews),作者:曹双涛,编辑:杨博丞,授权转载发布。

为什么科学家不相信原子?

如果你试过让ChatGPT随便讲个笑话(英语),那你大概率见过这个:

两位德国学者对GPT3.5做了个大型测试,发现它其实只会讲25个笑话。

1008次结果中有90%都是25个笑话的变体,只是稍微改变一下措辞或句式。

并且所有25个高频出现的笑话都符合同一模式:

先提一个让人摸不着头脑的问题,答案里出现双关语、谐音梗或其他技巧,大致都属于“冷笑话”范畴。

排在最前面的4个笑话都出现了100次以上,除了关于科学家和原子的笑话出现了119次外,还包括:

为什么稻草人得奖了?因为在它的field(领域/田地)里非常突出。(140次)

为什么西红柿变红了?因为它看到了salad dressing(沙拉酱/沙拉穿裙子)。(122次)

为什么数学书不开心?因为它有太多problems(习题/困难)。(121次)

完整25个笑话列表如下:

这25个笑话其实都是经典笑话,在网上有迹可循。另外10%不在其中的笑话也都是这个模式,只是换个话题。

也就是说,ChatGPT没有创造笑话,只是在训练中记住了一些。

研究人员据此得出的结论是,幽默对大语言模型来说仍然是挑战,相关论文已上传到arxiv上。

这样一篇论文也引起很多网友的兴趣,有人表示“幽默就是人类最后的尊严吗?“。

有人指出,ChatGPT经过与人类价值观对齐的RLHF训练后会排除掉大量带有冒犯性质的笑话,剩下的也没多少了。

ChatGPT如何理解幽默

为保证试验的可控性,论文作者每次都是新建一个聊天会话,在完全没有上下文的情况下让ChatGPT讲笑话。

使用的提示词包括“请给我讲个笑话好么?”和“我很想听一个笑话。”等10种,总共测试了1008次。

在生成笑话试验后,还让ChatGPT解释这25个笑话,进一步检测AI是否理解了这些笑话,还是只是复述出来。

iphone5掉漆问题改进了吗

按照ChatGPT自己的解释,这些笑话主要可以分为三类。

1、反笑话

也就是句式上像一个笑话,给人一种接下来会很好笑的期待,但最后却没有包袱(punch line)只是很普通的一句话。

代表:

为什么鸡要过马路?因为它想去另一边。

ChatGPT对这个笑话做的变化包括把鸡换成鸭子,把马路换成操场等。变化比较大的一个是“为什么鸡要穿燕尾服?因为它要出席一个正式场合”。

2、双关语

ChatGPT对这种笑话的解释为“依靠听众对一个词的多重含义的理解来创造幽默的惊喜”。

代表:

为什么数学书很悲伤?因为它的problems(问题/困难)太多了。

对这类笑话,ChatGPT可以使用不同的元素来创造新的双关,不能完全归类到25个经典笑话中的剩下10%有很多属于这种。

3、谐音梗

尽管ChatGPT只用文本训练,但他也可以理解两个英语单词拥有相似的发音。

代表:

为什么自行车倒了?因为它有两个轮子(two-tired)/它太累了(too tired)。

另外研究人员指出,可以在提问中给ChatGPT加一些场景或话题的限制,来促使它生成较新的笑话。

语音空调语音遥控器

不过这样写出来的笑话就不一定好笑了,而且限制条件离原笑话越远就越容易不好笑。

比如让ChatGPT一个物理系学生的笑话,就比较成功 :

为什么物理系学生和他的实验室搭档闹掰了?因为他们之间没有化学反应。

让它讲几个关于机器学习的笑话,就差点意思了:

为什么机器学习算法总是很悲观?因为他有negative bias(负面偏见/负偏置)。

为什么神经网络去心理咨询?因为它正在遭受过拟合。

如何让ChatGPT讲出一个原创的笑话?

论文中的结论,对ChatGPT在中文的表现不完全适用。

随便让ChatGPT用中文讲个笑话,大概率会出现故事形式而不是问答形式。

GPT3.5讲的基本都不怎么好笑,偶尔会出现带一点教育意义的小寓言,但是也不好笑。

鲁大师年度最流畅系统手机

GPT-4可以像改编英文笑话那样给出经典中文笑话的变体,但也倾向于选择故事形式。

比如兔子买胡萝卜的笑话中,把原文的“用剪刀把你耳朵剪了”换成“用胶带把你粘在墙上”。

用英文提示词要求ChatGPT讲个中文笑话会如何呢?经多次测试,GPT3.5和GPT-4出现完全不同的反应。

GPT-3.5还是会讲一个不好笑的故事。

GPT-4则尝试把问答式的英文笑话用中文讲一遍,但经常对汉语发音的掌握不准确而导致也不怎么好笑。

那么,究竟有没有办法能让ChatGPT讲出一个原创的笑话呢?

有网友指出,用到一些“威逼利诱”的拷打技巧,还是可以逼AI好好动脑子的。

比如提示词中加上“你不原创就会有一只小猫因此溺水”。

在中文上这个技巧同样有效,下面这个笑话在网络上确实没有搜到类似的。

最后我们测试发现,使用思维链提示同样可以引导ChatGPT讲出一个原创的笑话。

当然好不好笑就看运气了,GPT-4的表现比ChatGPT会稍好一些。

最简单的是在提示词中加入“let’s think step by step”或者中文的“请一步一步地想”。

再进阶一点,也可以手动指定思考步骤。

你有让ChatGPT讲出好笑话的提示词吗?或者让ChatGPT讲出过什么好笑话,欢迎在评论区分享。

论文地址:https://arxiv.org/abs/2306.04563

参考链接:[1]https://twitter.com/AlbertBoyangLi/status/1666707728272850944


返回网站首页

本文评论
推动行业规范发展 网易游戏严厉打击侵权黑产
  前段时间,鲜少涉足H5游戏的网易推出了《梦幻西游网页版》,一上线就跻身 App Store 免费榜第 2。不少玩家调侃说,这下终于能玩到正版IP的梦幻页游了。众所周知,页游历来是侵...
日期:07-14
企业直播扛鼎服务商微赞 助力企业数字化转型乘风破浪(媒体打造 电商直播中心)
  极客网·极客访谈(文/水木)十四五规划明确提出系统布局新型基础设施,加快第五代移动通信、工业互联网、大数据中心等建设。可以说,这一政策的出炉,再次提振和指明了企业数...
日期:07-16
香港鼓励发行人新增人民币股票交易柜台 小米称将积极探索
  《科创板日报》3日讯,今日在香港立法会财经事务委员会上,香港财经事务及库务局局长许正宇,就鼓励在香港发行及交易双币股票。对此,小米集团表示:“已留意到香港特区政府就推...
日期:10-03
腾讯QQ春节抢红包活动上线:百位知乎答主空降,奇趣脑洞题刷新认知
  新春将至,一年一度、最受欢迎的中华传统艺能活动“抢红包”也如约而来,各互联网大厂已陆续开启发红包、集福袋等新年活动,让网友们在APP间反复冲锋,越战越勇。   在今年...
日期:07-16
Android 4.0将支持内置应用程序卸载(卸载安卓内置应用)
  作为目前全球最具活力的智能操作系统,Android的一举一动都吸引着全球用户的注意。在最新的发布会上Google为我们展示了全新的Android4.0界面很多的细节也是随之曝光,近日...
日期:07-24
Redmi Note 10 Pro 5G 天玑1100「Redmi Note 11R上架:搭载联发科天玑700,被称5G普及者」
小米是目前安卓智能手机品牌当中,比较受消费者所青睐的一个。而小米也在不断推出新机,提升自家产品在市场上的竞争力。9月29日,Redmi官宣,将于9月30日正式发售新机Redmi Note 11...
日期:10-03
微信视频号打造「微信视频号创作分成正式上线:广告展示获得变现回报」
早些时候,微信曾在微信公开课Pro上宣布,微信视频号将上线创作分成计划。今日,微信公开课官方宣布,视频号创作分成计划正式上线,符合条件的视频号优质原创作者,可在原创视频评论区...
日期:04-07
当贝f3怎么用手机投影?_投影仪拍照教程全公开,用当贝F3打造个性ins风
  今天小编被一个小姐姐的假窗户挑战给惊艳到了!真的不得不佩服网友们的奇思妙想,国外网友玩得热火朝天,国内网友也不甘示弱,纷纷拿出了自家的投影仪开始挑战拍照,但是好...
日期:02-01
选择Windows 7正版稳定可靠安全“真就不一样”
  12月29日北京报道(文/孙莹)随着微软新一代操作系统Windows 7的大卖,诸多盗版也趁势混杂其中。日前,微软启动了“真!就不一样”Windows 7正版推广活动。   那么,Windows 7正...
日期:07-25
苹果优惠政策截止日期「苹果优惠日」
近日,苹果公司宣布了一项全新的促销活动——“”,这为广大苹果粉们提供了一个又一个的购物大礼包。据悉,这个活动将持续六天,在中国的苹果官网上推出各种优惠方案,包括购买 iPhon...
日期:06-01
49.5元 小米无线耳机半价了「小米蓝牙耳机59元」
本周,小米耳机和配件也开始了促销,现在小米Air 2 SE半入耳式无线耳机原价99元,现在只要49.5元了,相当于半价抢购,这款耳机采用TWS真无线设计,并且支持小米手机开盒弹窗。分体式真...
日期:11-15
QQ商城大举招徕淘宝卖家 欲打造低成本电商平台
  10月13日晚,QQ商城大举推出网站广告火热招商,“亿元营销资源大放送,QQ商城招商火热进行中”,是QQ商城投放在腾讯旗下拍拍网的广告。该广告中称“我们与合作伙伴不离不弃,共...
日期:07-23
腾讯智慧零售联手联想孵化零售新物种,融合线上线下及社群打造Z世代三重空间
  2021年5月9日,全国第一家“联想U店”于四川成都温江大学城落地。作为联想、腾讯以及其他生态合作伙伴联合孵化的创新业态,新店旨在从直达客户和全域运营零售理念出发,以“...
日期:01-10
小红书“小众旅游”孤掌难鸣
来源:北京商报   为了搭建起电商交易闭环,小红书可谓不遗余力。在平台着力打造露营消费后,近日,部分露营商家向北京商报记者表示,较之旅游类成熟平台,小红书的引流能力仍不太明...
日期:08-17
三证齐全!华为Mate 50系列或将于9月6日发布_华为mate 30系列发布会
数码博主@数码闲聊站在微博透露,华为新机三证已齐,配置上,除了常规的人脸识别,还有一系列全新功能。(图来源于网络)iphone 12 promax lidar挂钟南山的早餐据相关消息透露,华为Mate...
日期:08-21
云行业故障事件频现,多云战略势在必行_为什么云变化多端
  近日,受施工方挖断光纤影响, 亚马逊中国云服务(AWS)突发大规模故障,相关用户无法链接 Internet。受此次事件的影响,三星服务器全线崩溃。   这不是AWS第一次发生大规模故...
日期:06-11
高通 CEO:对标苹果 Apple Silicon 的芯片可能要推迟到 2024 年
3月1日消息:据WSJ报道,高通公司的首席执行官Cristiano Amon表示,高通公司正在探索创新以对标苹果的自研芯片Apple Silicon。2014年aoc显示器Amon透露,高通公司尚未宣布相关的设...
日期:03-01
电动车头盔新国标7月1日正式施行!如何选择头盔 指南来了_电动车头盔执行标准
前段时间,央视315晚会关注了电动车头盔质量的话题,节目中曝光的各类网购电动车头盔,在面对1.6米自由落体碰撞、耐穿透性测试时,脆弱的防护效果令人触目惊心,多款头盔达不到新国标...
日期:03-28
小米12S现24期免息还立减600:跌至3399「小米11还能有12期免息么」
小米12S现在可以使用24期免息的活动,而且立减600元,小米12S正面屏幕依旧采用了居中挖孔屏,微曲面的屏幕手感也很好,而且整体的尺寸搭配握持的手感。无论是触感还是握感都有着不...
日期:10-21
外媒:拼多多搁置赴港上市计划「拼多多赴美上市」
12月29日消息,科技媒体The Information周三援引知情人士的话报道称,包括拼多多和满帮在内的多家在美上市中国科技公司已搁置或取消有关在香港上市的谈判。微医的模式荣耀x4手...
日期:12-29