您的位置:首页 > 媒体评论

ChatGPT死活不认27能被3整除,网友:不是说AI要统治世界了吗?

发布时间:2022-12-14 02:04:38  来源:互联网     背景:

Alex 羿阁 发自 凹非寺

量子位 | 公众号 QbitAI

让众人疯狂的网红AI ChatGPT,原来也有明显的短板?

一段“网友调教这只AI”的聊天记录,在网上传开了。

可以看到,AI起初居然说27是个质数。

在网友向其提出质疑后,AI仍嘴硬称“27不能被3整除”。

网友不得不和AI“大战几百回合”,最后在人类锲而不舍的教导下,AI才终于终于低头认错。

上述图源:微博@沙雕文案 援引网友空间截图

有一说一,AI的认错态度倒是很好。

有围观者看完后调侃:AI不是都要统治世界了吗,怎么会输给一道简单的数学题?

丰田第一辆电动车

不过,也有很多人为ChatGPT说话:这么坦诚的认错态度,不比某些人强多了

数学水平拉胯,还贼固执

具体事情是这样的:

网友在和ChatGPT互动的过程中发现,这只AI数学水平过于拉胯,连27是不是质数这种简单问题都能搞错——而且还是在知道质数定义的情况下……

于是网友让ChatGPT证明它给出的结论,没想到,AI居然说27不能被3整除。

网友表示无语,但还是耐着性子又问了一遍,结果AI依然嘴硬,偏把9说成是9.0。

无奈,网友只能搬出代码,试着用Python来教会AI。

结果AI还真学会了!而且人家还主动承认了刚才的错误。

有意思的是,我们刚才也去问了ChatGPT“27是不是质数”,发现它已经改过来了。

然后我们又拿了几个数字去问AI,结果在这一回合中,它都正确地判断了一个数到底是不是质数。

不过仔细一看,AI并没提到35能被7整除,于是我们又专门问了一遍。然鹅……

这岂不是一本正经地胡说八道嘛?

于是我们也只好搬出Python教教它,但这回,连python似乎也没能让AI承认自己的错误……

所以这只AI为啥算术水平如此堪忧,而且还如此固执?

其中一个重要的原因就是,ChatGPT是个语言大模型,根据Open AI的GPT-3.5的模型微调而成,它擅长逻辑推理,但并不能执行标准的计算机算法。

而且与搜索引擎不同,它目前也没有网页浏览功能,无法调用在线计算器。

此前,ChatGPT其实已经向用户坦言,它不懂算术。两位数的乘法或许还凑乎,但遇到三位数的乘法,人家直接不干了。

我们也去问了一遍,现在AI到是直接给了个答案,不过是错的。(正确答案为186524)

另外,ChatGPT一般不会根据用户的反馈来纠正自己的答案,但如果用户提出了额外的信息,有时也能辅助AI优化答案。

所以,我们暂时没有成功地“教育”AI,大概也许可能是运气不太好……

除了数学其他都很全能

尽管ChatGPT有时会展现出“人工智障”的一面,但不得不说,大多数时候它的表现还是很优秀的。

比如,哥伦比亚大学教授、谷歌工程师Kenneth Goodman就分享,ChatGPT已经做好成为律师的准备了!

在律师执业考试中,ChatGPT的正确率高达70%(35/50)。

不仅是法律方面,Goodman还让ChatGPT参加了其他不同领域的各种考试,都取得了很高的成绩。

包括美国医师执照考试(USMLE),拿掉其中的图像选择题后,ChatGPT同样做到了70%的正确率。

比亚迪新能源车出货量

为了防止ChatGPT的训练数据中包含这些题目,Goodman还特意选取了纽约州2022年8月最新化学注册考试:

去除5个图片选择题,ChatGPT的正确率为77.7%(35/45)。

同样批次的英语考试中,ChatGPT的正确率甚至达到了91.6%(22/24)

有网友已经开始预测,或许我们每个人都将拥有自己的律师AI了,咨询律师的费用也会大大下降。接下来就是医生AI、营养师AI……

怎么样,你看好ChatGPT的未来应用吗?(或者你有让它学好数学的建议吗?

— 完 —


返回网站首页

本文评论
借力元宇宙!90后董事长试水“元宇宙婚礼”股价连涨
原标题:90后董事长试水“元宇宙婚礼”后股价连涨 这家公司要“借力”元宇宙多久?图片来源:网页截图继直播间婚礼、云婚礼后,元宇宙也能办婚礼了?国庆假期刚结束,中青宝(SZ300052,股...
日期:10-12
开启全新支付方式!微信上线刷掌支付小程序下载_开启全新支付方式!微信上线刷掌支付小程序
早在去年年末,腾讯就曾获批通过了一项专利,该专利展示了腾讯开发的一项掌纹识别设备。数商,大数据时代而在今年8月,腾讯又注册了“微信刷掌”“微信刷掌服务”“WePalm”等多个...
日期:10-16
windows 10 21H1新功能_微软提醒 Win10 21H1 即将停止支持
  9 月 16 日消息,微软已通知 Windows 10 21H1 用户,他们继续使用的操作系统将很快停止支持。安卓之父essential phone  微软计划在 2022 年 12 月 13 日停止支持所有版本...
日期:09-17
快下载!微信键盘安卓/iOS正式版1.0.0发布:已上线各大应用商店「安卓微信键盘怎么设置」
  据网友反馈,“微信键盘”1.0.0正式版已经正式发布,同时登陆安卓和iOS,已经上架各大安卓平台及App Store。新ipad价格公布为防止通过浏览网页感染恶意代码  应用简介中提...
日期:12-20
Zara:一边走高端 一边收废品_zara旧衣回收
作者:响马 | 编辑:葛伟炜“但做这些,仍然不够。”好文3478字 | 6分钟阅读近些年,快时尚巨头在中国加速败退。携程租车百度百科据媒体报道,Forever 21、Esprit、NEW LOOK、Topshop...
日期:10-06
支付宝小荷包自动收益_支付宝小荷包“扩容” 最多支持60人同时使用
  9月29日消息,支付宝官方宣布,支付宝小荷包扩容,从现在开始,集体经费模式可以支持60人同时使用,成员余额可以提前预存、灵活分摊、自动计算,事后多退少补,适用于团建、班费、聚...
日期:10-01
今年双十一电视销量排名_销量持续下滑 双十一或成电视促销关键节点
近几年国内彩电市场的发展真的不太景气,年销量由2016年的5089万台,跌至2021年的3835万台,是近12年以来销量首度跌破4000万台,可见市场有多么萎靡。不过,各大电视厂商发布新品的热...
日期:11-02
互联网找到了新春晚?「网络电视 春晚」
距离阿根廷世界杯夺冠已经过去数天,梅西夺冠相关词条仍旧挂在各大内容平台的热搜前列。虽然赛场上并没有中国球员的身影,但梅西圆梦、球王加冕,这届世界杯在国内的热度堪比一年...
日期:12-23
艺术家们组团抗议 就因为太多人用AI搞事_艺术会被ai取代吗
谁能想到,人类历史上第一次抵抗 AI 的运动,居然会发生在艺术圈。前段时间,世界最大的艺术交流社区 ArtStation ( 后面简称为 A 站 )突然就炸了。点开网站的首页,几乎找不到画师们...
日期:12-27
蔚小理是什么_蔚小理正在失去“先发优势”
作者/周永亮编辑/郑玄国内传统车厂全面发力,蔚小理在新能源汽车建立的先发优势正在缩小。近日,随着珊珊来迟的蔚来公布二季报,蔚小理财报悉数出炉。不管是从交付量,还是销量增速...
日期:09-18
久坐一天的死亡风险,运动多久才能补回来?_运动多久可以抵消久坐伤害
图片来源:pixabay最好的运动计划,是能够完成的运动计划。撰文 | 二七审校 | clefable自从大约十年前,“久坐”(sedentary)这一名词第一次被提出之后,它就成为了诸多打工人的养生大...
日期:12-31
台积电赴美建厂 并非不算“经济账”_台积电美国建厂对华为的影响
文|陈俊一编辑|常亮请得起美国总统出席“开工”典礼的企业,应该不多。但台积电就是少数“面子”足够大的企业——当地时间12月6日中午,台积电在位于美国亚利桑那州首府菲尼克斯...
日期:12-14
营养完爆牛奶,比母乳还好?小众奶市场火爆难掩真相_生活提示小众奶真比牛奶更好吗
作者:阮光锋最近几年骆驼奶、娟姗奶、燕麦奶等等小众奶火爆朋友圈。不少商家在宣传的时候,说它们的营养好,接近母乳,有更容易消化吸收等等之类的作用。这些小众奶的营养到底如何...
日期:10-16
混动车充电,活该被嫌弃?「混动车也要充电吗」
让一辆混合动力车陷入左右为难的境地,可能只需要一根充电桩。国庆假期,有网友吐槽,某高速服务区,一共只有四根充电桩,其中三根被增程车占据。纯电动车车主在一旁急得嗷嗷叫,因为包...
日期:10-14
35个月超过瑞幸,这家咖啡有股“韭菜味儿”「瑞幸咖啡为什么说是割韭菜」
今年的咖啡赛道格外热闹,前有老品牌跨界联名,后有新品牌不断诞生。最近,T97咖啡直播间里的大嘴妹靠着喊麦成为带货界新晋红人。比大嘴妹更出圈的是该品牌的老板李潇,他曾扬言T97...
日期:11-01
为苹果多造一块零件 A股电子巨头的心机与辛酸_苹果配件相关股票
5月17日,即苹果iPhone 14发布的四个月前,库克做了两件事:第一,在公司总部接待了前来拜访的越南总理;第二,再次确认了苹果在越南将扩展供应链。新品发布会后不到20天,苹果再次与印度...
日期:10-11
特斯拉类人机器人_特斯拉的人形机器人“炸弹” 或再造“蔚小理”
图源:特斯拉3至5年后,数百万台人形机器人从特斯拉工厂下线,以低至2万美元的价格送往千家万户。“比汽车更便宜!”这是马斯克为其人形机器人Optimus(擎天柱)画下的蓝图,震动了机器人...
日期:10-15
到底踩没踩刹车,特斯拉和驾驶员家属谁在说谎?_特斯拉 踩刹车
近日,一辆特斯拉失控造成2死3伤的严重事故,再度引发了全网对于特斯拉是否存在“刹车失灵”这个老问题的质疑。目前,司机家属坚称是“刹车失灵”,而特斯拉官方则表示“没有踩刹车...
日期:11-28
量子测量问题是一个问题吗?「属于量子测量问题的三种经典解释是」
量子测量问题是量子力学发展过程中不可回避的一个问题,涉及到量子力学的本质,并且相关争论存在至今。物理学家各有不同观点,文本作者N. D. Mermin认为量子力学不存在测量问题:物...
日期:10-17
指环王中的龙族_看完龙族大战指环王 我发现流媒体的尽头还得靠“拼爹”
亚马逊和HBO这几天“打起来”了,观众们却进入了一场前所未有的狂欢。亚马逊巨资打造的经典IP《指环王:力量之戒》和HBO《权利的游戏》前传《龙之家族》在九月正式在流媒体会面...
日期:09-08