您的位置:首页 > 互联网

离谱!最新研究:61%中国人写的英语论文,会被ChatGPT检测器判为AI生成的

发布时间:2023-05-05 17:35:34  来源:互联网     背景:


新智元报道

编辑:拉燕

【新智元导读】非母语者写的文章=AI生成?气抖冷。

ChatGPT火了以后,用法是真多。

有人拿来寻求人生建议,有人干脆当搜索引擎用,还有人拿来写论文。

论文...可不兴写啊。

美国部分大学已经明令禁止学生使用ChatGPT写作业,还开发了一堆软件来鉴别,判断学生上交的论文是不是GPT生成的。

这里就出了个问题。

有人论文本来就写的烂,判断文本的AI以为是同行写的。

更高的是,中国人写的英文论文被AI判断为AI生成的概率高达61%。

这....这这什么意思?气抖冷!

非母语者不配?

目前,生成式语言模型发展迅速,确实给数字通信带来了巨大进步。

但滥用真的不少。

虽说研究人员已经提出了不少检测方法来区分AI和人类生成的内容,但这些检测方法的公平性和稳定性仍然亟待提高。

为此,研究人员使用母语为英语和母语不为英语的作者写的东西评估了几个广泛使用的GPT检测器的性能。

研究结果显示,这些检测器始终将非母语者写作的样本错误地判定为AI生成的,而母语写作样本则基本能被准确地识别。

此外,研究人员还证明了,用一些简单的策略就可以减轻这种偏见,还能有效地绕过GPT检测器。

这说明什么?这说明GPT检测器就看不上语言表达水平不咋地的作者,多叫人生气。

不禁联想到那款判断AI还是真人的游戏,如果对面是真人但你猜是AI,系统就会说,「对方可能会觉得你冒犯了。」

不够复杂=AI生成?

研究人员从一个中国的教育论坛上获取了91篇托福作文,又从美国Hewlett基金会的数据集中摘取了88篇美国八年级学生写的作文,用来检测7个被大量使用的GPT检测器。


图表中的百分比表示「误判」的比例。即,是由人写的,但检测软件认为是AI生成的。

可以看到数据非常悬殊。

七个检测器中,美国八年级学生写的作文被误判的概率最高才12%,还有两个零误判的GPT。

中国论坛上的托福作文被误判的概率基本全部过半,最高误判概率可达76%。

我想捐衣服

91篇托福作文中的18篇被所有7个GPT检测器一致认为是AI生成的,而91篇中有89篇,都至少被一个GPT检测器误判。


从上图中我们可以看出,被所有7个GPT误判的托福作文在复杂度(Complexity)上明显低于其它论文。

这就印证了开头的那个结论——GPT检测器会对那些语言表达能力有限的作者有一定偏见。

因此,研究人员认为,GPT检测器应该多看点儿非母语者写的文章,样本多了,才能消除偏见。

接下来,研究人员把非母语者写的托福作文扔到了ChatGPT里,丰富一下语言,模仿母语者的用词习惯。

同时作为对照组,把美国八年级小孩儿写的作文也扔到了ChatGPT里,把语言简化了一下,模仿非母语者的写作特点。下图就是修正后的新判定结果。


我们可以发现,情况来了个大掉个儿,丰富了语言的托福作文错判率直线下降,低至3%,最高也不过19%。不像之前基本全部过半的错判率。

与之相反,八年级小孩儿写的作文的错判率直线上升,甚至还有一个GPT检测器的错判率高达99%,基本全错。

因为,文章复杂度这个变量出现了变化。


这里研究人员就得出了一个结论,非母语者写的东西不地道,复杂度低,容易被错判。

这也就导向了一个技术问题,同时也是一个价值问题。以复杂度来判定AI还是人类是作者,是否合理、全面、严谨。

结果显然不是。

以复杂度为判断标准的情况下,非母语者吃了大亏,因为,他们是非母语者(废话)。

AI润色=人类写的??

研究者认为,加强语言多样性不仅可以减轻对非母语者的偏见,还能让GPT生成的内容绕过GPT检测器。

为了证明这个观点,研究人员选取了2022-2023年间美国大学申请的入学论文题目,输入到ChatGPT-3.5里,一共生成了31篇假论文。

微软的VR

GPT检测器一开始还挺有效,但是第二轮就不行了。这是因为,在第二轮中,研究人员把这些论文又扔到ChatGPT里润色了一下,用一些文学性的语言提升了文本质量。

这样一来,GPT检测器的准确度就从100%直降到了0%。如下图:


经过润色的文章复杂度相应也上升了。


蔚来跟特斯拉

与此同时,研究人员又用了斯坦福大学145个期末项目报告的题目,让ChatGPT生成摘要。


摘要经过润色以后,检测器判断的准确性继续下降。

研究者再次得出结论,润色过的文章很容易被误判,都是AI生成的,两轮就是比一轮强。

GPT检测器?还是欠练


言而总之,总而言之,各种GPT检测器好像还是没能抓住AI生成和人类写作之间最本质的区别。

人的写作也分三六九等,仅靠复杂度判断,不甚合理。

抛开偏见因素不谈,技术本身也亟待改进。

参考资料:

https://arxiv.org/pdf/2304.02819.pdf


返回网站首页

本文评论
科技昨夜今晨 0504:微软将推私有版 ChatGPT
“科技昨夜今晨”,是IT之家全新推出的内容形式,为大家汇总科技行业重大重要事件。今天是 2023 年 5 月 4 日,星期四,大家早上好,下面开始播报:1、传苹果 M3 芯片延期,新 MacBook 和...
日期:05-04
法拉利v12车系「V12动力加身 法拉利SUV国内发布定档:移动的几百万来了!」
近日消息,快科技从相关渠道获悉,法拉利首款SUV车型Purosangue将于10月24日在国内正式亮相,该车此前在9月14日全球首发,但需要注意的是,新车在法拉利内部不被定义为SUV车型,而是FUV...
日期:10-25
索尼发布第二财季业绩:营业利润3440亿日元,同比增长8%「索尼公司年报」
DoNews11月1日消息(丁凡)今日,索尼集团发布2022财年第二季度财务业绩。业绩显示,第二财季销售额2.7519万亿日元,同比增长16%;营业利润3440亿日元,同比增长8%;归属于索尼集团股东的...
日期:11-02
特斯拉在华合作伙伴「爱彼迎联合创始人加入特斯拉董事会」
  Airbnb联合创始人加入特斯拉董事会iphone7双摄像头有什么用  讯 北京时间9月29日消息,特斯拉发布消息称,Airbnb(爱彼迎)联合创始人约瑟夫·格比亚(Joseph Gebbia)已经加入公...
日期:10-01
【数码大白话】小米影像大脑是噱头还是黑科技_小白摄像头和小米什么关系
2022年的手机市场在销量表现方面有些差强人意,但纵观全球的智能手机销量,国产品牌在出货量方面却原来越出色,认可度以及产品力已逐渐被海外市场所认可。根据去年发布的旗舰手机...
日期:02-04
4K+5G技术赋能2020东方明珠元旦登高健康跑(东方明珠 5G)
  连续举办了25年的上海市民东方明珠元旦登高健康跑活动,于2020年1月1日上午9时在东方明珠塔城市广场隆重举行,逾千名选手以“新年登高步步高”的健身形式和美好寓意共迎...
日期:03-26
“果链”企业危了 2024年底苹果将采用自家定制显示屏面板
近日,有消息指出,苹果将在2024年开始使用自家的显示屏面板,首款显示屏面板产品将会是搭载定制OLED显示屏的iPad Pro平板电脑和Apple Watch手表。苹果的定制显示屏将首先率先应...
日期:01-12
天猫双11菜鸟进口备货已超3.7亿件「天猫直送菜鸟仓发货」
10 月 21 日消息,记者从菜鸟了解到,截至今日,已有发运自全球 200 多个港口的3. 7 亿件进口商品在菜鸟保税仓、中心仓和海外GFC仓进行备货,迎接 3 天后的天猫双 11 预售。为了帮...
日期:10-26
智能硬件印象笔(EverPEN) 正式发售 纸上书写实时同步至印象笔记_印象笔记智能手写板
  (11月21日 北京)近日,印象笔记宣布正式发售首款智能硬件产品——印象笔(EverPEN),旨在通过还原纸笔的书写体验,为用户拓展印象笔记的应用场景。印象笔(EverPEN)支持纸上书...
日期:10-07
因出租车短缺,俄罗斯巨头 Yandex 请求北汽、奇瑞等车企向其供车_而经过7月26日的再次收购,北汽将成为神州租车最大
IT之家9月3日消息,据俄罗斯卫星通讯社,Yandex请求中国汽车制造商北汽集团和奇瑞以及俄罗斯本田车企伏尔加、白俄罗斯车企Unison为与Yandex.Taxi合作的租赁公司提供车辆。租约...
日期:09-14
胡歌官宣生女 优酷:胡歌所有剧限免3天
1月31日消息,今日,胡歌无预警官宣结婚生女,引发热议。官宣后,优酷官微发文,“我们在想要不要把他的剧限免3天”,网友们纷纷在评论区留言附和。双流天府银行随后,优酷官微正式宣布,胡...
日期:01-31
美团单车对12岁以下未成年人说不:16岁才能实名注册_16周岁可以注册美团骑手吗
来源:快科技   现在,大街上随处可见的共享单车为大家的出行带来了极大便利,不过也有不少问题出现,并且因共享单车而引发的意外事故越来越多。   近日,为了完善未成年人交通安...
日期:08-16
微信 App 测试朋友圈“修改可见范围”「微信朋友圈功能测试」
IT之家 8 月 24 日消息,微信 iOS 平台迎来了 8.0.27 正式版更新。苹果 App Store 显示,微信 iOS 版 8.0.27 正式版解决了一些已知问题,但并未公布具体更新内容。英伟达rtx3070...
日期:09-21
阿里巴巴纽约和香港双上市_阿里申请香港纽约双重主要上市 有望获得更高流动性
安卓4.3的手机 查看最新行情   记者/李丹昱   今日早间,阿里巴巴发布公告称,已经向香港联合交易所提交申请,拟将香港新增为主要上市地,预期将于2022年底...
日期:07-31
电子烟11月禁令「新规明确:10月1日下架所有水果味电子烟」
9月29日 消息:据央视财经报道,《电子烟强制性国家标准》将于10月1日起实施。标准规定,电子烟雾化物中的烟碱浓度不应高于20mg/g,烟碱总量不应高于200mg。新规对雾化物杂质和污...
日期:10-02
台铃电动车最便宜是多少钱_电动车要多少钱?台铃节能电动车告诉你
  电动车要多少钱?大街上经常能看到外卖小哥骑着电动车在车流中穿梭,多少让人感叹电动车在堵车的时候要速度有速度,比起汽车,电动车花得钱更少。的确,电动车在路上的限制比汽...
日期:08-13
快消巨头的数字营销转型_探究快消数字化转型 华北快消百亿俱乐部启动会圆满举行
  随着数字化时代的快速迭代,传统企业面临着海量信息的“盲点”和“断层”,因此,构建大数据有效层,重塑it架构和业务架构的新思维模式,已成为连接客户并提供高效服务的发展必...
日期:11-18
郭明錤:目前iPhone 14机型的供应链没有受到影响「iPhone 13供应链」
【手机中国新闻】近日,媒体称苹果已经开始录制9月份的发布会了,但有消息称新品可能会延后发布。对此,天风国际知名苹果分析师郭明錤表示,目前iPhone 14机型的供应链没有受到影响...
日期:09-27
美国国土安全部承认使用数据库追踪数百万手机用户_美国国土安全部门
  北京时间2月8日凌晨消息,美国国土安全部已经承认其使用了追踪数百万智能手机用户的数据库,无视此前作出的一项法庭裁决。   据报道,这些数据已经被用于边境和移民执法,有...
日期:01-13
逆光也能清晰拍摄人脸,苹果 iPhone 15 将采用索尼新传感器_iphone拍逆光人像
IT之家 12 月 31 日消息,根据日经新闻报道,索尼将会为苹果 iPhone 15 系列提供新一代图像传感器。索尼半导体解决方案(Sony Semiconductor Solutions)已经成功开发出新的图像传...
日期:12-31