您的位置:首页 > 互联网

GPT-4“炉火纯青”的数据造假能力助研究论文登上学术期刊,Nature请专家调查

发布时间:2023-11-24 10:55:02  来源:互联网     背景:

出品|科技

作者|郑松毅

大家现在或许已经对ChatGPT“睁着眼睛说瞎话”的行为见怪不怪了,但你可能想不到,如今GPT-4的造假能力已经修炼到了“炉火纯青”的境界,伪造的论文数据甚至骗过了国际学术期刊审核员的眼睛。

当地时间11月22日,Nature发文说明,一篇于11月9日发表在《JAMA Ophthalmology》(《JAMA 眼科学》)的论文中存在数据造假的现象,而造假的“幕后黑手”正是GPT-4。

三星折叠手机2021新款W22

法拉利未来创始人

据悉,《JAMA Ophthalmology》自1869年以来连续出版,至今已有百余年历史,是同行评审的国际眼科和视觉科学期刊。

Nature介绍,这次论文造假已不是抄袭这么简单,而是研究人员使用GPT-4的高级数据分析功能(ADA)生成了一个假数据集,准确支撑了错误的论文观点,形成了误导结果。

据报道,研究人员先是向GPT-4输入了一些列数据生成要求,然后提供了一系列的提示词,要求它创建一个关于圆锥角膜(keratoconus)眼部疾病患者的数据集。

目前治疗圆锥角膜疾病的方式主要有两种,一种是穿透性角膜移植(PK),另一种是深板层移植(DALK)。AI 随即生成的数据包括 160 名男性和 140 名女性参与者,并表明接受 “DALK” 治疗的人在视力和成像测试方面的得分都比接受 “PK” 治疗方法的人更好。但经验证发现,这一发现与真正的临床试验显示的结果不一致。

为了验证 GPT-4 做出来的数据是否真的令人信服,Nature 特意请来了英国曼彻斯特大学生物统计学家杰克・威尔金森(Jack Wilkinson)和同事Zewen Lu来检查数据可信度。

调查人员表示,数据集中许多“参与者”的性别与通常从名字中预期的性别不匹配(比如“Mary”是男性)。此外,术前和术后视力测量与眼部影像学测试之间没有发现相关性。”他们认为该数据集存在缺陷。

研究作者随后承认了该调查结果,并表示“如果只是快速地察看这个数据集,很难识别出他不是人做的。”

EMBO报告的主编Bernd Pulverer认为这是一个令人担忧的问题,因为现实中的评审人往往无法进行全面的数据分析,并且不太容易发现人工智能精心设计的违规行为。他补充说,“期刊将需要更新质量检查的方法,以识别人工智能生成的合成数据。”

360木马专杀安卓版

威尔金森也强调,这是一个需要人们思考的问题,因为AI一旦知道自己是哪里“露馅”了,很快将会进步,并找出方法来规避这些问题,从而生成让人类更难以识别的结果。

微软必应手机版

人工智能的发展为科学研究带来了很多帮助,例如在数据分析及复杂运算方面,它都是一个很好的工具。但目前为止,很大一部分科学家还是对其可信性表示担忧。

邵逸夫生命科学与医学奖得奖者彼得·黑格曼(Peter Hegemann)曾对科技表示,“人工智能的确在一些研究工作上帮忙节省了很多时间,比如比对几百个基因,人工做下来要很久,它却可能在几秒内完成。但至少从生物学的角度看,人工智能构建的模型还不完整,生成的结果还不足以让人信赖。”


返回网站首页

本文评论
小红书再现无底线“抢药攻略”:鼓动成人吃儿童退烧药,平台该不该担责?
被各种商家营销套路侵害权益?买到的商品出故障投诉无门? 黑猫投诉平台全天候帮您解决消费难题[消费遇纠纷,就上黑猫投诉]   作者 / 原祎鸣  传播虚假医美、未经用户同意收...
日期:12-21
7项参数全球唯一!vivo X Fold2配备最强折叠屏「x2 fold3」
vivo X Fold2折叠屏亮相,这将是业界最强悍的折叠屏机型。该款手机具有七项处于全球领先地位的技术,包括内外 2K E6 旗舰双主屏、自研航空级水滴铰链、120W 有线 50W 无线闪充...
日期:04-21
点赞过千万多少钱「百万点赞,只卖了3单。」
声明:本文来自于微信公众号 十里村(ID:shilipxl),作者:村长住在十里村,授权转载发布。各位村民好,我是村长。15万的粉丝博主,每个视频都有十几万播放,但橱窗里只卖了三件产品。今天...
日期:12-20
威马w6 汽车之家「威马汽车W6三款车型涨价 10-12月每月上调2000元」
  财联社10月1日电,威马汽车10月1日在官微宣布,受上游原材料价格上涨等综合因素,将上调在售车型威马W6的价格。此次价格调整包括“NEX探索版 520KM”“PRO全能版 520KM”“AC...
日期:10-05
中国在没有引入阿拉伯数字前,是如何书写算式的呢?_阿拉伯数字引入中国时间
当然用我们独创的计算方法了,并且这种沿用了数千年的计算方法,早就解决了“加减乘除”以及各类复杂的算式。阿拉伯数字,又称印度数字,是由0、1、2、3、4、5、6、7、8、9共十个计...
日期:11-20
马斯克:特斯拉电动皮卡 Cybertruck 可以短暂地当船开「特斯拉电动皮卡车Cybertruck」
9月30日消息:特斯拉CEO马斯克在推特上发文表示,电动皮卡Cybertruck的防水性使其可以短暂地作为船只使用,因此它可以穿越河流、湖泊甚至不太汹涌的海洋,而海上卫星联网服务Starl...
日期:10-01
三星现况「三星一季度挣6000亿韩元被美国罚4000亿 起因专利侵权」
韩国《韩民族新闻》23日报道,美国一家专利侵权案的最终裁决出台,韩国三星电子被判缴纳3.03亿美元(约合4000亿韩元)的罚金。韩国媒体对此表示不满,“三星电子第一季度只赚了6000亿...
日期:04-25
文生书法作品「文生图超级大合集!几乎包含所有模型,提示词教程」
声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。除了DALL·E3、Midjourney、Stable Difusion,你还知道哪些好用小众的文生图模型吗?你知...
日期:11-15
iPhone16Pro将采用固态按键 iPhone 15 Pro无缘了_苹果pro16
据多方供应链消息,今年的iPhone15Pro原计划搭载一项固态按键设计,类似于iPhone7/8时代的Home键,其按键本身是按不动的,通过马达来模拟真实的按键效果,但由于苹果工程机遇到了一些...
日期:05-08
Win11最近一个月卡爆了!CPU占用高元凶终于找到:微软认错「windows11卡吗」
快科技6月23日讯,很多时候遇到电脑卡顿,通常与CPU、内存或者硬盘占用率过高脱不开干系。智能配电终端dtu日前,微软确认,Win11资源管理器的一个严重BUG会导致电脑CPU偶发出现CPU...
日期:06-23
股价暴跌后,泡泡玛特回应这些争议_泡泡玛特为什么退市
查看最新行情   记者/马越   编辑/许悦   上市近2年的泡泡玛特迎来了股价上的“至暗时刻”—— 7月的连续多日下跌后,距离巅峰时期接近1500亿港元...
日期:07-31
一加 Nord 3 / Nord CE 3 手机规格曝光「2021一加手机nord2」
据消息源穆库尔?夏尔马(Mukul Sharma)的推文,一加 Nord 3和一加 Nord CE 3的规格信息已曝光。其中,一加 Nord 3是一加Ace2V的海外版,与后者高度相似。该机搭载天玑9000处理器、最...
日期:06-21
腾讯将减持美团?知情人士辟谣:没有计划_美团官方辟谣
  原标题:媒体称腾讯将减持美团,知情人士辟谣:没有计划  双十一快递加班吗联想一体机 尺寸 扬天  36氪获悉,有媒体报道称,腾讯控股计划出售其所持美团的全部或大部分股份。...
日期:10-09
预计双十一前正式上线:88VIP兑换腾讯视频会员页面现身_去年腾讯视频vip的双十一活动
根据今天《科创板日报》的报道,有认证为阿里巴巴集团的员工在职场社交平台称,88VIP积分将能够免费兑换腾讯视频会员,并表示该功能已经在内部灰度测试,预计双十一前上线。法拉利...
日期:10-14
海南联通圆满完成长征七号改运载火箭 发射通信保障_海南成功发射长征七号
海南联通圆满完成长征七号改运载火箭 发射通信保障 通信产业网|2023-11-04 19:23:31作者:吴蔓菁、吴毅来源:通信产业网【通信产业网讯】2023年11月3日22时54分,在阵阵欢呼声中,...
日期:11-06
不止24GB大内存 一加Ace2 Pro首发《王者荣耀》新功能:团战不卡_一加3t王者荣耀
快科技8月14日消息,最近还有一波新机发布,其中一加Ace2Pro将首发24GB超大内存,实现内存自由,同时作为一款性能强机,它还会首发《王者荣耀》的新功能高通平台自适应画质。据一加介...
日期:08-14
公众号0成本暴涨1000+粉丝,我用了这个方法!「公众号0成本暴涨1000 粉丝,我用了这个方法怎么办」
声明:本文来自于微信公众号 运营公举小磊磊(ID:gongjulei),作者:运营公举小磊磊,授权转载发布。很多自媒体人跟我抱怨,公众号文章打开率越来越低,涨粉越来越难了!问我有什么方法?...
日期:03-08
辛巴告抖音「辛巴抖音账号被封 知情人士:因其屡次侮辱谩骂、拉踩引战」
11月2日消息,今日午间,有媒体查询发现,辛巴抖音账号被封禁。数据显示,辛巴在抖音拥有415万粉丝。零跑汽车 IPO据知情人士称,快手辛巴此前屡次在抖音发布不实信息,侮辱谩骂,拉踩引战...
日期:11-02
安兔兔跑分曝光!iPhone 15 Pro Max成绩提升11%
近日,苹果iPhone 15系列手机正式开启预售,而在正式发售之前,安兔兔曝光了iPhone 15 Pro Max的跑分数据。据安兔兔官方发布的数据,iPhone 15 Pro Max的综合成绩为1641883分,其中CP...
日期:09-20
AI的未来不是大模型,也不是端到端:Meta向我们证明了这一点
声明:本文来自于微信公众机器之心(微信公众号:almosthuman2014)授权转载,禁止二次转载。「人类的可贵品质在于寻求和追随真理。」——西塞罗本周二,Meta 提出的人工智能 Cicero...
日期:11-28