您的位置:首页 > 媒体评论

美国抄中国算借鉴?中国团队“CVPR剽窃案”控诉无果 IBM被判无罪

发布时间:2022-08-20 01:03:51  来源:互联网     背景:

此前,IBM被指巧妙地「借鉴」了中国团队研究成果的CVPR中稿论文,近日,IEEE定案——不构成抄袭。

窃idea不算偷?好家伙,真是从未见过如此厚颜无耻之人。

今年6月,曝出了一个大瓜: 来自中国的研究团队发现,自己去年参加ICDAR竞赛的idea,竟然被IBM重新包装了一番,拿去投中了今年的CVPR。

随后,中国团队列出详实证据,举报IBM苏黎世研究院抄袭。接着,IBM发文坚称自己就是没抄。

近日,IEEE驳回了抄袭指控,判IBM「无罪」。

来龙去脉

时间回到2021年4月,中国的研究团队参加了IBM承办的ICDAR竞赛,取得了第二名。

划重点:IBM承办。

中国团队的这篇论文,在2021年6月被上传至arXiv,代码也一并进行了开源。

而2022年3月2日,IBM苏黎世研究院就发布了TableFormer,论文投中了 CVPR 2022。

起初,中国团队的Xianbiao Qi还不知道自己团队的idea被剽窃了,是多名学者看了IBM的论文后,觉得IBM的论文与Qi团队的研究有太多相似之处,纷纷来告诉他,他才知道。

Qi向CVPR怒写举报信,和IBM在线battle。

而就在8月2日,事情有了最新的进展。 IBM表示,经内部审查后,IEEE驳回了有关抄袭的指控。

对此,一位业内人士解释称:「IEEE基本上不会处理这些在文字上没有明显抄袭的案件。一方面,IEEE的编辑、秘书不是技术专家, 他们在审核的时候也只是看看文字抄没抄。另一方面,在这次的事件中,IEEE也没有邀请外部专家进行审查。」

「所以,只要抄袭者自己不认,而且没留下什么证据(不抄图,不抄字)。出版社是不会处理的。」

双方相继发文回应

回到「抄袭案」本身,在团队的一波举证之后,很快就在Reddit上发酵了起来。

几天后,来自IBM苏黎世研究院的作者,于6月30日发表了一篇回应文章,题为「对有关TableFormer论文指责的回应」。

文章称,IBM的研究人员从未剽窃过任何人的工作。这些指责是没有根据的,只要简单地比较一下这两篇论文就可以轻松驳斥。

随后,中国团队也在7月4日对IBM的回应文章,进行了回应。

接下来,我们就来具体看一看双方的对阵陈词。

不过在此之前,我们先介绍一下牛津大学关于「剽窃」(Plagiarism)的标准定义:

在没有充分承认的情况下将他人的作品或想法复制或转述到自己的作品中。所有已发表和未发表的材料,无论是手稿、印刷品还是电子形式,都属于这一定义的范围。「共谋」(Collusion)是另一种形式的剽窃,涉及学生或其他个人在作品中未经授权的合作。

(内容有删减,建议感兴趣的读者查阅原文,以及两篇相关的论文。)

1 我们没有抄袭idea

我们在2019年就提出了「双解码器」的方法,而TableMaster的工作在2021年才发表。

EDD4的公共代码包含了边界框回归的想法,这比TableMaster的代码库和论文要早。在定量分析部分,被称为「EDD+BBox」。

TableFormer的网络架构与TableMASTER-mmocr并不一样。TableMASTER-mmocr使用的是双Transformer解码器,以及文本线检测(基于PSENET)。但TableFormer使用的是单一的Transformer解码器,其输出结果首先用于注意力网络,然后与DETR头一起预测边界框。

TableMaster团队回应:原理一样,且参考文献里压根没提的方法,怎么实现的?

首先,我们并没有说双解码器的方法是我们最先引入的。

其次,我们的关键创新之一,是将表结构识别制定为联合边界框回归和token分类问题。而奇怪的是,TableFormer也使用了完全相同的方法。

您所谓的EDD,仅仅使用了一个单阶段(one-stage)的方法来直接估计表格(包括结构和内容),因此,当表变得复杂时,就必定会遇到问题。此外,在EDD论文中,也找不到任何与「边界框回归」、「回归」、「ℓ1损失」、「ℓ2损失」的相关术语。

事实上,在EDD的代码链接中,定义的只是一个无效的函数,并且该代码没有用于任何损失计算、训练和推理。该代码在默认情况下是禁用的。

IBM声称自己的方法是由DETR起发的。而DETR的两个关键创新是:a) 引入了一组可学习的查询;b) 引入了一个基于集合的全局损失。我们想知道:您到底用了哪一个?

说实话,TableMaster和TableFormerdou都是基于Transformer的,而不是DETR。

2 我们没有抄袭模型

我们使用原始PDF的内容。

我们没有用到TableFormer的「文本行检测」或「文本行识别」。事实上,我们根本不需要这个步骤,因为我们没有用到任何OCR。

我们用的是同事开发的原始PDF,来创建PubTabNet数据集。

我们用的是同事在2018年发表的方法,来从PDF中提取内容。

TableMaster团队回应:别人是看图像,自己直接读原始数据,您识别了个寂寞?

标准的管线是检测文本行并识别文本行的内容。

IBM声称可以通过一个PDF分析器来提取文本行的基准真相。那么,表格识别的意义是什么?

此外,IBM提供给公众的数据是「.PNG」图像,然后IBM又称自己用的是一个PDF解析器直接从数字PDF文件(合成的)中提取基准真相的内容。对你们来说,学术研究的公平性又是什么?

3 我们没有抄袭可视化实现

使用边界框来可视化检测是计算机视觉中的一项标准技术。

在TableMaster的文章之前的许多论文,都是用边界框来可视化表格中的检测的。其中一个例子就是IBM在2020年所做的工作。

我们的可视化是用Javascript/HTML代码制作的,它具有独特的视觉效果,简化了不同阶段预测的比较过程。

TableMaster团队回应:视觉效果像素级相似,但论文却一眼都没看?

TableFormer的视觉效果与TableMaster的视觉效果非常相似。考虑到TableFormer和我们的TableMaster之间有如此多的共同点或相似点,我们很难相信TableFormer没有参考TableMaster的成果。

4 我们没有抄袭预处理方法

我们的数据准备阶段的一些步骤,是TableMaster的工作中没有的。例如,引入了一个生成缺失边界框的程序。

视频长于10分钟怎么发微信好友

在论文中,我们详细解释了使用512个token的理由。

HTML分类token不是由TableMaster的工作所定义的,而是IBM在EDD在2019年首次描述的。

甚至TableMaster的截图也显示了,两篇的工作的不同,因为我们使用了「未折叠」的token(「<td>」, 「</td>」),而他们使用的是「折叠」的token(「<td,/td>」)。

TableMaster团队回应:被自己办的竞赛方案吊打,您这是重新发明了SOTA?

既然IBM是用「未折叠」的token(单个,未合并的token)代替了我们合并的token,那我们就对PubTabNet数据集统计了一下。使用未合并的token序列中,有大约3.9%的表的序列长度超过512。这意味着性能上限应该低于96.1%,甚至在TEDS指数中,性能上限应该低于97%,又怎么能得到96.75%的结果?

我们在图1中展示了相关的数据,其中(c)是竞赛报告中的结果(比赛中的前9名成绩),(a)和(b)是TableFormer论文中的图表。

可以看出,(b)中表的2在性能评估的设置上并不公平。具体来说,(c)中表4所有结果都是针对整个表的内容进行评估的,包括表的结构和内容;而(b)中表2的TableFormer和其他结果,除了Davar-Lab,都是针对表的结构进行评估的。把它们混在一个表中,是对性能的比较是一种误导。

此外,(a)中表4在最下面一行(红框)所呈现出的性能,甚至不能击败(c)表4里的任何一种方法。竞赛中最差的结果也达到了94.84%,比TableFormer的93.6%要高。

所以IBM声称,自己明显优于且超过了5%的SOTA,就非常有趣了!请问,你对「SOTA」的定义是什么?

5 我们没有抄袭后处理方法

TableFormer直接从PDF文档中提取文本,它没有使用任何OCR。因此,我们模型的输出是不同的,使用的后处理方法也不同。

TableFormer的后处理管线比TableMaster的工作更复杂。

在推理过程中对自回归方法进行缓存,是大家都知道的方法。它已经由开源神经机器翻译(OpenNMT)实现,并在这篇文章中进行了描述。

TableMaster团队回应:把3个点拆成了9个,就是更复杂的创新了?

后处理本身是一个独立的阶段。它不依赖于是否使用文本检测和识别方法的结果,或直接提取PDF单元的结果。

后处理管线是我们在TableMaster中首先提出的,为我们提出的多阶段方法服务。

我们引入了三个复杂的规则,IBM则把这三个规则分解为九个琐碎的点,然而这九个点却都可以归入这三个规则中的一个。这就是「更复杂」了?

对于内存缓存推理,我们已经指出是受到XLNet的启发,而且很早就应用在OCR社区中了。

鉴于以上提到的许多事实,以及表格识别是OCR中一个非常具体和非常小的子领域,我们真的很难相信这个所谓的声明。

6 我们没有混淆视听

我们并不知道TableMaster的工作。甚至在论文的审查过程中,也没人提到过有这么一篇TableMaster的论文。

正如之前所说,我们是在同事的工作基础上进行的,这些工作比TableMaster要早。

在向我们的同事群发电子邮件,以及在Reddit上发表指责的帖子之前,TableMaster团队并没有联系我们。如果TableMaster在公开指责之前联系的话,那么我们会乐意证明我们的观点,并引用TableMaster的工作,比较各种方法。

我们愿意与TableMaster进行讨论,以进一步澄清上述所有问题,并证明我们的工作没有抄袭甚至没有受到TableMaster的启发。

我们要求撤回对抄袭的指控,并向我们道歉。

如果TableMaster团队还不相信,我们不介意他们联系CVPR。我们在代码(git历史)和文档方面有大量的证据,可以证明这些指控完全没有根据,是错误的。

TableMaster团队回应:群众的眼睛是雪亮的!

我们认为受众,即相关领域的专家,可以自己做出判断:

a)TableFormer的作者是否知道我们以前的工作;

b)TableFormer是建立在我们的TableMaster的基础上,还是建立在他们同事的EDD的基础上。

这是一个「学术诚信」事件,而不是一个「引用」上的纠纷。我们公开指责不是因为我们想被引用,而是因为我们被故意抄袭。

我们已经将抄袭行为提交给CVPR社区和IEEE。我们希望他们能成立一个道德委员会,并邀请一些OCR或表格识别领域的专家来调查和评估这一事件。

同时,我们也希望IEEE能够敦促今后的CV或AI会议对剽窃或学术不端行为做出明确的定义。

孰是孰非,大家心中自有定论。


返回网站首页

本文评论
没有四轮的印度电动车,为何它敢强硬拒绝特斯拉?_印度有电动车吗
印度的电动车凤凰网科技讯 北京时间9月5日消息,在中国、美国等国家,豪华车买家都在抢购特斯拉和其他售价超过6万美元(约合40万元)的电动汽车,即便是相对便宜的车型售价也超过2....
日期:09-06
关于瑞幸咖啡的新闻的看法_35个月超过瑞幸,这家咖啡有股“韭菜味儿”
今年的咖啡赛道格外热闹,前有老品牌跨界联名,后有新品牌不断诞生。最近,T97咖啡直播间里的大嘴妹靠着喊麦成为带货界新晋红人。比大嘴妹更出圈的是该品牌的老板李潇,他曾扬言T97...
日期:11-14
豆瓣9.0 这部年度科幻神作值得《三体》们学习_科幻小说三体评价
曲面屏手机华为mate 20prohtc m9评测意识传云端烧脑硬科幻今天你可能错过的大新闻...
日期:11-05
App国产_国产App最烦人的操作 又卷土重来了
坏了,恶心人的骚操作又回来了。说起手机广告,大家应该都很熟悉了,这几乎是国产应用生态下的一大特色。首先是国内的厂商们,会给自家的安卓定制UI增加一些系统App和广告。为了不...
日期:11-13
岂单止于快!盘点近年手机快充闪充发展史「手机快充未来的发展」
近些年来,随着手机性能的不断提升,以及人们生活对手机依赖性的增强,对快充的需求也与日俱增。2022年7月19日,iQOO发布了iQOO10Pro,这是第一款突破200W功率快充的手机,从最初的5V1A...
日期:10-24
迪士尼“宫变”内幕
一个月前的迪士尼人事剧变震惊四座,如今越来越多的内幕故事浮上水面。71岁的罗伯特·艾格(Robert Iger)重回迪士尼CEO之位,其亲自挑选的继任者鲍勃·查佩克(Bob Chapek)出局,这本身...
日期:12-21
快手:在短剧的黄金时代 建立新秩序_快手系列短剧
短剧正在迎来自己的黄金时代。2022年12月11日,属于短剧盛会的金剧奖在湖州举办。除了从业者之外,曾风靡热搜的短剧主人公一只璐、圻夏夏也都出现在这里。盛典进行过程中,快手短...
日期:12-18
专克量子计算机的超级密码 被10年前的老爷机干碎了
最近美国科研圈估计很头大。就在上个月美国国家标准与技术研究所( NIST )结束了一项为期 6 年的国际竞赛,目的是寻找对抗量子计算机的加密算法。之所以,有这么个竞赛,实在是加密...
日期:09-10
CMU朱俊彦团队推出首个AI自动匹配排名系统
原标题:AI 生成模型五花八门,谁好谁坏?CMU 朱俊彦团队推出首个自动匹配排名系统作者 | 李梅编辑 | 陈彩娴最近的生成式 AI 可谓十分火爆,新出的预训练图像生成模型多到让人目不...
日期:10-11
把警告当耳边风 马斯克被爆强推付费认证导致推特失败_马斯克推特账户
凤凰网科技讯 北京时间11月15日消息,据科技新闻网站Platformer报道,就在埃隆·马斯克(Elon Musk)准备推出售价8美元的蓝V付费认证服务Twitter Blue之前,推特内部团队已经警告他...
日期:11-27
“老虎”没肉吃 “狮子”没水喝「老虎和狮子吃肉」
摄影:IT时报 沈毅斌一边是双11线上电商促销活动如火如荼,而另一边,老牌家电零售企业国美、苏宁却一片寂静。打破这场寂静的不是销量,而是国美欠薪和苏宁亏损。10月28日,国美电器...
日期:11-16
“老虎”没肉吃 “狮子”没水喝_狮子老虎吃不吃食肉动物
摄影:IT时报 沈毅斌一边是双11线上电商促销活动如火如荼,而另一边,老牌家电零售企业国美、苏宁却一片寂静。打破这场寂静的不是销量,而是国美欠薪和苏宁亏损。10月28日,国美电器...
日期:11-24
开的不是车是飞机_会飞的汽车,你敢坐吗?
汽车要起飞了近日,由英国皇家航空学会中国(上海)代表处主办的AAMIC未来空中交通国际论坛上,沃飞长空科技有限公司公布了其自研的5座飞行汽车TF-2研究进展,并宣布该飞行汽车预计于...
日期:09-15
高科技电池_电子科大高材生突破固态电池 3分钟充满 获融资3000万
原标题:电子科大高材生突破固态电池:能量密度5倍于刀片电池,3分钟充满,已获融资3000万哈佛大学华人教授搞了个新型固态电池,成果已发表在Nature杂志上——充放电循环高达1万次,最...
日期:09-27
激光雷达的冬天静悄悄「激光雷达的激光」
自动驾驶的寒风从Robotaxi吹到了激光雷达。一周前,全球首家激光雷达上市公司Velodyne宣布与另一激光雷达初创Ouster合并,行业为之震撼。Ouster的创始人出自另一知名激光雷达公...
日期:11-28
谈谈芯片制裁「如何看待美国芯片制裁」
作者:曾航这几天因为美国新一轮对中国的科技制裁,导致A股半导体和科技板块出现暴跌,一时间各种消息满天飞,产业界人心惶惶。这次的制裁和打击力度是空前的,已经有很多文章展开分...
日期:10-14
新加坡首富们在渡劫「新加坡亿万富翁」
文 | 好看商业,作者|周一围,编辑|安心在最新福布斯新加坡排行榜上,迈瑞医疗创始人李西廷以156亿美元身家蝉联首富,财富值与去年同期比基本“腰斩”。前首富Sea创始人李小冬身家只...
日期:09-28
HarmonyOS 3将支持一部手机调控两副耳机
  【ITBEAR科技资讯】7月26日消息,有博主今天透露,HarmonyOS 3将能够使用一部手机同时支持两幅耳机,同时播放音乐,调整两个耳机的音量。三星s21是指纹解锁吗黑鲨触屏调节8寸w...
日期:07-31
iPhone 14暴跌 苹果错误估计了用户对“改变”的重视_iPhone更新错误14
原标题:iPhone 14暴跌,苹果错误的估计了用户对于“改变”的重视程度iPhone 14的普通版,可能今年存在感最低的苹果手机。近日,有报道称iPhone 14和iPhone 14 Plus (以下简称 iPhon...
日期:10-21
一场线上演唱会“三点五亿人在线观看” 是良好开端_线上演唱会第一人
原标题:“三点五亿人在线观看” 是良好开端上周,一场3.5亿人在线观看的演唱会震动全网,创造了线上演唱会流量新巅峰。不过,除了“顶流艺人”“打情怀牌”等讨论之外,更值得关注的...
日期:09-11