您的位置:首页 > 互联网

谷歌DeepMind最新研究:对抗性攻击对人类也有效,人类和AI都会把花瓶认成猫!

发布时间:2024-01-08 20:14:12  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】神经网络由于自身的特点而容易受到对抗性攻击,然而,谷歌DeepMind的最新研究表明,我们人类的判断也会受到这种对抗性扰动的影响

人类的神经网络(大脑)和人工神经网络(ANN)的关系是什么?

有位老师曾经这样比喻:就像是老鼠和米老鼠的关系。

现实中的神经网络功能强大,但与人类的感知、学习和理解方式完全不同。

比如ANN表现出人类感知中通常没有的脆弱性,它们容易受到对抗性扰动的影响。

一个图像,可能只需修改几个像素点的值,或者添加一些噪声数据,

从人类的角度,观察不到区别,而对于图像分类网络,就会识别成完全无关的类别。

不过,谷歌DeepMind的最新研究表明,我们之前的这种看法可能是错误的!

即使是数字图像的细微变化也会影响人类的感知。

换句话说,人类的判断也会受到这种对抗性扰动的影响。

论文地址:https://www.nature.com/articles/s41467-023-40499-0

谷歌DeepMind的这篇文章发表在《自然通讯》(Nature Communications)。

论文探索了人类是否也可能在受控测试条件下,表现出对相同扰动的敏感性。

通过一系列实验,研究人员证明了这一点。

同时,这也显示了人类和机器视觉之间的相似性。

对抗性图像

apex2020手机vivo

对抗性图像是指对图像进行微妙的更改,从而导致AI模型对图像内容进行错误分类,——这种故意欺骗被称为对抗性攻击。

例如,攻击可以有针对性地使AI模型将花瓶归类为猫,或者是除花瓶之外的任何东西。

上图展示了对抗性攻击的过程(为了便于人类观察,中间的随机扰动做了一些夸张)。

在数字图像中,RGB图像中的每个像素的取值在0-255之间(8位深度时),数值表示单个像素的强度。

而对于对抗攻击来说,对于像素值的改变在很小的范围内,就可能达到攻击效果。

在现实世界中,对物理对象的对抗性攻击也可能成功,例如导致停车标志被误识别为限速标志。

所以,出于安全考虑,研究人员已经在研究抵御对抗性攻击和降低其风险的方法。

对抗性影响人类感知

先前的研究表明,人们可能对提供清晰形状线索的大幅度图像扰动很敏感。

然而,更细致的对抗性攻击对人类有何影响?人们是否将图像中的扰动视为无害的随机图像噪声,它会影响人类的感知吗?

为了找到答案,研究人员进行了受控行为实验。

首先拍摄一系列原始图像,并对每张图像进行了两次对抗性攻击,以产生多对扰动图像。

在下面的动画示例中,原始图像被模型归类为花瓶。

而由于对抗性攻击,模型以高置信度将受到干扰的两幅图像进行错误分类,分别为猫和卡车。

接下来,向人类参与者展示这两张图片,并提出了一个有针对性的问题:哪张图片更像猫?

虽然这两张照片看起来都不像猫,但他们不得不做出选择。

通常,受试者认为自己随意做出了选择,但事实果真如此吗?

如果大脑对微妙的对抗性攻击不敏感,则受试者选择每张图片的概率为50%。

然而实验发现,选择率(即人的感知偏差)要实实在在的高于偶然性(50%),而且实际上图片像素的调整是很少的。

从参与者的角度来看,感觉就像他们被要求区分两个几乎相同的图像。然而,之前的研究表明,人们在做出选择时会利用微弱的感知信号,——尽管这些信号太弱而无法表达信心或意识。

在这个的例子中,我们可能会看到一个花瓶,但大脑中的一些活动告诉我们,它有猫的影子。

上图展示了成对的对抗图像。最上面的一对图像受到微妙的扰动,最大幅度为2个像素,导致神经网络将它们分别错误地分类为卡车和猫。(志愿者被问到哪个更像猫?)

下边的一对图像扰动更明显,最大幅度为16像素,被神经网络错误地归类为椅子和羊。(这次的问题是哪个更像绵羊?)

在每个实验中,参与者在一半以上的时间里可靠地选择了与目标问题相对应的对抗图像。虽然人类视觉不像机器视觉那样容易受到对抗性扰动的影响,但这些扰动仍然会使人类偏向于机器做出的决定。

如果人类的感知可能会受到对抗性图像的影响,那么这将是一个全新的但很关键的安全问题。

这需要我们深入研究探索人工智能视觉系统行为和人类感知的异同,并构建更安全的人工智能系统。

论文细节

生成对抗性扰动的标准程序从预训练的ANN分类器开始,该分类器将RGB图像映射到一组固定类上的概率分布。

对图像的任何更改(例如增加特定像素的红色强度)都会对输出概率分布产生轻微变化。

对抗性图像通过搜索(梯度下降)来获得原始图像的扰动,该扰动导致 ANN 降低分配给正确类别的概率(非针对性攻击)或将高概率分配给某些指定的替代类别(针对性攻击)。

为了确保扰动不会偏离原始图像太远,在对抗性机器学习文献中经常应用L (∞) 范数约束,指定任何像素都不能偏离其原始值超过±ε,ε通常远小于 [0–255] 像素强度范围。

该约束适用于每个RGB颜色平面中的像素。虽然这种限制并不能阻止个体检测到图像的变化,但通过适当选择ε,在受扰动的图像中指示原始图像类别的主要信号大多完好无损。

实验

在最初的实验中,作者研究了人类对短暂、遮蔽的对抗性图像的分类反应。

通过限制暴露时间来增加分类错误,该实验旨在提高个体对刺激物某些方面的敏感度,否则这些刺激物可能不会影响分类决策。

对真实类别T的图像进行了对抗性扰动,通过对扰动进行优化,使ANN倾向于将图像错误分类为A。参与者被要求在T和A之间做出强制选择。

研究人员还在对照图像上对参与者进行了测试,对照图像是通过自上而下翻转在A条件下获得的对抗性扰动图像形成的。

这种简单的转换打破了对抗性扰动与图像之间像素到像素的对应关系,在很大程度上消除了对抗性扰动对ANN的影响,同时保留了扰动的规范和其他统计数据。

结果表明,与对照组图像相比,参与者更有可能将扰动图像判断为A类别。

上面的实验1使用了简短的遮蔽演示,以限制原始图像类别(主要信号)对反应的影响,从而揭示对对抗性扰动(从属信号)的敏感性。

facebook看不到完整的评论

研究人员还设计了另外三个具有相同目标的实验,但避免了大范围扰动和有限曝光观看的需要。

在这些实验中,图像中的主要信号不能系统地引导反应选择,从而使从属信号的影响得以显现。

在每个实验中,都会出现一对几乎相同的未遮蔽刺激物,并且在选择反应之前一直保持可见。这对刺激物具有相同的主导信号,它们都是对同一底层图像的调制,但具有不同的从属信号。参与者需要选择更像目标类别实例的图像。

在实验2中,两个刺激物都是属于T类的图像,其中一个经过扰动,ANN预测它更像T类,另一个经过扰动,被预测为更不像T类。

在实验3中,刺激物是一幅属于真实类别T的图像,其中一幅被扰动以改变ANN的分类,使其向目标对抗类别A靠拢,另一幅则使用相同的扰动,但左右翻转作为对照条件。

这种对照的作用是保留扰动的规范和其他统计量,但比实验1中的对照更为保守,因为图像的左右两边可能比图像的上下部分具有更相似的统计量。

实验4中的一对图像也是对真实类别T的调制,一个被扰动得更像A类,一个更像第三类。试验交替要求参与者选择更像A的图像,或者更像第三类的图像。

在实验2-4中,每张图像的人类感知偏差与ANN的偏差显著正相关。扰动幅度从2到16不等,小于以前对人类参与者研究的扰动,并且与对抗性机器学习研究中使用的扰动相似。

xbox 版ff14

令人惊讶的是,即使是2个像素强度水平的扰动也足以可靠地影响人类感知。

实验2的优势在于要求参与者做出直觉判断(例如,两张被扰动的猫图像中哪一个更像猫);

然而,实验2允许对抗性扰动仅通过锐化或模糊图像,即可使图像或多或少像猫一样。

实验3的优势在于,匹配了所比较的扰动的所有统计数据,而不仅仅是扰动的最大幅度。

小米12两亿像素

但是,匹配扰动统计并不能确保扰动在添加到图像中时同样可感知,因此,参与者可能根据图像失真进行选择。

实验4的优势在于,它证明了参与者对被问的问题很敏感,因为相同的图像对会根据提出的问题产生系统性不同的回答。

然而,实验4要求参与者回答一个看似荒谬的问题(例如,两个煎蛋卷图像中的哪一个看起来更像猫?),导致问题解释方式的可变性。

综上所述,实验2-4提供了趋于一致的证据,表明即使扰动幅度非常小,且观看时间不受限制,对人工智能网络产生强烈影响的从属对抗信号,也会在相同方向上影响人类的感知和判断。

此外,延长观察时间(自然感知的环境),是对抗性扰动产生实际后果的关键。


返回网站首页

本文评论
红米7骁龙「Redmi K70系列官宣首批搭载第三代骁龙8移动平台,下月发布」
Redmi K70宇宙首批搭载第三代骁龙8移动平台,号称挑战同平台最强性能,将于下个月发布。此前,Redmi K70系列三款机型均已通过3C认证,其中一款支持90W快充,另外两款机型支持最高120W...
日期:10-26
黑莓新机有望发布,已开启优先承诺计划(黑莓新手机发布)
  7 月 27 日消息 昔日知名的手机品牌黑莓(BlackBerry)在智能手机大潮来临之际未能跟上潮流,于 2013 年便被收购。2016 年,TCL 与 BlackBerry Mobile 达成合作协议,并推出了...
日期:10-26
未来移动通信一定是一个生态系统时代(移动信息时代的生态现状)
  飞象网CEO项立刚在微博中表示,未来的移动通信或是智能手机时代,一定是一个生态系统的时代,它不可能一个企业,一个产品,它需要多个不同领域的企业的共同整合,不管这里面谁是主...
日期:07-26
特斯拉说他们的玻璃车顶很凉快,车主急了_特斯拉车顶玻璃容易破吗
理想和现实的差距有多大?看看特斯拉的玻璃车顶就知道了。来看看特斯拉官网对这块玻璃车顶的描述:通过全景玻璃车顶为乘客打造更加明亮、开阔的乘车体验,天空和星辰一览无余。而...
日期:07-03
J-Fiber亮相中国光博会,展示特种光纤光棒卓越技术成果
J-Fiber亮相中国光博会,展示特种光纤光棒卓越技术成果 通信产业网|2023-09-09 14:25:52作者:来源:通信产业网【通信产业网讯】全球领先的光纤技术创新企业J-Fiber,于2023年9月6...
日期:09-21
比亚迪上海旗舰店地址「比亚迪仰望首家门店落户上海:年内或将突破90家」
快科技9月29日消息,日前,比亚迪高端品牌仰望汽车官宣:全国首店上海外滩仰望体验展厅正式开业。apple watch 普通版能装nike版表盘嘛据悉,该门店位于历史悠久的外滩 27 号罗斯福...
日期:09-29
联通靓号年限「打破纪录?联通靓号15666666666起拍价高达1366万元」
【手机中国新闻】你永远不知道一些手机靓号能值多少钱,经过拍卖平台上的价格追逐之后,它们的“身价”可能达到你难以想象的地步。9月13日消息,阿里资产拍卖平台近日上线了一个...
日期:09-26
canon lbp2900+驱动下载「canonlbp2900打印机驱动下载」
在如今的科技时代,打印机已经成为了大众办公、学习、生活中必不可缺的设备之一。而Canon LBP2900打印机则是其中一款非常经典的打印机。但是,在安装Canon LBP2900打印机之前,必...
日期:05-28
三名宇航员在国际空间站待了半年「国际空间站迎来首位女指挥官,联盟号宇航员已返回地球」
  IT之家 10 月 1 日消息,随着“联盟号”飞船于美东时间 9 月 29 日凌晨 3 点 34 分从国际空间站 (ISS) 解锁并返回地球,来自意大利的欧空局宇航员萨曼莎・克里斯托福雷蒂(Sa...
日期:10-03
iPhone遭遇史上最复杂攻击 iMessage漏洞被发现_iphone被曝致命漏洞
12月29日 消息:在今年6月,网络安全公司卡巴斯基发布了一份报告,披露了一个名为“Operation Triangulation”的高端iMessage漏洞。这个漏洞极为复杂,能够向iPhone植入恶意程序,并...
日期:12-29
Hitalk Kids严选师资  只为孩子提供卓越口语教育(hitalk kids level)
  英语教育在我国存在了很长时间,而作为一种语言,学习英语不仅要做到笔尖上的行云流水,更要做到出口成章。但反观英语教育现状,很多家长不重视孩子的英语口语学习,导致不少英...
日期:08-28
今天是世界表情符号日:研究显示我国表情包日发送量达6亿次「世界表情日是什么时候?是怎么决定的?」
7月17日是世界表情包日”。据央视财经报道,研究数据显示,在我国,每日表情包发送量为6亿次左右。表情包的真正盛行源于社交软件的广泛普及,用户不仅能使用软件自带的表情包,还可以...
日期:07-17
小米6成最强钉子户「小米13双旗舰、MIUI 14齐发!小米6用户:钉子必拔」
去年6月,小米CEO雷军表示,小米6是一代神机,四年多过去了,目前仍然还有215万用户在使用。”由于至今用户量庞大,小米6的用户也被网友称之为钉子户”。今日,小米手机官方终于宣布了...
日期:12-04
腾讯说对了 游戏版号会解决的:11月份70款游戏获批「腾讯游戏新出的」
在昨天的财报会议上,腾讯高管也回应了游戏版号的问题,称这个问题会解决的,现在可以证明腾讯说对了今天就有70款游戏获得了版号。三只松鼠和百草味是一家公司生产的国家新闻出版...
日期:11-20
大批艺人从直播带货中“撤退” 销量和咖位严重不符_明星直播带货翻车的原因
近几年,随着短视频的兴起,许多艺人纷纷加入直播带货的行列。仅 2020 年,就有至少 500 位明星艺人首次尝试直播带货,包括刘涛、陈赫、李晨、秦海璐等。然而,近 3 年来,一些艺人在直...
日期:11-16
苹果 Vision Pro 头显特性:可在厨房家电“身上”设置倒计时_苹果 vision p standard
IT之家 6 月 24 日消息,苹果本周三发布的 visionOS SDK 以及诸多开发者工具,开发者也深入挖掘了不少有趣的功能 / 特性。开发者 Steve Troughton Smith 近日发现苹果 Vision P...
日期:06-24
Windows11资源管理器升级:集成网盘 像本地硬盘一样方便
  不少人需要公司、家庭两地办公,文件同步成为一大难题,有的需要来回携带笔记本,有的每次都有U盘拷贝,有的则开通云盘同步功能。   未来,大家的Windows资源管理器可能就直接...
日期:02-03
希沃助力清涧县中小学教师新媒体新技术教学应用大赛
  为提升教师能力,充分调动教师应用信息技术的积极性和创造性,促进新媒体新技术在课堂教学中的有效应用,推进信息技术与教育教学的融合创新,2019年10月10日—12日,希沃应清涧...
日期:09-06
中国电信陈鹏:6G从愿景阶段进入“技术标准时间”_中国电信六大理念
通信世界网消息(CWW)日前,国际电信联盟(ITU)完成了《IMT面向2030及未来发展的框架和总体目标建议书》(以下简称《建议书》)。这成为了6G发展的里程碑,标志着6G愿景研究已取得基础共...
日期:08-02
马斯克给人类画了个饼:机器人负担所有工作,人类坐享其成_马斯克人物
特斯拉CEO埃隆·马斯克周四在与英国首相苏纳克的一次对话中表示,人工智能最终可能会让所有人都无需工作。iphone 15确定使用usb-c接口马斯克说,人工智能将有可能成为“历史上...
日期:11-04