您的位置:首页 > 媒体评论

神经网络预测_重温三十年前对于NN的批判:神经网络无法实现可解释AI

发布时间:2022-09-29 02:01:09  来源:互联网     背景:

作者 | Walid S. Saba

编译 | Antonio

编辑 | 陈彩娴

1

可解释AI (XAI)

随着深度神经网络 (DNN) 用于决定贷款批准、工作申请、批准法院保释等与人们利益息息相关或者一些生死攸关的决定(例如在高速公路上突然停车),去解释这些决定,而不仅仅是产生一个预测分数,是至关重要的。

推荐几款投影仪

可解释人工智能 (XAI) 的研究最近集中在反事实(counterfactual)例子的概念上。这个想法很简单:首先制造一些有预期输出的反事实样例并输入到原来的网络中;然后,读取隐层单元解释为什么网络会产生一些其他输出。更正式地说:

“返回分数 p 是因为变量 V 具有与其关联的值 (v1, v2, ...)。如果 V 具有值 (v′1 , v′2 , ...),并且所有其他变量保持不变, 分数 p' 会被返回。”

下面则是更加具体的一个例子:

“你被拒绝贷款是因为你的年收入是 30,000 英镑。如果你的收入是 45,000 英镑,你就会获得贷款。”

然而,一篇由Browne 和 Swift提出的论文(以下简称 B&W)最近表明,反事实示例只是稍微更有意义的对抗性示例,这些示例是通过对输入执行小的且不可观察的扰动而产生的,从而导致网络对它们进行错误分类具有很高的自信度。

此外,反事实的例子「解释」了一些特征应该是什么才能得到正确的预测,但「没有打开黑匣子」;也就是说,没有解释算法是如何工作的。文章继续争辩说,反事实的例子并没有为可解释性提供解决方案,并且「没有语义就没有解释」。

事实上,文章甚至提出了更强有力的建议:

1)我们要么找到一种方法来提取假定存在于网络隐藏层中的语义,要么

2)承认我们失败。

而Walid S. Saba本人则对(1)持悲观态度,换句话说他遗憾地承认我们的失败,以下是他的理由。

2

Fodor 和 Pylyshyn 的「鬼魂」

虽然大众完全同意B&W的观点,即“没有语义就没有解释”,但解释深度神经网络中隐藏层表示的语义为深度学习系统产生令人满意的解释的希望之所以不能够实现,作者认为,原因正是出自三十多年前Fodor 和 Pylyshyn中概述的原因。

图注:Jerry A. Fodor(左)和 Zenon Pylyshyn

Walid S. Saba接着论证到:在解释问题出在哪里之前,我们需要注意到,纯粹的外延模型(例如神经网络)不能对系统性(systematicity)和组合性(compositionality)进行建模,因为它们不承认具有可再衍生的句法和相应语义的符号结构。

因此,神经网络中的表示并不是真正与任何可解释的事物相对应的“符号”——而是分布的、相关的和连续的数值,它们本身并不意味着任何可以在概念上解释的东西。

用更简单的术语来说,神经网络中的子符号表示本身并不指代人类在概念上可以理解的任何事物(隐藏单元本身不能代表任何形而上学意义的对象)。相反,它是一组隐藏单元,它们通常共同代表一些显着特征(例如,猫的胡须)。

但这正是神经网络无法实现可解释性的原因,即因为几个隐藏特征的组合是不可确定的——一旦组合完成(通过一些线性组合函数),单个单元就会丢失(我们将在下面展示)。

3

可解释性是“反向推理”

DNN无法逆向推理

作者讨论过为什么 Fodor 和 Pylyshyn 得出的结论是 NN 不能对系统性(因此是可解释的)推论进行建模[2]。

在符号系统中,有定义明确的组合语义函数,它们根据成分的意义计算复合词的意义。但是这种组合是可逆的——

也就是说,人们总是可以得到产生该输出的(输入)组件,并且正是因为在符号系统中,人们可以访问一种“句法结构”,这一结构含有如何组装组件的地图。而这在 NN 中都并非如此。一旦向量(张量)在 NN 中组合,它们的分解就无法确定(向量(包括标量)可以分解的方式是无限的!)

为了说明为什么这是问题的核心,让我们考虑一下 B&W 提出的在 DNN 中提取语义以实现可解释性的建议。B&W 的建议是遵循以下原则:

输入图像被标记为“建筑”,因为通常激活轮毂盖的隐藏神经元 41435 的激活值为 0.32。如果隐藏神经元 41435 的激活值为 0.87,则输入图像将被标记为“汽车”。

要了解为什么这不会导致可解释性,只需注意要求神经元 41435 的激活为 0.87 是不够的。为简单起见,假设神经元 41435 只有两个输入,x1 和 x2。我们现在所拥有的如下图 1 所示:

马斯克想火星建工厂

图注:拥有两个输入的单一神经元的输出为0.87

现在假设我们的激活函数 f 是流行的 ReLU 函数,那么可以产生 z = 0.87 的输出。这意味着对于下表中显示的 x1、x2、w1 和 w2 的值,可以得到 0.87 的输出。

表注:多种输入方式都可以产生0.87的数值

查看上表,很容易看出 x1、x2、w1 和 w2 的线性组合有无数个,它们会产生输出 0.87。这里的重点是 NN 中的组合性是不可逆的,因此无法从任何神经元或任何神经元集合中捕获有意义的语义。

为了与 B&W 的口号“没有语义就没有解释”保持一致,我们声明永远无法从 NN 获得任何解释。简而言之,没有组合性就没有语义,没有语义就没有解释,DNN 无法对组合性进行建模。这可以形式化如下:

1. 没有语义就没有解释[1]2. 没有可逆的组合性就没有语义[2]

3. DNN 中的组合性是不可逆的[2]

苹果14pro什么时候可以预定

=> DNN 无法解释(没有 XAI)

华为Mate50发布会

结束。

顺便说一句,DNN 中的组合性是不可逆的这一事实除了无法产生可解释的预测之外还有其他后果,尤其是在需要更高层次推理的领域,如自然语言理解 (NLU)。

特别是,这样的系统确实无法解释一个孩子如何仅从 ( ) 之类的模板中学习如何解释无限数量的句子,因为“约翰”、“邻居女孩”、 “总是穿着T恤来这里的男孩”等都是的可能实例化,还有“经典摇滚”、“成名”、“玛丽的奶奶”、“在海滩上跑步”、 等都是 的所有可能的实例。

因为这样的系统没有“记忆”,而且它们的组成不能颠倒,理论上它们需要无数个例子来学习这个简单的结构。

最后,作者强调,三十多年前Fodor 和 Pylyshyn [2]提出了对 NN 作为认知架构的批评——他们展示了为什么 NN 不能对系统性、生产力和组合性进行建模,所有这些都是谈论任何“语义”所必须的——而这一令人信服的批评从未得到完美的回答。

神经网络预测

随着解决人工智能可解释性问题的需求变得至关重要,我们必须重新审视那篇经典论文,因为它显示了将统计模式识别等同于人工智能进步的局限性。


返回网站首页

本文评论
台湾为什么造不好电动车?「台湾骑电动车的人多吗」
7年前,马斯克为了炫耀自家工厂,略带几分不屑地踩了一脚富士康:“相比手机,汽车工业非常复杂,你总不能去找富士康这样的供应商,告诉他‘给我造辆车’。”马斯克怎么也没想到,自己的...
日期:11-11
HarmonyOS 3将支持一部手机调控两副耳机
  【ITBEAR科技资讯】7月26日消息,有博主今天透露,HarmonyOS 3将能够使用一部手机同时支持两幅耳机,同时播放音乐,调整两个耳机的音量。科技传承与创新如何利用有道词典笔学...
日期:07-31
正面交锋20年后 伊利蒙牛押注不同的未来「伊利和蒙牛投资价值」
“邓超为什么不喝安慕希?”这可不是什么无厘头问题。《奔跑吧兄弟》火爆全国的时候,“安慕希”酸奶摆满了各个节目场景,Angelababy、李晨等明星常常拿起就喝,但只有邓超,只喝自己...
日期:08-25
iOS 16新功能曝光,iPhone 14 Pro系列或独享息屏显示功能
  【ITBEAR科技资讯】6月28日消息,根据最新消息,从iOS16 的新特性来看,苹果即将发布的iPhone 14 Pro系列新机或许将独享AOD息屏显示功能。一加9r正式官宣 或主打性价比 中关...
日期:07-10
直播带货未来展望_直播带货,未来堪忧?
图片来源@视觉中国文 | 王智远目前主播带货,算是带动消费最重要手段之一,原因在于,它能使商品更多暴露在人们视野中,并通过一系列可显性手段,刺激用户潜在需求,从而促进供给和供需...
日期:11-14
这张卖到12999元的RTX4090,性能到底有多夸张?_rtx3090性能相当于
咳咳,你们没猜错,万众期待的英伟达公版 RTX 4090,今天终于正式解禁、猛兽出笼了!事先声明嗷,今天就是单纯的评测、评测、评测,评论区不抽、不抽、不抽。这卡连我自己都没摸熟,你们...
日期:10-14
羊毛被 羽绒被 棉被_棉花被羽绒被羊毛被…什么被子最能温暖寒冬中的我?
渐渐入冬的夜晚,躺在床上,一句古诗弹幕般浮现在脑海里:布衾多年冷似铁,娇儿恶卧踏里裂。保暖的被子太重要了。问题是:你知道什么样的被子最保暖吗?在讲被子之前,有必要先说说保暖。...
日期:11-15
麒麟软件:“星光麒麟”首个版本与国产主流移动芯片完成适配全覆盖
  11 月 2 日消息,在 2022 年 9 月推出“星光麒麟万物智联操作系统”后,麒麟软件今日宣布,“星光麒麟”首个版本星光麒麟操作系统 1.0(StarKylin 1.0)与国产主流移动芯片完成...
日期:11-12
英特尔走下坡_英特尔进入“蛰伏期”
今年,各个行业的发展处境都不太好,大家都进入到寒冬。Strategy Analytics公布的最新数据显示,第三季度全球手机出货量同比下降9%,仅为2.97亿部。其中除了苹果取得6.4%的小幅增长...
日期:11-10
用一百张照片就能完成3D建模 这个免费的App有点东西「用照片做3d建模」
世超在上网冲浪刷 B 站的时候,意外刷到了影视飓风做过的一个项目:用 10000 张照片还原世界文化遗产。当时看完视频,不得不说看着这用 10000 张照片还原的河南洛阳老君山 3D 模...
日期:12-14
看了满屏“阳过”文学 打工人的心情仿佛在等待戈多
原标题:还没阳,我可能是天选打工人我们和几位还没阳的同事聊了聊最近的心路历程。《一个阳了的编辑部》《是的,XX编辑部也阳了……》《大家好,我们也阳了》《线下办公第一天,全公...
日期:12-15
进门就炒了领导层 收购推特后的马斯克要快乐了_马斯克发推特说市值
美国时间 10 月 26 号下午。嬉皮笑脸的马斯克,抱着一个大水槽,摇摇晃晃走进一座大楼。在他的右侧,是一个巨大的推特标志。毫无疑问,这是推特总部。紧接着,推特停盘,进入私有化。看...
日期:10-31
扒一扒,中国芯片产业都缺哪些人才?_制造芯片中国还缺什么
文 | 文 | MIR睿工业 前段时间看到央视采访深圳一位微电子公司的董事长称:“以前招一个人才,假设要 40 万,现在就要 120 万才能招聘到他们认为具有相同能力的人,大概整个行业...
日期:12-10
中美科技巨头死磕元宇宙「元宇宙第一股美国」
即使上半年饱受裁员、股价和市值暴跌、财富缩水等诸多负面新闻打击,扎克伯格和他一手打造的Meta还是在执着追求元宇宙梦。美国当地时间10月11日,Meta召开年度Connect大会,发布...
日期:10-14
好好的年轻人,为啥偏爱玩弄老相机?_超好用的变年轻相机,你还不知道?
作者 | 黄瓜汽水题图 | 渣渣郡CCD相机,在小红书一火就是大半年。曾经被称为电子垃圾的卡片机,这次让广大民间摄影师们跌了个踉跄——不管是玩徕卡的还是玩哈苏的,看完CCD爆火都...
日期:11-03
净亏损27亿 蔚来如何驶出弯道_蔚来总亏损
文| 王玄璇 编辑|马吉英经历了过去一年销量落后大盘的局面后,蔚来进入产品换代阶段,新一代产品能否将销量提升一个台阶,决定了蔚来能走多远。蔚来联合创始人、总裁秦力洪在8月底...
日期:09-10
科幻巨作三体_豆瓣9.0 这部年度科幻神作值得《三体》们学习
意识传云端g450笔记本配置烧脑硬科幻今天你可能错过的大新闻 极氪属于吉利汽车还是吉利集团...
日期:11-09
快手的品牌定位_品牌下一步在快手拼什么?
今年616大促期间,特步在超级品牌日中凭借一场女子产品线“半糖系列”新品造势营销活动,取得了6.7亿全网曝光、3911万销售额和近24万新增粉丝的成绩,但在一年前,刚刚进入快手的特...
日期:10-11
想实现飞檐走壁?你得有我这双脚_谁能飞檐走壁
每个少年都会有这样一个武侠梦——手持青锋,头戴斗笠,飞檐走壁,行侠仗义!而我们的现实生活中,还真有这么一位“大侠”,轻功过人,分分钟就能实现“上墙自由”。它就是我们今天的主角...
日期:10-17
端牢中国饭碗!我国科学家有了重要发现_科学家们希望能够全面揭示这一
“高产”与“早熟”,在传统的农业生产中是一组矛盾的词。因为实现高产的前提条件是要有一定的生物量,而一定的生物量,必须要有一定的生长周期,生长周期短,生物量小。所以,一般条件...
日期:10-29