您的位置:首页 > 互联网

OpenAI最强竞品训练AI拆解LLM黑箱,意外窥见大模型灵魂

发布时间:2023-12-02 10:13:36  来源:互联网     背景:

Anthropic的模型可解释性团队,从大模型中看到了它的灵魂——一个可解释的更高级的模型。

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

为了拆开大模型的黑箱,Anthropic可解释性团队发表了一篇论文,讲述了他们通过训练一个新的模型去理解一个简单的模型的方法。

火箭发动机一次性

Anthropic发表的一项研究声称能够看到了人工智能的灵魂。它看起来像这样:

论文地址:https://transformer-circuits.pub/2023/monosemantic-features/index.html#phenomenology-fsa

在研究者看来,这个新的模型能准确地预测和理解原本模型中神经元的工作原理和组成机制。

Anthropic的可解释性团队最近宣布他们成功分解了一个模拟AI系统中的抽象高维特征空间。

创建一个可解释的AI去理解AI黑盒

研究人员首先训练了一个非常简单的512神经元AI来预测文本,然后训练了另一个名为自动编码器的AI来预测第一个AI的激活模式。

自动编码器被要求构建一组特征(对应更高维度AI中的神经元数量),并预测这些特征如何映射到真实AI中的神经元。

结果发现,尽管原始AI中的神经元本身不易理解,但是新的AI中的这些模拟神经元(也就是特征)是单义的,每特征都表示一个指定的概念或功能。

例如,特征#2663代表God这个概念。

激活它的训练语句中最强的一条来自Josephus的记录中当God降下暴雪时,他前往Sepphoris。

可以看到顶端的激活都是关于God的不同用法。

这个模拟神经元似乎是由一组真实神经元(包括407,182和259)组成的。

天猫双11活动满减

这些真实神经元本身与God没有太大关系,例如神经元407主要对非英语(尤其是重音拉丁字母)和非标准文本(如HTML标签)有响应。

但是在特征层面,一切都是井井有条的,当特征2663被激活时,它会增加文本中出现bless、forbid、damn或-zilla的概率。

这个AI并没有将God这个概念与怪兽名字中的God区分开来。这可能是因为这个简易AI没有足够的神经元资源来专门处理这个事。

但随着AI具备的特征数量增加,这种情况会发生改变:

在这棵树的底部,你可以看到当这个AI具有越来越多的特征时,它在数学术语中对the的理解是如何变化的。

首先,为什么会有一个数学术语中the的特定特征?这很可能是由于AI的预测需求——知道某些特定的the之后应该会跟随一些数学词汇,比如numerator或者cosine。

在研究人员训练的最小的那个只有512个特征的AI中,只有一个表示the的特征,而在具有16384个特征的最大AI中,这个特征已经分支出了一个表示机器学习中the的特征,一个表示复分析中the的特征,以及一个表示拓扑学和抽象代数中the的特征。

因此,如果能将系统升级到一个具有更多模拟神经元的AI,那表示God的特征很可能会分裂成两个——一个表示宗教中God的含义,另一个表示怪兽名字中God的含义。

后来,可能会有基督教中的God、犹太教中的God、哲学中的God等等。

研究小组对412组真实神经元和相应的模拟神经元进行了主观可解释性评估,发现模拟神经元的可解释性整体上比较好:

一些特征,比如表示God的特征,是用于特定概念的。

许多其他高度可解释的特征,包括一些最可解释的,是用于表示文本的格式,比如大写或小写字母、英语或其他字母表等。

这些特征有多常见呢?也就是说,如果你在相同的文本数据上训练两个不同的4096个特征的AI,它们会有大部分相同的4096个特征吗? 它们会都有某些代表God的特征吗?

或者第一个AI会将God和哥斯拉放在一起,而第二个AI会将它们分开?第二个AI是否就完全不会有表示God的特征,而是用那个空间存储一些第一个AI不可能理解的其他概念?

研究小组进行了测试,发现他们的两个AI模型是非常相似的!

平均而言,如果第一个模型中有一个特征,第二个模型中最相似的特征会有0.72的中值相关性。

看到了AI的灵魂

后续的工作将是什么呢?

今年五月,OpenAI试图让GPT-4(非常大)理解GPT-2(非常小)。他们让GPT-4检查了GPT-2的个307200个神经元,并报告它发现的内容。

GPT-4找到了一系列有趣的结果和一堆随机废话,因为他们还没有掌握将真实神经元投射到模拟神经元并分析模拟神经元的技巧。

尽管结果效果不明显,但这确实是非常雄心勃勃的尝试。

与Anthropic可解释性文章中的这个AI不同,GPT-2是一个真实的(尽管非常小)AI,曾经也给大众留下了深刻印象。

但是研究的最终目的是要能够解释主流的AI系统。

Anthropic的可解释性团队承认他们还没有做到这一点,主要基于以下几个原因:

首先,扩大自动编码器的规模是一个很困难的事情。为了解释GPT-4(或Anthropic的等效系统Claude)这样的系统,你需要一个差不多同样大小的解释器AI。

但是训练这样规模的AI需要巨大的算力和资金支持。

其次,解释的可扩展性也是一个问题。

即使我们找到了所有关于God、哥斯拉以及其他一切的模拟神经元,并画出它们之间如何相连的巨大关系图。

研究人员任然需要回答一些更复杂的问题,解决这些问题需要涉及成百上千万的特征和连接的复杂交互。

所以需要一些自动化的流程,也就是某种更大规模的让GPT-4告诉我们GPT-2在做什么。

最后,所有这些对理解人类大脑有什么启发?

人类也使用神经网络进行推理和处理概念。

人类大脑中有很多神经元,这一点和GPT-4是一样的。

人类获得的数据也非常稀疏——有很多概念(如乌贼)在日常生活中很少出现。

我们是否也在模拟一个更大的大脑?

目前这还是一个非常新的研究领域,但已经有一些初步的发现,表明人类视觉皮层中的神经元确实以某种超定位的方式编码特征,与AI模型中观察到的模式相似。

参考资料:

https://transformer-circuits.pub/2023/monosemantic-features/index.html#phenomenology-fsa


返回网站首页

本文评论
爱奇艺修改会员投屏限制后:优酷腾讯尚未跟进 默不作声_爱奇艺vip限制投屏怎么破
在经过一段时间的舆论侵袭,以及遭遇老粉起诉之后,爱奇艺投屏限制终于妥协。官方日前已经正式宣布新规定:为2023年2月20日仍处于订阅状态的爱奇艺黄金VIP会员,恢复720P和1080P清...
日期:03-01
ARM大变脸 要对高通“赶尽杀绝”:不给授权开发CPU_高通和arm
和NVIDIA的联姻失败后,ARM公司似乎正考虑大幅调整自己的经营方式。日前,高通在反诉ARM的文件中提到,后者酝酿在2024年后(2025年起)不再给半导体公司颁发完整的IP授权,而是直接给OE...
日期:10-29
海底捞回应取消半份菜 个别门店试点统一菜品规格_海底捞半份菜品是半价吗
近日,海底捞因在西安、北京等部分门店试点调整份量和价格而引起关注。有消费者通过发帖表示,在点餐时这些门店不再提供“半份”和“整份”的选项。该消息于11月15日晚上引起微...
日期:11-17
大厂“新贵”下场造芯、转型to B 业绩如何验证?
财联社|新消费日报8月11日讯(记者 李丹昱)字节跳动宣布自研芯片后,再次掀起互联网大厂们“造芯”热。8月10日,快手(01024.HK)推出自研SoC芯片SL200,已进入内测阶段。与字节跳动围绕...
日期:08-12
腾讯最近新出了什么「腾讯旧牌新发」
声明:本文来自微信公众号“新莓daybreak”(ID:new-daybreak),作者:李欢,3,授权转载发布。商业竞争中,入局早晚从来不是预测成功的准则。那些占据主流地位的核心产品,往往不是最先出...
日期:01-04
微信表情搜索在哪「微信宣布上线表情搜索、定闹钟等实用功能」
11月6日 消息:今日午间,微信官方发布文章,介绍了一系列新功能。微信上的扣费服务关闭了怎么重新开启?其中,安卓和iOS新版本中均可使用的独立发送按钮功能。这一新功能将使微信...
日期:11-07
广汽三菱销量如何?「停产7个月,单月销量仅300余辆,广汽三菱进入退市倒计时?」
裁员风波之后,已停产7个月的广汽三菱又传出新消息。日前,据日经新闻报道,三菱汽车决定停止在中国生产汽车,主要原因是电动汽车的普及和中国本土品牌崛起使其在华销量持续低迷。...
日期:10-09
环迅支付同交通银行将陆续开展金融服务合作_交通银行开通金融服务
  据专业分析机构的观点,目前金融领域成为各家第三方支付的必争之地,作为市场支付清算主体的银行和非金融支付机构由于有着共同的资源整合诉求,也愿意加紧合作步伐。日前有...
日期:07-24
《新天龙八部》手游计划年内上线 腾讯游戏发布18款游戏新品
【】5月15日消息,今日晚间,腾讯游戏分“东方奇境”、“次元想象”、“平行时空”、“硬核热血”四个系列发布了35款产品及创新内容的最新动态,其中包括18款重磅游戏新品。东方...
日期:09-28
最低采用4GB RAM内存《查尔斯小火车》12月9日发售
据Steam平台显示,开放世界生存恐怖游戏《查尔斯小火车(Choo-Choo Charles)》将于12月9日发售。在游戏中,玩家要开着一辆旧火车在岛上前行,并随着时间的推进来升级它,玩家将用废料...
日期:10-09
高通最强芯!骁龙8 Gen3来了:多核成绩超越苹果A16_高通骁龙8核什么档次
快科技6月10日消息,博主数码闲聊站透露,高通骁龙8 Gen3 Geekbench 6单核成绩是2200分,多核成绩是7000分。相比之下,苹果A16 Geekbench 6单核成绩是2500分,多核成绩是6300分。对比...
日期:06-11
官宣!国产大飞机C919正式拿证:内部设计公开「c919国产大飞机照片」
根据央视、中国商飞的官方消息,中国民航局已经正式向中国商飞公司颁发了国产大飞机C919的型号合格证,为其交付并投入商业运营打开了最有决定性的绿灯!同时,C919项目团队代表也接...
日期:10-06
小米k70多少钱「消息称小米Redmi K70机型搭载骁龙8 Gen 2处理器」
IT之家 11 月 7 日消息,博主@数码闲聊站 透露,Redmi K70 标准版将搭载骁龙 8 Gen 2 处理器,Redmi K70 Pro 则为骁龙 8 Gen 3。IT之家此前报道,日前 Redmi K70 系列三款机型均已...
日期:11-07
为创新成长提速—阿里云创业者计划云栖大会专场活动圆满举行!
(原标题:为创新成长提速—阿里云创业者计划云栖大会专场活动圆满举行!) 以Create@AI Future Shapers为主题,“Create@”代表着前...
日期:11-06
照猫画虎反倒抢得上市先机 接下来人人网何处去?_照猫画虎等将来
  钟声一响,中国互联网重排座次。   美国时间5月3日早晨,刚刚敲完钟,陈一舟出现在大屏幕上,连线接受中国媒体记者采访。“刚刚敲完钟,有点累”,胖胖的陈一舟笑着,透着疲倦。...
日期:07-27
京东3C配件11.11真便宜 首周9.9元包邮商品让利百万件_京东3c备件库是干嘛的
10 月 31 日晚 8 点,京东百亿补贴日重磅开启!自 10 月 23 日晚 8 点现货开卖以来,随着海量低价好物、趋势新品持续释放,京东11. 11 迎来多轮爆发。随着3C数码产品的快速发展,如智...
日期:11-01
中国一家小公司打破西方垄断,降至白菜价,外媒:中国不讲武德
西方垄断多年的通信技术产品,日前被中国湖北小县城的一家工厂打破空白,价格急跌98.5%,降至白菜价,让西方企业无可奈何,他们又一项赚钱生意被中国制造抢走。oppo find x2主摄像头...
日期:10-27
变现经验 | 我开发了一个戒掉“手机依赖症”的APP 月入14万元「摆脱手机依赖症的app」
这是分享产品变现、开发者故事最新一期内容。“手机成瘾”已经成为当代很多人的通病,将很多时间浪费在玩手机上并影响了身心健康。国外开发者Martin Morávek (马丁 · 莫拉维...
日期:11-06
创业者如何在红海中找到出路?真我手机用五年给出答案
作者:正风 来源:正和岛(ID:zhenghedao)最近几年,“卷”愈发成为各行各业的一个关键字。查莉成长日记第一季与企业家们交流时,一个很深的感触是,几乎所有人都在感慨,现在不管做什么,只...
日期:09-04
联想a830「联想a830怎么刷机」
联想A830是一款智能手机,采用5.5英寸全高清大屏幕和高通四核处理器,配备13MP像素主摄像头和5MP像素前置摄像头,运行安卓4.2.2系统。它的外观简洁大方,许多用户喜欢这种风格。在...
日期:05-29