您的位置:首页 > 互联网

OpenAI 最新“神”操作:让 GPT-4 去解释 GPT-2 的行为!

发布时间:2023-05-11 10:50:53  来源:互联网     背景:

声明:本文来自于微信公众号 CSDN(ID:CSDNnews),作者:CSDN,授权转载发布。

由 ChatGPT 掀起的这场 AI 革命,令人们感慨神奇的同时,也不禁发出疑问:AI 究竟是怎么做到这一切的?

此前,即便是专业的数据科学家,都难以解释大模型(LLM)运作的背后。而最近,OpenAI 似乎做到了——本周二,OpenAI 发布了其最新研究:让 GPT-4去试着解释 GPT-2的行为。

即:让一个 AI “黑盒”去解释另一个 AI “黑盒”。

图片

工作量太大,决定让 GPT-4去解释 GPT-2

OpenAI 之所以做这项研究的原因,在于近来人们对 AI 伦理与治理的担忧:“语言模型的能力越来越强,部署也越来越广泛,但我们对其内部工作方式的理解仍然非常有限。”

由于 AI 的“黑盒”性质,人们很难分辨大模型的输出结果是否采用了带有偏见性质的方法,也难以区分其正确性,因而“可解释性”是亟待重要的一个问题。

AI 的发展很大程度上是在模仿人类,因而大模型和人脑一样,也由神经元组成,它会观察文本规律进而影响到输出结果。所以想要研究 AI 的“可解释性”,理论上要先了解大模型的各个神经元在做什么。

按理来说,这本应由人类手动检查,来弄清神经元所代表的数据特征——参数量少还算可行,可对于如今动辄百亿、千亿级参数的神经网络,这个工作量显然过于“离谱”了。

于是,OpenAI 灵机一动:或许,可以用“魔法”打败“魔法”?

“我们用 GPT-4为大型语言模型中的神经元行为自动编写解释,并为这些解释打分。”而 GPT-4首次解释的对象是 GPT-2,一个 OpenAI 发布于4年前、神经元数量超过30万个的开源大模型。

让 GPT-4“解释” GPT-2的原理

具体来说,让 GPT-4“解释” GPT-2的过程,整体分为三个步骤。

(1)首先,让 GPT-4生成解释,即给出一个 GPT-2神经元,向 GPT-4展示相关的文本序列和激活情况,产生一个对其行为的解释。

图片

如上图所示,GPT-4对 GPT-2该神经元生成的解释为:与电影、人物和娱乐有关。

(二)其次,再次使用 GPT-4,模拟被解释的神经元会做什么。下图即 GPT-4生成的模拟内容。

图片

(三)最后,比较 GPT-4模拟神经元的结果与 GPT-2真实神经元的结果,根据匹配程度对 GPT-4的解释进行评分。在下图展示的示例中,GPT-4得分为0.34。

图片

通过这样的方法,OpenAI 共让 GPT-4解释了 GPT-2中的307200个神经元,其中大多数解释的得分很低,只有超过1000个神经元的解释得分高于0.8。

在官博中,OpenAI承认目前 GPT-4生成的解释并不完美,尤其在解释比 GPT-2规模更大的模型时,效果更是不佳:“可能是因为后面的 layer 更难解释。”

尽管绝大多数解释的得分不高,但 OpenAI 认为,“即使 GPT-4给出的解释比人类差,但也还有改进的余地”,未来通过 ML 技术可提高 GPT-4的解释能力,并提出了三种提高解释得分的方法:

一加6t和小米mix3哪个好

  • 对解释进行迭代,通过让 GPT-4想出可能的反例,根据其激活情况修改解释来提高分数。

  • 使用更大的模型来进行解释,平均得分也会上升。

  • 调整被解释模型的结构,用不同的激活函数训练模型。

值得一提的是,以上这些解释数据集、可视化工具以及代码,OpenAI 都已在 GitHub 上开源发布:“我们希望研究界能开发出新技术以生成更高分的解释,以及更好的工具来使用解释探索 GPT-2。”

(GitHub 地址:https://github.com/openai/automated-interpretability)

“再搞下去,AI 真的要觉醒了”

除此之外,OpenAI 还提到了目前他们采取的方法有很多局限性,未来需要一一攻克:

  • GPT-4给出的解释总是很简短,但神经元可能有着非常复杂的行为,不能简洁描述。

  • 当前的方法只解释了神经元的行为,并没有涉及下游影响,希望最终能自动化找到并解释能实现复杂行为的整个神经回路。

  • 只解释了神经元的行为,并没有解释产生这种行为的背后机制。

  • 整个过程都是相当密集的计算,算力消耗很大。

在博文的最后,OpenAI 展望道:“我们希望将我们最大的模型解释为一种在部署前后检测对齐和安全问题的方式。然而,在这些技术能够揭露不诚实等行为之前,我们还有很长的路要走。”

对于 OpenAI 的这个研究成果,今日在国内外各大技术平台也引起了广泛关注。

有人在意其得分不佳:“对 GPT-2的解释都不行,就更不知道 GPT-3和 GPT-4内部发生了什么,但这才是许多人更关注的答案。”有人感慨 AI 进化的方式愈发先进:“未来就是用 AI 完善 AI 模型,会加速进化。”也有人担心 AI 进化的未来:“再搞下去,AI 真的要觉醒了。”

华硕 zenbook 14

那么对此,你又有什么看法呢?

参考链接:

https://openai.com/research/language-models-can-explain-neurons-in-language-models

https://news.ycombinator.com/item?id=35877402


返回网站首页

本文评论
RIM加大在华推广力度 天音通信成其分销商
从今年开始,黑莓手机制造商RIM公司明显加快了在中国市场的扩张速度。记者昨天了解到,继分别与中国电信、中国联通建立深度合作后,RIM又与国内最大手机分销商之一的天音通信达...
日期:07-28
分类分级是推动平台互联互通的关键一步
  作者:陈兵;;责编:任绍敏  分类分级规范体系与新《反垄断法》结合,能提升平台经济反垄断监管效能。  8月1日起,新《反垄断法》正式施行,其在总则部分增加第9条规定“经营...
日期:10-24
美网民起诉垃圾邮件公司八年获利100万美元
  12月28日消息,据国外媒体报道,美国旧金山居民丹尼尔·博瑟姆(Daniel Balsam) 八年来借助起诉垃圾邮件公司获得了超过100万美元的收入。   博瑟姆八年前辞职考入法学院,...
日期:07-25
github开源代码查询「苹果在GitHub上的开源代码出现新的“realityOS”引用」
IT之家 3 月 16 日消息,苹果相关代码片段继续引用了“realityOS”,这可能与即将推出的 Apple AR / VR 设备有关。苹果代码中对 realityOS 的引用已经出现了几个月,甚至还申请了...
日期:03-16
Instagram创始人推出人工智能驱动的新闻应用Artifact
2月3日消息:Instagram 两位创始人日前宣布推出了一款新的新闻应用——Artifact。他们于2012年创立了照片分享应用Instagram,并以10亿美元的价格将其出售给了Facebook。Kevin...
日期:02-03
小红书日赚300「小红书新手,一个月赚了15万!」
声明:本文来自于微信公众号 摸鱼思维(ID:moyusw555),作者:摸鱼思维,授权转载发布。大家好,我是摸鱼掌柜。01、掌柜随笔其实,很多好建议都在细节里。B站有个90后在2年内从负债900万...
日期:04-14
点淘启动“短直双栖活动大赛”  TOP10达人创作者最多可拿2万元奖金
2月23日 消息:2月份,点淘启动多场“短直双栖活动大赛”,大赛针对主打品类赛道为珠宝玉石、美食、海外买手等品类商家和主播。大赛为不同品类设置了相应的主题赛道,包括“我为贵...
日期:02-25
评论:网剧不需要虚假“神话”「神话电视剧评价知乎」
  来源:工人日报小米发布会 小米平板5  中国的一部网剧能有多火?很多时候,它的播放量,全球人口数加起来都达不到。  比如,2017年,在某平台上,点击量破百亿的影视剧就达12个。...
日期:09-09
呼吁暂停 GPT-5 研发的马斯克,转身抢购 1 万个 GPU,为 Twitter 大模型做准备!
声明:本文来自于微信公众号CSDN(ID:CSDNnews)),整理 | 屠敏,授权转载发布。曾不止一次地支持 AI 威胁论、曾与 OpenAI 分道扬镳、曾怒批ChatGPT唤醒人工智能、曾联合发起公开信,...
日期:04-13
宋妍霏参加过跑男吗?_看宋妍霏PK跑男团元老 来614国美超级直播
  ​如果问对于中国综艺发展影响最大的节目是哪个?我想大家会毫不犹疑地选择《奔跑吧》。“跑男”的一大特点就是永远能抓住时下的热点,从联合国演讲、到黄河大合唱、从...
日期:07-14
续航再次登顶!iPhone14系列将配备史上最大电池,安卓手机很羡慕_iphone13 电池续航
随着智能手机的不断更新换代,手机上的各种配置都得到了升级,无论是屏幕、处理器、马达、拍照、系统等都得到了升级,随着手机功能的不断完善,随之而来的续航问题也随之而来,为了解...
日期:09-27
马斯克推特最新新闻「马斯克现在每天工作17小时!收购推特赔了2.9万亿」
中关村在线消息:11月5日,据相关爆料,马斯克自曝现在每天工作17小时。他的工作量从每周大约78小时增加到可能120个小时(平均每天 17小时)”。马斯克表示,“我认为一旦推特走上正轨,...
日期:11-06
寒假学玩不冲突,有了科大讯飞学习机,孩子学的用心玩的开心
  春节的钟声越来越近,孩子们满心期待的寒假也来临了,不少孩子认为自己辛苦学习一个学期总算到了放松畅玩的时候,殊不知寒假也是孩子们查缺补漏、提高成绩的黄金时期。如何...
日期:05-17
用雪糕棒做无人机「有创意!可食用无人机来了 用米糕做的机翼靠谱吗?」
11月18日 消息:试想一下,当你登山远足却遇到迷路、受伤又或者被困,在又累又饿的情况下会让人感觉相当绝望。一般等待救援队需要一段时间,在这期间你已经没有食物的情况下饥饿难...
日期:11-19
日本微软上四休三_微软日本试行一周三休制度:每周5均享带薪休假
  4月23日,据国内媒体报道,日本微软将会于今年8月试行一个月的“一周三休”政策,该政策不区分工作人员,全部办公室全部执行。   微软表示2019年8月份的所有星期五(2、9、16...
日期:09-21
12306买长途改签短途_出行更便捷!12306网站延长售票改签服务时间
  今日,据中国铁路官方公众号消息,为了更好地方便旅客购票,经过充分试验测试,在确保铁路12306网站(含手机客户端,下同)安全平稳运行前提下。   中国国家铁路集团有限公司决...
日期:12-09
槟榔口香糖兴起!公司5个月销售额超3000万元:号称“健康食品”「口味王槟榔一年的营业额」
今日消息,据新京报报道,槟榔衍生食品槟榔口香糖悄然兴起。经销商透露,一家以槟榔口香糖作为主推产品的公司,在过去5个月时间里,总销售额已达3000多万元。该经销商透露,这种槟榔口...
日期:10-16
上海大爷在美流浪32年回国 妻女拒见 不愿和他碰面「上海大妈回美国了没」
在纽约的一位老人刘大爷经过32年后决定回国,希望与他未见面的妻女团聚。在1990年前往美国工作的刘大爷留下了小自己10岁的妻子和年仅8岁的女儿在上海。由于失业,刘大爷流浪街...
日期:03-16
高价回收苹果6「大卖2.5亿部!苹果昔日神机iPhone 6二手收购价低至100元」
最近,苹果更新了其过时产品列表,史上最畅销的iPhone系列机型之一iPhone6退休”,正式退出历史舞台,该机型距停售已过去五年多时间。2019年,苹果生产线调整,iPhone6正式停产,5年之间,i...
日期:10-05
记者卧底曝光卫生乱象后 蓝蛙餐厅被调查「蓝蛙餐厅加盟费官网」
3月15日消息,微博话题记者卧底网红餐厅蓝蛙曝光后厨乱象”登上热搜引发热议。据生活这一刻报道,蓝蛙79家门店遍及全国20多个热门城市,悠唐广场店用烂水果制作沙拉,超过保质期的...
日期:03-15