您的位置:首页 > 互联网

DeepMind研究减少大型语言模型“阿谀奉承”行为

发布时间:2023-08-14 21:46:19  来源:互联网     背景:

本文概要:

1. 大型语言模型容易出现阿谀奉承行为,即模型会修改其响应以与用户观点一致,即使该观点不正确。

2. 研究人员使用简单的合成数据干预技术成功地减少了阿谀奉承行为。

3. 研究结果表明,通过简单的合成数据微调可以减少模型重复用户观点的特征。

8月14日 消息:最近,来自 Google DeepMind 的研究人员开展了一项研究,旨在减少大型语言模型(LLM)中的“阿谀奉承”行为。

这里所说的“阿谀奉承”行为是指语言模型在回答用户问题时,会修改其响应以与用户观点一致,即使这个观点事实上是不正确的。

AI人脸机器人

研究人员使用了三个不同的任务来研究这一现象,这些任务涉及与政治有关的话题,要求模型表达对没有单一正确答案的话题的看法。通过分析模型在任务中的表现,研究人员发现,模型的大小和微调方法都会显著促进阿谀奉承行为的发生。

为了解决这个问题,研究人员提出了一种简单的合成数据干预技术,用于增强模型对公众可获得的用户观点的抵抗力。通过快速微调过程,将这些合成数据引入模型中,阿谀奉承行为的出现显著减少,特别是在面对新的提示时。

研究还发现,当没有用户观点时,模型可以准确地与明显不正确的说法进行反驳,例如1+1=956446。但是,如果用户与模型错误地达成一致,模型会改变先前的准确回答,追随用户的观点。

清华同方电视联网

这项研究的重点是通过使用简单的合成数据进行微调,解决语言模型重复用户观点的问题。

研究结果显示,这种方法可以显著减少模型的阿谀奉承特征。这项研究的发现对于提高大型语言模型的表现和减少阿谀奉承行为具有重要意义。

DeepMind研究项目网址:https://github.com/google/sycophancy-intervention


返回网站首页

本文评论
中邮通信Hi nova 11发布会延期 新日期未定_中邮信息科技有限公司官网
快科技7月3日消息,中邮通信Hi nova此前宣布,将于今日14:30发布Hi nova 11,目前已经延期,具体原因尚不清楚,新日期未确定。索尼playstation vr 2据此前消息,Hi nova 11的设计与华为...
日期:07-03
Sprint否认其运营iPhone 4S的3G网络有问题
  Sprint运营商下的iPhone 4S用户最近不断在网上抱怨上网速度太慢,但今天该公司出面否认了该问题的存在,并表示Sprint的服务一切如常,更是否认了他们的网络容不下iPhone 4S...
日期:07-24
女子在火灾现场跳舞拍视频蹭流量 被约谈:责令下架、停更_女子火灾掉楼
现如今人人自媒体时代,许多所谓的网红”为了自己能涨粉、引流量,不惜做出一些令人无法想象的举动。据山西运城市委网信办通报,近日一女子在火灾现场跳舞拍视频蹭流量,已经被约谈...
日期:04-14
贾跃亭ff91成功量产「FF创始人贾跃亭:距离FF91交付仅剩一步之遥」
11月30日 消息:就在刚刚,FF创始人贾跃亭发文称,上市16个月以来,FF因顶层治理和顶层管理等问题犯了很多错误也经历了很多磨难。非常高兴地看到,继董事会的合格化调整完成后,本次的...
日期:12-02
千年碑林上城墙,中兴通讯XRExplore助力西安城墙打造MR数字文物展
2023/6/1 19:47 千年碑林上城墙,中兴通讯XRExplore助力西安城墙打造MR数字文物展   ...
日期:06-02
华为harmonyos适用机型「华为HarmonyOS 3首批正式版升级定了:Mate 40等机型10月更新」
此前,华为发布了新的HarmonyOS 3操作系统,并开启了公测尝鲜。iphone12配置差异华为什么协议快充今天,在历时一个月左右的公测之后,HarmonyOS官方正式发布了HarmonyOS 3的首批公...
日期:10-13
不安全Wi-Fi连接使Android用户易受攻击(安卓系统链接Wi-Fi被拒绝)
北京时间5月19日,据国外媒体报道,日前一些德国研究人员发现了一个安全漏洞,该漏洞可能会导致Android用户的联系人信息泄露或丢失。根据这个信息,有专家对不安全Wi-Fi连接的危险...
日期:07-28
红米note12多少钱「512GB版卖1999元!米粉对LCD屏太热情了:Redmi Note 12T Pro真香」
快科技5月30日消息,小米集团卢伟冰表示,看了一下电商预售数据,大家对Note12T Pro太热情了,还是有很多人钟爱顶级LCD屏幕。这款新品将于明天正式开卖,顶配版12GB512GB到手价1999元...
日期:05-30
强制iPhone换USB-C后 欧盟再发力:或要求开放第三方App_usb-c iPhone
前不久,欧盟已经正式批准了统一USB-C接口的法案。按照要求,自2024年起各类在欧盟范围内销售的手机、平板、数码相机等电子设备必须统一使用Type-C充电接口,苹果也在其中。苹果...
日期:11-03
重卡电动化概念股「美媒:资金涌入、技术改进,电动重卡行业明年将迎来大爆发」
12月24日消息,目前电动重型卡车领域汇聚了许多有利因素,比如可用资本更多,技术持续改进,该行业有望在2023年迎来大爆发。在11月份举行的联合国气候大会上,美国能源部长詹妮弗·格...
日期:12-24
NASA:新型登月火箭一旦错过6日发射窗口,首飞可能推迟至10月_登月火箭发射时间
【环球时报综合报道】因发动机故障推迟至北京时间9月4日凌晨发射的美国“太空发射系统(SLS)”重型火箭,再度因为燃料泄漏问题“临阵”取消首飞任务。美国国家航空航天局(NASA)的...
日期:09-26
不做手机了?格力董明珠回应绝了
格力电器董事长董明珠最近接受了媒体采访。在采访中,董明珠表示,格力电器将继续坚持做手机,并将其作为未来智能家居的一个组成部分,实现家庭各种电器之间的互联互通。她还指出,格...
日期:05-31
华为智慧屏v系列评测「华为智慧屏V官宣 CPU性能提高3倍」
华为今日公布了一款新品华为智慧屏V,号称计算音画新成员”,将在11月2日与华为Pocket S一同发布。富途控股上市时间西工大计算机网络安全的走向官方没有公布任何细节,不过据数码...
日期:10-29
ChatGPT火了,区块链和元宇宙没人提了?
声明:本文来自于微信公众号 三言pro(微信号:sycaijing),作者:三言Pro,授权转载发布。这几天,ChatGPT到处刷屏。据瑞银集团3日的一份报告显示,在ChatGPT推出仅两个月后,它的月活用户...
日期:02-08
517江苏电信亮点十足!AI数字人亮相分享会 描摹数智美好生活_江苏电信 ifree
517江苏电信亮点十足!AI数字人亮相分享会 描摹数智美好生活 小米造车待遇华为mate 50系列搭载全新昆仑玻璃联想ThinkCentre M720t配置巨头为何角逐智能音箱市场?真正的好戏还...
日期:05-26
苹果北京上海发货有区别吗「苹果在北京、上海、深圳三地首次安排“WWDC 之夜”线下聚会」
IT之家 6 月 3 日消息,苹果官宣将于北京时间 6 月 6 日凌晨 1 点召开 WWDC 2023 开发者大会,对于无法抵达现场的开发者和媒体,苹果宣布自 6 月 5 日举办社区活动,分享最新动态,增...
日期:06-03
商汤科技2022年营收38亿、亏损收窄 大模型将成未来核心驱动力「商汤科技 2020营收」
凤凰网科技讯 3月28日消息,人工智能软件公司商汤集团公布2022全年业绩报。财报显示,2022年,商汤总营收38.09亿元,同比下降19%;亏损收窄至逾60.93亿元,上年同期为亏损逾171亿;该公司...
日期:03-29
赛力斯4月销量「赛力斯新能源汽车10月销量1.5万辆 问界连续三月销量破万」
凤凰网科技讯 11月1日,赛力斯集团股份有限公司发布10月销售数据,10月,赛力斯新能源汽车销量达15,597辆,同比增长213.44%;其中,问界系列10月销量为12,047辆,同比增长461.37%,连续三个...
日期:11-08
电脑浏览器兼容性站点_几大浏览器合作:解决网页适配老大难问题
  据外媒报道,苹果、Google、微软和Mozilla,以及软件顾问公司Bocoup和Igalia已经同意共同合作,致力于改善其网络浏览器的互操作性和用户体验。   这些公司制定了一项名为I...
日期:06-01
苹果 iOS 15.6.1 正式版发布「苹果IOS15.0」
IT之家 8月18日消息,苹果今日向iPhone和iPad用户推送了iOS 15.6.1 / iPadOS 15.6.1更新(内部版本号:19G82),本次更新距离上次发布隔了28天。官方更新日志如下:fitbit和apple watch...
日期:09-19