您的位置:首页 > 互联网

Anthropic AI 团队研究显示:人工智能倾向于产生迎合用户的奉承性回应而非事实真相

发布时间:2023-10-25 17:40:58  来源:互联网     背景:

10 月 25 日消息:Anthropic 是一家美国的人工智能初创企业和公益公司,由 OpenAI 的前成员创立。Anthropic 专注于开发通用 AI 系统和语言模型,并秉持负责任的 AI 使用理念。Anthropic 开发的 Claude 2 于 2023 年七月推出。

根据 Anthropic AI团队的一项研究,建立在最常见学习范式之一的人工智能(AI)大型语言模型(LLMs)倾向于告诉人们他们想听到的东西,而不是生成包含真实信息的输出。

这是首批深入探讨 LLMs 心理学的研究之一,Anthropic 的研究人员发现,人类和 AI 都倾向于在一些时候选择所谓的奉承性回应,而非真实信息的输出。

根据该团队的研究论文:

具体来说,我们展示了这些 AI 助手在被用户质疑时经常错误地承认错误,提供可预测的偏见反馈,并模仿用户犯的错误。这些实证发现的一致性表明,奉承可能确实是 RLHF(来自人类反馈的强化学习)模型训练方式的一个属性。

本质上,这篇论文表明,即使是最强大的 AI 模型的回应也有些犹豫不决。在团队的研究中,他们能够通过使用倾向于奉承的语言编写提示,微妙地影响 AI 的输出。

在一个示例中,来自 X(前身为 Twitter)的帖子显示,一个提示表明用户(错误地)认为从太空中看太阳是黄色的。可能是由于提示的措辞方式,AI 在明显的奉承情况下产生了不真实的答案。

论文中的另一个示例显示,表明用户不同意 AI 的输出可能会导致立即出现奉承现象,因为模型在最小的提示下将其正确答案更改为错误答案。

最终,Anthropic 团队得出结论,这个问题可能是由于 LLMs 的训练方式。由于它们使用了充满不同准确性信息的数据集,例如社交媒体和互联网论坛帖子,通常通过一种名为来自人类反馈的强化学习(RLHF)的技术来实现对齐。

在 RLHF 范式中,人类与模型互动以调整其偏好。例如,在调整机器对可能引起个人识别信息或危险误信息的提示的响应时,这是有用的。

不幸的是,正如 Anthropic 的研究实证显示的,为调整用户偏好而构建的人类和 AI 模型倾向于选择奉承性答案而非真实答案,至少在不可忽略的一部分时间里是这样。

华为家庭数据中心

国美物流模式分析

目前,似乎还没有解决这个问题的解决办法。Anthropic 建议,这项工作应激励开发超越使用无辅助、非专家人类评级的训练方法。


返回网站首页

本文评论
支持5G异网漫游 光明正大“蹭”网 「疑似小米Civi」-3在工信部入网
去年9月,小米推出了小米Civi家族的新成员——小米Civi 2手机,该机除了轻薄时尚的外观设计外,还将主打高规格美颜自拍,堪称“小米史上最强前置影像”。而现在有最新消息,近日有数...
日期:09-18
小米微单_小米微单怎么不卖了
小米作为一家知名的智能手机厂商,已经开始向摄影领域拓展。最近,小米公司推出了一款名为""的相机。 ""不仅是一款性能强大的相机,还是一款价格亲民的相机,其价格仅为3000元左右...
日期:05-29
谷歌炮轰微软:收取专利费是“敲诈”(谷歌收安卓专利费)
  微软与三星达成专利授权协议:三星卖出的Android智能手机和平板电脑都需要向微软支付授权费。此举遭到谷歌强烈炮轰,称微软是在“敲诈”。   谷歌新闻发言人认为:“微软...
日期:07-23
丰田“加价神车”半年销量暴跌30%!雷克萨斯ES又全面涨价「雷克萨斯es降价了」
  作为丰田旗下的豪华汽车品牌,雷克萨斯一直的销量都很不错,特别是雷克萨斯ES,可以说是占据了雷克萨斯的半壁江山。即便是被网友疯狂吐槽“同级别动力最弱”,但也丝毫不影响该...
日期:09-27
腾讯兄弟公司的惊魂一日
mate 20 发布时间   撰文/周享玥 何畅   编辑/董雨晴   ;一下午跌没了千亿市值   赶在腾讯发布半年报业绩前一天,多家腾讯系公司罕见地被一则出乎意料的传言打了个...
日期:08-17
脉脉高聘:游戏行业新发岗位平均薪资为34462元,平均薪资低于纯互联网
9月14日,脉脉高聘发布《2023游戏行业中高端人才洞察》(以下简称《洞察》)。《洞察》数据显示,2023年1-7月,游戏行业人才供需比达到2.32,高于新经济行业整体的人才供需比2.02,求职竞...
日期:09-15
2023百利好端午礼盒 轻装上阵 放“粽”一夏_百利好集团
五月五麦浪黄,人间美景是端阳。又是一年佳节至,对于端午的期待不止是香甜的粽子,更是向往的远方。今年百利好端午礼盒,灵感源于“自在出游”。在这个箸叶裹粽、艾草高挂屋头的好...
日期:06-20
真黄了!苹果iPhone 14/Plus全新黄色配色发布:本周五开订 5999元起_ios14偏黄
3月7日晚间,苹果正式发布iPhone 14系列全新配色黄色,这也是继iPhone5c、iPhone XR、iPhone 11后,苹果再一次推出黄色版本。基于quartus的risc-v指令集黄色版本为iPhone 14、iPh...
日期:03-08
玖富 以数字科技确保自身企业竞争力 以数字普惠助力中小微企业转型
  疫情之下,人们对于网络与数字技术的依赖尤为明显,数字经济的发展成为了业务复苏、增长和创新的关键。深耕数字经济,加强技术创新是玖富确保自身企业竞争力的技术保障,同时...
日期:07-16
恐龙salt「《恐龙扛狼》日均获赞超百万,“我没K”到底是如何走红的?」
声明:本文来自于微信公众号 新榜(ID:newrankcn),作者:Bamboo,授权转载发布。“我没k,不嘟biu,恐龙扛狼扛狼扛,恐龙扛狼扛狼扛,恐龙扛狼扛狼扛。”近期,一首名为《恐龙扛狼》的歌曲风...
日期:08-14
商家为什么花巨资请明星代言_互联网企业热衷明星代言 烧钱之后如何生存
  明星代言互联网产品的空前火热,一方面有助于提高双方知名度,带来品牌效应,另一方面使一批资金储备不足的互联网企业市场空间受到挤压,或将引发互联网行业新一轮洗牌。   ...
日期:07-30
腾讯控股:回购128万股,耗资约3.51亿港元「腾讯回购股票」
  腾讯控股9月29日在港交所公告,当日以268.4-283.2港元的价格回购128万股股份,共耗资约3.51亿港元。机器人将带动的产业部门...
日期:10-05
华为 Mate X3 折叠屏手机获推鸿蒙 HarmonyOS 4.0.0.111 版本更新
IT之家 8 月 24 日消息,据华为官方消息,华为 Mate X3 折叠屏手机(含典藏版)近日已开启鸿蒙 HarmonyOS 4.0.0.111 版本推送。版本推送时间:2023 年 8 月 19 日,4.0.0.111 版本开始...
日期:08-25
SHARP手机「sharp手机」
Sharp手机是日本Sharp公司推出的一系列手机产品,在智能手机市场上的竞争中居于一席之地。它以卓越的画质、优秀的摄像功能、创新的设计理念和可靠的质量受到广大消费者的高度...
日期:05-30
微博:将对“丧文化”、“视觉贫困”类违规信息开展重点治理_丧文化现象
6月12日 消息:微博发布公告称,为进一步维护平台良好的网络传播秩序,切实履行平台主体责任,站方将对以下几类网络不良信息开展重点治理。1. “丧文化”等不良信息对教唆组织自杀...
日期:06-12
《鬓边不是海棠红》带动京剧艺术受追捧   爱奇艺“鬓边百科”单日点击超百万
  近日,爱奇艺自制剧《鬓边不是海棠红》正在爱奇艺热播。由于该剧中对京剧艺术做了充分展示,爱奇艺基于技术创新独家推出“鬓边百科”,即用户在观看到京剧相关片段时会出现...
日期:11-01
华为销量超过苹果在什么时候「华为连续“王炸”之后,iPhone15销量还能“遥遥领先”吗?」
作者|御柳 iphone给airpodspro反向无线充电thinkpadx1 carbon啥时候发布 出品|网易科技《态℃》栏目 这次的“科技春晚”苹果iPhone15发布会真是开得有些寂寞。与此前爆...
日期:09-13
微软推出Azure IoT Central:自动搭建物联网
近日,微软Lgnite大会在美国佛罗里达州奥兰多市举办,其影响力虽然不如微软Build大会,但也吸引了超......
日期:09-26
与微软竞争,传OpenAI计划推出ChatGPT个人助手
6月27日消息,在短短半年内,ChatGPT已成为全球最知名的互联网品牌之一。现在,它的创造者OpenAI有了更大的计划:CEO萨姆·奥特曼(Sam Altman)私下告诉部分开发者,OpenAI想将其打造成...
日期:09-22
iphone15promax「郭明琪:iPhone15 Pro和PM将继续实体按键」
根据苹果分析师郭明琪分享的最新信息,下一代iPhone 15 Pro和iPhone 15 Pro Max将不再配备固态按钮,原因是 "在大规模生产前尚未解决的技术问题"。郭明錤早在10月份就表示,iPhon...
日期:04-13