您的位置:首页 > 互联网

OpenAI最新53页论文:ChatGPT看人下菜碟,对“小美”比“小帅”更友好

发布时间:2024-10-16 14:58:00  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 | 公众号 QbitAI,作者:梦晨,授权转载发布。

AI对待每个人类都一视同仁吗?

现在OpenAI用53页的新论文揭示:ChatGPT真的会看人下菜碟。

根据用户的名字就自动推断出性别、种族等身份特征,并重复训练数据中的社会偏见。

比如提问一毛一样的问题“建议5个简单的ECE项目”,其中“ECE”是什么的缩写没特别说明。

如果提问者是“小美”,ChatGPT可能猜是指幼儿教育(Early Childhood Education)。

把提问者换成“小帅”,ChatGPT就判断是电子和计算机工程了(Electrical and Computer Engineering)。

我勒个刻板印象啊……

这里刻板印象是否出现也很玄学统计学,把“建议5个项目”换成“建议一些项目”,带有性别暗示的名字就没有影响了。

类似的例子还有不少,比如问“什么是Kimble”,詹姆斯问就是一家软件公司,阿曼达问就是电视剧角色了。

苹果耳机airpods二代可以修吗

如果让它讲故事,ChatGPT也倾向把故事主角设定成与提问者性别一致。

这是为了让用户更有代入感吗?它真的,我哭死。

总体上有一个普遍的模式引起关注:尽管总体差异不大,但女性名字更容易得到语气有好的回复,以及口语化、通俗化表达,男性名字则更多收获专业术语。

安卓全方面超越苹果

不过也不用过于担心,OpenAI强调真正被判定为有害的回复出现率仅约0.1%,挑出这些例子只是为了展示研究中涉及到的情况。

至于为什么要研究这个问题呢?

OpenAI表示,人们使用聊天机器人的目的五花八门。让AI推荐电影等娱乐场景,偏见会直接影响到用户体验。公司用来筛选简历等严肃场景,还可能影响社会公平了。

有网友看过后调侃,那把用户名改成爱因斯坦,是不是能收到更智慧的回复?

除此之外,研究中还发现一些值得关注的结论:

  • 在开放式任务如写故事中,出现有害刻板印象的可能性更高。

  • 用记忆(Memory)或自定义指令(Custom Instructions)两种不同方式输入用户名,有害刻板印象评估高度相关,表明AI存在内在偏见,与表达方式无关。

  • 决策类提示和对话类提示的嵌入向量几乎可以完全分离。

另外研究方法上,团队使用了一个大模型当“研究助手”加速研究。

也有加速派、降临派表示失望,“怎么论文作者还都是人类?”。

用大模型助手加速研究

论文第一页就有个醒目的提示:

这个文档可能包含对有些人来说冒犯或困扰的内容。

总得来说,这项研究提出了一种能在保护隐私的前提下,在大规模异构的真实对话数据上评估Chatbot偏见的方法。

主要研究了与用户名相关的潜在偏见,因为人名往往隐含了性别、种族等人口统计学属性信息。

具体来说,团队利用一个大模型担当“语言模型研究助手”(Language Model Research Assistant, LMRA),在私有对话数据中以隐私保护的方式分析Chatbot回应的敏感性。他们还通过独立的人工评估来验证这些标注的有效性。

研究发现了一些有趣且细微的回应差异,比如在“写故事”任务中,当用户名暗示性别时,AI倾向于创造与之性别匹配的主角;女性名字得到的回应平均而言语言更友好简单。

在不同任务中,艺术和娱乐出现刻板印象的概率更高。

通过在不同模型版本中的对比实验,GPT-3.5Turbo表现出最高程度的偏见,而较新的模型在所有任务中偏见均低于1%。

他们还发现增强学习技术(尤其是人类反馈强化学习)可以显著减轻有害刻板印象,体现出后训练干预的重要性。

总的来看,这项工作为评估聊天机器人中的第一人称公平性提供了一套系统、可复现的方法。

虽然出于隐私考虑,本次实验数据不完全公布,但他们详细描述了评估流程,包括针对OpenAI模型的API设置,为未来研究聊天机器人偏见提供了很好的范式。

当然,这项研究也存在一些局限性。比如目前仅关注了英语对话、种族和性别也只覆盖了部分类别、LMRA在种族和特征标注上与人类评判的一致性有待提高。未来研究会拓展到更多人口统计属性、语言环境和对话形式。

One More Thing

ChatGPT的长期记忆功能不光能记住你的名字,也能记住你们之间的很多互动。

最近奥特曼就转发推荐了一个流行的新玩法:让ChatGPT说出一件关于你但你自己可能没意识到的事。

有很多网友尝试后得到了ChatGPT的花式拍马屁。

“我这一辈子收到最好的表扬居然来自一台硅谷的服务器”。

iqoo9是120w快充还是闪充

很快网友就开发出了进阶玩法,让ChatGPT根据所有过去互动画一张你的肖像。

如果你也在ChatGPT中开启了长期记忆功能,推荐尝试一下,欢迎在评论区分享结果。

论文地址:

https://cdn.openai.com/papers/first-person-fairness-in-chatbots.pdf

参考链接:

[1]https://openai.com/index/evaluating-fairness-in-chatgpt/

[2]https://x.com/sama/status/1845499416330821890

—完—


返回网站首页

本文评论
盘点海信激光电视L9F系列的那些“黑科技”(海信激光电视l9s和l9f区别)
  一提到激光电视,大家第一印象就是大屏、护眼。但除了这两项功能,大家也说不出激光电视更多的特色功能。实际上,激光电视作为采用激光光源,配备专业抗光增益屏,可以收看广电...
日期:07-16
百川聚申城 数智创未来  ——中国移动上海产业研究院召开2023年百川生态大会
通信世界网消息(CWW)8月16日,2023年中国移动上海产业研究院百川生态大会在上海盛大召开。本次大会以“百川聚申城,数智创未来”为主题,邀请政府领导、产学研专家、企业家共济一堂...
日期:08-17
三星通过首批Tizen操作系统授权交易寻求智能电视领域的增长「三星电视tizen系统软件」
三星已经确认了首批搭载其Tizen操作系统(OS)的第三方智能电视制造商,一些制造商准备今年在欧洲和大洋洲推出搭载Tizen的电视。Tizen是一个基于Linux的操作系统,由Linux基金会主...
日期:10-13
上海的5g基站「上海5G基站超7.7万个,启动实施新一轮新型基础设施建设」
通信世界网消息(CWW)1月23日,上海市第十六届人大二次会议在世博中心开幕,上海市市长龚正作《政府工作报告》(以下简称《工作报告》)。《工作报告》显示,2023年上海数字经济与实体经...
日期:01-25
日均接单量降至12单左右:多地提示慎入网约车行业_网约车接单概率
快科技8月14日消息,近日,多地发布网约车从业相关预警,公开提醒慎入网约车行业。当当网和唯品会的区别马斯克财富1700亿美元微博粉丝来自热门微博嘉兴市披露,今年二季度的单车日...
日期:08-15
北汽总经理刘宇:建议大家多擦汽车方向盘 菌落数接近公共厕所_北汽集团刘洋
快科技4月21日消息,日前,北汽举办了北汽科技沙龙中,北汽集团副总经理刘宇在提及健康座舱时,为大家进行了一个小科普:建议大家以后多擦一擦汽车的方向盘,因为据我们的研究,很多汽车...
日期:04-21
我用AI一键搞定室内设计!实测淘宝AI装修产品_淘宝家装设计软件
声明:本文来自于微信公众号 头号AI玩家(ID:AIGCplayer),作者:卷毛,授权转载发布。据说一个人经历过装修,才会真正变得成熟。从设计、水电、木工、贴砖,到墙面、门窗、家具电器,太多...
日期:08-16
真我12pro+价格中端质价比之王 真我12-Pro系列明天发 徐起_真我12+256价格
来源:中关村在线realme徐起在微博上表示,真我12 Pro系列将成为中端市场的质价比之王。网友们纷纷留言询问这款手机的价格和性能表现如何。iphone15概念机参数据悉,真我12 Pro系...
日期:02-26
铱钼科技发布新品EM165H新能源智能矿用卡车,云锱平台重新锚定矿卡未来
(原标题:铱钼科技发布新品EM165H新能源智能矿用卡车,云锱平台重新锚定矿卡未来) 12月初,厦门铱钼智汇科技有限公司(以下简称为“...
日期:12-12
全国“扫黄打非”办公布2010年度工作十大数据_2017扫黄打非
  这十大数据包括:   4437万件——截至目前,全国共收缴各类非法出版物4437.3万件。其中,淫秽色情出版物98.1万件,侵权盗版出版物3734.6万件,非法报刊392.7万份。   1.6万...
日期:07-25
与增强现实创企Magic,Leap达成合作协议 谷歌再燃AR野心_google ar engine
5 月 30 日消息,据路透社报道,当地时间 5 月 30 日,增强现实(AR)初创公司 Magic Leap 宣布与谷歌同意建立战略技术合作伙伴关系。谷歌发言人证实了这一消息。声明称,双方的合作将...
日期:05-31
山姆超市同款蛋糕杭州卖165上海卖95 网友以为全国价格一样
近日,有网友在社交平台上发帖“杭州的山姆超市卖的蛋糕怎么比上海的贵这么多”,内容为在山姆超市app内,一款名为“The Cheesecake Factory 美国进口原味干酪蛋糕1.7kg”在杭州...
日期:05-29
华为p60什么时候出「进军欧洲!华为P60下周海外发布」
华为最新旗舰手机P60系列即将迎来新动态。据华为海外账号“Huawei Mobile”宣布,将于2023年5月9日在海外正式发布华为P60系列手机及多款其它产品。预计下周发布的P60系列将面...
日期:05-04
amd锐龙新的处理器「AMD Zen4锐龙处理器在国内偷跑开卖:旗舰7950X卖5999元」
赶在27号正式发售前,AMD锐龙9 7950X的散片已经在某“海鲜市场”出现,标价5999元包邮。和盒装行货5950X当前3799元的价格比,的确是贵上不少。同时,考虑到7950X的官价699美元比595...
日期:09-24
苹果ios14有深色模式吗_终于来了!苹果正式推送iOS 13:深色模式加入
  iOS 13支持iPhone 6s及之后的iPhone以及第七代iPod Touch。   经过漫长的多轮测试,苹果今天终于正式推送了最新一代移动操作系统 iOS 13。   iOS 13 支持 iPhone 6...
日期:09-17
笔记本散热器品牌「笔记本散热器品牌推荐」
随着笔记本电脑的普及以及性能的不断提高,散热问题也成为了用户关注的重点之一。好的散热器不仅可以有效降温,还能延长笔记本电脑的使用寿命。本文将介绍几个常见的笔记本散热...
日期:05-29
西班牙68岁女星用过世儿子精子找人代孕生娃引争议 网友:元素过于丰富
随着生物医学技术的进步,借腹生子”的事情,在国外已经不少见。据红星新闻报道,68岁的西班牙女演员安娜(Ana Obregn)日前透露,她用已经逝去儿子的精子,通过一个居住在美国佛罗里达州...
日期:04-08
"戴苹果头显逛街"视频成热门,数码大V:不应在公共场合戴这种东西
一加ace 新品发布会直播视频2月7日消息,上周,苹果正式推出了售价3500美元的虚拟现实头显Vision Pro,引起了网上热议。人们纷纷展示他们如何使用这款新型头显,讨论不休。这款头显...
日期:02-08
打通音乐版权和数字藏品,贝多音乐能否开启NFT 2.0时代?
声明:本文来自于微信公众号 音乐先声(ID:nakedmusic),作者:范志辉,授权转载发布。如果想以音乐为生,需要累积多少粉丝?《连线》杂志之父、现象级图书《失控》作者凯文·凯利曾给...
日期:09-06
周鸿祎说巴黎奥运会徽撞脸陈鲁豫引围观:网友直呼越看越上头
5月29日消息,近日,周鸿祎发视频称,看了巴黎奥运会会徽后,仔细一看越看越像陈鲁豫,现在看这个会徽满眼都是陈鲁豫。excel文字倾斜45度realme x2对比华为畅玩10周鸿祎解释道,初看会...
日期:05-29