您的位置:首页 > 互联网

Meta发布AI基准测试工具FACET 用于评估 AI 模型的“公平性”

发布时间:2023-09-01 15:52:42  来源:互联网     背景:

要点:

  • Meta发布了名为FACET的数据集,用于探测计算机视觉模型对某些“类别”人群的偏见。

  • FACET包含32000张图片,50000人的图像,标注了职业和活动“类别”,以及人口统计和身体特征。

  • FACET可用于测试模型在不同人口属性上的分类、检测、分割和定位任务的公平性。

9月1日 消息:Meta今天发布了一个新的AI基准测试,名为FACET,旨在评估在照片和视频中对人和物体进行分类和检测的AI模型的“公平性”。

FACET由32,000张包含50,000个人标签的图像组成,这些标签由人类注释者标注。除了与职业和活动相关的类别,如“篮球运动员”、“DJ”和“医生”,还包括人口统计和身体属性,使Meta能够对针对这些类别的偏见进行“深度”评估。

苏州公积金能提取吗现在

Meta在一篇与TechCrunch共享的博客文章中写道:“通过发布FACET,我们的目标是让研究人员和从业者能够进行类似的基准测试,以更好地理解他们自己的模型中存在的偏见,并监控所采取的缓解措施对这些偏见的影响。” “我们鼓励研究人员使用FACET来评估其他视觉和多模态任务的公平性。”

注:图片由midjourney生成

当然,探测计算机视觉算法偏见的基准测试并不是什么新鲜事。Meta自己几年前就发布过一个基准测试,用于揭示计算机视觉和音频机器学习模型中的年龄、性别和肤色歧视。许多研究已经对计算机视觉模型进行了评估,以确定它们是否存在针对某些人群的偏见。

telegtram官网

此外,事实上,Meta 在负责任的人工智能方面并没有最好的记录。去年年底,Meta不得不撤下一款AI演示,因为它编写了种族主义和不准确的科学文献。有报道称,该公司的AI伦理团队基本没有作用,而它发布的反AI偏见工具被形容为“完全不足够”。同时,学术界指责Meta加剧了其广告服务算法中的社会经济不平等,并在其自动审查系统中表现出对黑人用户的偏见。

但Meta声称FACET比之前所有的计算机视觉偏见基准测试都要深入——能够回答这样的问题:“当被感知的性别表现具有更多传统男性特征时,模型是否在将人们分类为滑板运动员方面做得更好?”以及“当头发卷曲程度与直发相比时,任何偏见都会放大吗?”

为了创建FACET,Meta让上述注释者为32,000张图像中的每张人物图像标注人口统计属性(例如图片中人物的感知性别表现和年龄组)、额外的身体属性(例如肤色、光线、纹身、头饰和眼镜、发型和面部毛发等)以及类别。他们将这些标签与其他来自Segment Anything1Billion的关于人、头发和服装的标签结合。Segment Anything1Billion是Meta设计的用于训练计算机视觉模型从图像中“分割”或隔离物体和动物的数据集。

Meta告诉我,FACET图像的来源是Segment Anything1Billion,而这些图像则从“照片提供商”处购买。但目前还不清楚图片中所描绘的人是否知道他们的图片将被用于这个目的。此外——至少在博客文章中——还不清楚Meta是如何招募注释者团队的,以及他们得到了多少工资。

从历史上看,甚至在今天,许多为AI培训和基准测试标注数据集的注释者来自发展中国家,收入远低于美国的最低工资标准。就在本周,《华盛顿邮报》报道,规模最大、融资最充足的注释公司之一Scale AI向工人支付的工资极低,经常拖欠或扣发工资,并为工人提供寻求救济的渠道很少。

vivo x70天玑1200

在描述FACET如何诞生的白皮书中,Meta表示注释者是“经过培训的专家”,他们来自包括北美(美国)、拉丁美洲(哥伦比亚)、中东(埃及)、非洲(肯尼亚)、东南亚(菲律宾)和东亚(台湾)等多个地理区域。Meta表示,它使用了来自第三方供应商的“专有注释平台”,并按照每个国家一小时的工资标准向注释者提供报酬。

撇开FACET可能存在问题的出处不谈,Meta表示该基准测试可用于探测不同人口统计属性下的分类、检测、“实例分割”和“视觉基础”模型。

作为测试用例,Meta将其自己的DINOv2计算机视觉算法应用于FACET,该算法已于本周开始商业使用。Meta表示,DINOv2发现了几种偏见,包括对某些性别表现的人的偏见以及对典型地将女性照片识别为“护士”的可能性的偏见。

在博客文章中,Meta写道:“DINOv2预训练数据集的准备过程可能无意中复制了为策展选择的参考数据集中的偏见。我们计划在未来的工作中解决这些潜在的不足之处,并相信基于图像的策展也可以帮助避免因使用搜索引擎或文本监督而产生的潜在偏见。”

没有完美的基准测试。值得称赞的是,Meta承认FACET可能无法充分捕捉现实世界的概念和人口群体。它还指出,由于自FACET创建以来,许多职业形象可能已经发生了变化。例如,在COVID-19大流行期间拍摄的FACET中的大多数医生和护士都佩戴了比大流行前更多的个人防护装备。

在白皮书中,Meta写道:“目前我们不打算更新此数据集。我们将允许用户标记任何可能令人反感的内容,并在发现时删除这些内容。”

除了数据集本身外,Meta还提供了一个基于网络的数据集浏览器工具。要使用该工具和数据集,开发人员必须同意不将其用于训练计算机视觉模型——而只用于评估、测试和基准测试。


返回网站首页

本文评论
拼多多央视新闻直播间「拼多多联合央视新闻举办进博会专场直播 吸引超千万网友观看」
11 月 7 日消息,拼多多百亿补贴近日联合央视新闻举办“全球好物‘进’在眼前”进博会专场直播,吸引超 2000 万网友观看、拼单。据悉,该场进博会直播的 105 件商品选自英国、瑞...
日期:11-12
薇娅电子商务有限公司「薇娅电商公司申请注销」
6月12日 消息:企查查APP显示,近日,杭州谦寻电子商务有限公司新增简易注销公告,公告期自6月7日至26日。iphone14pro信息显示,谦寻电子商务公司成立于2016年11月,注册资本100万元,法...
日期:06-12
县镇市场零售门店,如何培养出专业化店员?_如何做好零售店面服务
  在818发烧购物节的热潮中,主题为“赋商”的苏宁易购零售云合作伙伴大会在南京打响。   本次大会聚集了加盟商、品牌商和运营商代表共计近700人,与苏宁零售云共商大计...
日期:07-08
电脑维修服务_电脑维修服务网点
电脑在现代社会中扮演着重要的角色,成为人们生活工作中不可缺少的工具。但随着使用时间的增加,电脑也会出现各种问题,如电脑开机变慢、死机、蓝屏等,这些问题都可能影响到人们的...
日期:05-29
日本总务部「日本总务省与经产省将合并 AI 相关指导方针 力争年内完成汇总」
6月27日消息:日本政府日前召开了「AI 战略会议」,讨论制定人工智能(AI)运用相关规则等。一加7pro和ace会议确认将合并迄今总务省与经济产业省个别制定的指导方针,鉴于聊天软件「...
日期:06-27
eSIM+荣耀信任环,荣耀手表4实现远场消息同步,首发一表双待功能
通信世界网消息(CWW)2023年7月12日,在荣耀Magic V2暨全场景新品发布会上,荣耀正式发布全新一代智能手表——荣耀手表4。荣耀首次将MagicOS引入智能手表生态,力图打破传统eSIM手表...
日期:07-13
黑龙江通信管理局召开5G通信技术在煤矿安全生产应用座谈会_黑龙江5g通信工程建设骗局
2023年7月21日,为深入贯彻习近平总书记关于推动5G网络、工业互联网等加快发展的重要指示精神 ,落实《关于加快煤矿智能化发展的指导意见》(发改能源〔2020〕283号),充分利用5G等...
日期:07-28
Facebook保存用户已删除数据 或将面临罚款_facebook删除账户
  新浪科技讯 北京时间10月23日上午消息,由于擅自保存用户已删除的数据,Facebook位于爱尔兰的国际业务总部本周将面临审查,Facebook可能将因此遭到10万欧元(约合13.8万美元)...
日期:07-24
美团一度跌超5% 抖音或将入局外卖业务「抖音外卖和美团外卖」
2月8日 消息:2月8日消息,今日上午,美团一度跌超5%,此前有报道称,3月1日抖音将上线全国外卖服务。对此,抖音生活服务相关负责人回应,“团购配送”项目目前仍在北京、上海、成都试点...
日期:02-09
3月1日上线全国外卖服务?抖音回应:目前无具体时间表「抖音外卖上线了吗」
2月7日消息,今日有消息称,抖音将于3月1日上线全国外卖服务,目前已在北上广三地进行内测。对此,抖音相关负责人向媒体回应称,“团购配送”项目目前仍在北京、上海、成都试点当中,近...
日期:02-08
官宣!以太坊“合并”9月6日启动,完成后将告别工作量证明挖矿_以太坊挖矿中国将关停
  记者/王蕙蓉chrome新标签页设置  世界第二大加密货币以太币(ETH)背后的区块链网络以太坊,将在9月6日开始正式“合并”。  当地时间8月24日,以太坊基金会发布博客称:“...
日期:08-27
微软发布横幅,邀请谷歌 Chrome 浏览器用户试用 Bing Chat
IT之家 7 月 20 日消息,网友 Kevin Okemwa 近日打开谷歌 Chrome 浏览器之后,收到了“在 Chrome 中体验全新 AI 驱动的必应”通知,点击之后会打开新版必应页面,并推荐用户安装和...
日期:07-20
抖音综艺试水内容付费
声明:本文来自于微信公众号 新声Pro(ID:xinsheng-pro),作者 | 陆 娜(北京)修订 | 张一童(上海),授权转载发布。一个符合抖音需求的综艺内容,应该是一个包含多种内容的账号体系,其...
日期:08-10
2022 年,AI领域风险投资资金高达21亿美元_ai投资项目
12月12日 消息:据inside援引ft报道,风险投资对人工智能初创公司表现出越来越大的兴趣。 从2020年到2022年,人工智能的风险投资增加了425%。2022年,风险投资在人工智能领域的投...
日期:12-12
iqoo1参数「「Gen2神机将至_iQOO 11S入网 「首款鸡血版骁龙8」」」
来源:中关村在线神舟十二号载人飞船撤离空间站组合体三星手机为什么放弃中国市场台积电总资产5000亿人民币茶颜悦色为什么这么多人喜欢iQOO 11S是iQOO数字系列的新品,该机型已...
日期:08-14
趣店第二季度营收1.1亿元 同比下滑74.4%_趣店一季度
查看最新行情   讯 北京时间9月6日晚间消息,趣店(NYSE:QD)今日发布了截至6月30日的2022年第二季度财报。财报显示,趣店第二季度总营收为1...
日期:09-08
鸿蒙3再添24款设备:6年前麒麟970翻身!_鸿蒙99%
华为宣布HarmonyOS3公测范围再次扩大,本次公测新增24款手机和平板,包括nova、畅享、麦芒、荣耀等系列,已可升级新系统,这些机型中包含部分使用6年前的麒麟970处理器的设备。华为...
日期:04-13
企业微信全国远程办公大数据:北上深最爱开会,青琼吉爱自由
  2月8日消息 这个星期,许多人从在家隔离进入了在家办公的状态。昨日晚间,企业微信发布了全国远程办公大数据。   企业微信数据显示,截至2月7日,北京、深圳、上海人“爱交...
日期:11-06
工信部副部长辛国斌:2022年L2辅助驾驶新车渗透率达到了34.5%
通信世界网消息(CWW)近年来,高新技术的发展推动了各行业的智能化、自动化。汽车作为人们重要的出行方式之一,其智能化演变趋势已经成为未来汽车产业发展的重要方向。数据显示,智...
日期:06-21
闲鱼:部分卖家10月8日起需支持7天无理由退货「闲鱼支不支持七天无理由退货」
  闲鱼并不全是个人间的交易,还有商家在上面卖货。对于这部分商家,闲鱼也要求支持7天无理由退货了。  近日,闲鱼发布了关于新增《闲鱼社区七天无理由退货规范》的公示通知,...
日期:10-05