您的位置:首页 > 互联网

轻松识别Midjourney等AI生成图片,开源GenImage_识别图片中的代码软件

发布时间:2024-01-16 11:58:29  来源:互联网     背景:

声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。

AIGC时代,人人都可以使用Midjourney、Stable Diffusion等AI产品生成高质量图片,其逼真程度肉眼难以区分真假。这种虚假照片有时会对社会产生不良影响,例如,生成公众人物不雅图片用于散播谣言;合成虚假图片用于金融欺诈,造成信任危机等。

因此,华为诺亚方舟实验室开源了百万量级的GenImage数据集,帮助企业、开发者快速构建区分AI生成的图像和真实图像的检测器和评估工具,致力于构建AIGC时代的ImageNet。

开源地址:https://github.com/GenImage-Dataset/GenImage

论文:https://arxiv.org/abs/2306.08571

项目主页:https://genimage-dataset.github.io/

GenImage主要优点

1)大量图像,包括超过一百万对 AI 生成的假图像和收集的真实图像。

2)丰富的图像内容,涵盖广泛的1000类图像。

华为mate50 rs保时捷版5g手机壳

3) 最先进的生成器,Midjourney、Stable Diffusion、ADM、GLIDE、Wukong、VQDM等,利用先进的扩散模型和 GAN 合成图像。

上述优点使得在GenImage 上训练的检测器能够经过全面的评估,并表现出对不同图像的强大适用性。

华为团队对数据集进行了全面分析,并提出了两个任务来评估类似于真实场景的检测方法。交叉生成器:检测器在一种生成器生成的数据上训练,在其他生成器生成的数据上验证。这个任务目的是考察检测器在不同生成器上的泛化能力。

退化图像识别:检测器需要对于低分辨率,模糊和压缩图像进行识别。这个任务主要考察检测器在真实条件(如互联网上传播)中面对低质量图像时的泛化问题。

数据集介绍

识别图片中的代码软件

过去开源界也推出了一些数据集,主要有三个特点。第一数据规模小,第二都是基于GAN的,第三是局限于人脸数据。随着时间推移,数据规模慢慢地在增加,生成器也从GAN时代过渡到Diffusion时代,数据的范围也在增加。

但是一个大规模以Diffusion模型为主,涵盖各类通用图像的数据集仍然是缺失的。

基于此,华为团队提出一个对标imagenet的genimage数据集。真实的图片采用了ImageNet。

在线识别图源

虚假的图片采用ImageNet的标签进行生成。华为团队利用了八个先进的生成器来生成,分别是Midjourney,

Stable Diffusion V1.4, Stable Diffusion V1.5, ADM, GLIDE, Wukong,VQDM和BigGAN。

这些生成器生成的图片总数基本与真实图片一致。每个生成器生成的图片数量也基本一致。每一类生成的图片数量基本一致。

实验结果

华为团队做了一些实验来考察这个数据集。他们发现在某个生成器上训练的ResNet-50模型在其他的测试准确率会明显降低。

然而在真实情况下华为团队难以得知遇到的图像的生成器是什么。因此检测器对于不同生成器生成图片的泛化能力很重要。

在线识别图源

华为团队对比了现有方法在Stable Diffusion V1.4上训练,然后在各种生成器上测试的结果,也评测了各种生成器上训练,然后在各种生成器上测试的结果。

Testing Subset那一列中的每一个数据点,都是在八个生成器上训练,然后在一个生成器上测试得到的平均结果。然后华为团队将这些测试集上的结果平均,得到最右侧的平均结果。

华为团队对测试集进行退化处理,采用不同参数下的低分辨率,JPEG压缩和高斯模糊,评测结果如下

那么采集这么多数据是不是有用呢?华为团队做了相关实验,证明通过提升数据类比和每类的图片数量是可以提高性能。

针对GenImage数据集对于不同图片的泛化能力,华为团队发现他对于人脸和艺术类图片也能达到很好的效果。

未来展望

随着AI生成图片能力的不断提升,对于AI生成的图片实现有效检测的需求将会越来越迫切。本数据集致力于为真实环境下的生成图片检测提供有效训练数据。

华为团队使用ResNet-50在本数据集中训练,然后在真实推文中进行检测。如下图,ResNet-50能够有效识别真图和假图。

这个结果证明了GenIamge可以用于训练模型以判别真实世界的虚假信息。华为团队认为,该领域未来值得努力的方向是不断提升检测器在GenImage数据集上的准确率,并进而提升其在真实世界面对虚假信息的能力。

本文素材来源华为GenImage,如有侵权请联系删除

visual studio 2022正式版时间

长沙几点

END


返回网站首页

本文评论
手机充电进入个位数时代 Redmi 210W快充9分钟充满「redmi note7多少瓦快充」
10月28日 消息:近年来,国内手机厂商们在新机创新上,逐渐聚焦充电功率,快充技术成为新一轮的竞争焦点。新发布的一批安卓手机,基本上快充已经成为标配,不少入门级千元机都已经具备...
日期:10-29
华为p60外观全曝光 设计已无悬念怎么回事「华为P60外观全曝光 设计已无悬念」
中关村在线消息:近日,外媒曝光了华为P60的相关消息,同时新机的渲染图也被放出。华为P60后置摄像头模组采用万象双环设计,配色为土豪金,四角边采用弧形处理,正面屏幕为居中挖孔,看起...
日期:11-03
电视运动健身app_电视端健身app推荐,当贝健身和氧气瑜伽值得一试!
  对于很多上班族而言,每天忙碌完后总想要出汗发泄自己。但是在长时间的工作下,根本抽不开时间去健身房。今天小编就给大家推荐几款健身软件,能够轻轻松松让大家在家里健...
日期:07-14
索尼ps5什么时候出国行「索尼PS5全球出货量已达3840万台 PS5 Pro要来了」
快科技4月30日消息,近日,索尼公布了2022财年全年财报(2022年4月1日至2023年3月31日)。amd r5 5600x配什么主板财报显示,索尼2022年总营收达到了115398亿日元(约合人民币5852.33亿...
日期:04-30
李想:不降价 争取6月份销量破3万_李想新车
5月10日,理想汽车发布2023年一季度财报,数据显示,理想汽车第一季度总营收为187.9亿元(约合27.4亿美元),同比增长96.5%,环比增长6.4%。净利润为9.338亿元(约合1.360亿美元),而2022年第...
日期:05-11
小米各项业务营收占比_小米第二季度互联网服务收入69.7亿元,其中广告业务收入45亿元
讯 8月19日下午消息,小米集团(HK: 1810)今日发布截至2022年6月30日的第二季度财报。财报显示,小米第二季度营收701.7亿元,同比下滑20.1%,预估698.6亿元;净利润13.9亿元,预估15亿元;调...
日期:08-20
Temu诉Shein:扣留没收商家手机,获取temu账户
声明:本文来自于微信公众号 银杏科技(ID:yinxingcj),作者:银杏科技,授权转载发布。扫地机器人竞争对手12月14日,Temu向美国哥伦比亚特区法院提交了长达100多页的诉讼文件,再诉全球最...
日期:12-17
61.44TB全球第一!Solidigm发布D5-P5336 SSD:QLC闪存70年写不死
快科技7月22日消息,Solidigm公司近日发布了新一代旗舰企业级SSD D5-P5336,容量起步就有7.68TB,最高更是做到了史无前例的61.44TB,是此前纪录的整整两倍,1U机箱就可以达成2PB的存...
日期:07-23
跟随佳能和尼康淘汰数码单反相机,消息称哈苏 H 系统全线停产「哈苏h系列机身的区别」
IT之家 5 月 16 日消息,第三方供应商 Capture Integration 称,哈苏下发官方通知,宣布 H System 全线产品正式停产,所有产品现已缺货,哈苏将不再接受 H 系列任何产品的订单。如果...
日期:05-16
严查外卖快递配送行业乱象「10家快递外卖企业被北京交管等多部门约谈」
  昨日,北京市公安交管部门联合市邮政管理局、市商务局召开交通安全隐患突出快递外卖即时配送企业集中约谈公开处理大会。会上,三部门向今年以来因发生致人伤亡的交通事故和...
日期:09-01
微软将把必应搜索添加到ChatGPT中 与谷歌展开竞争「必应搜索界面」
5月24日消息,微软公司将把其必应搜索引擎接入到OpenAI的聊天机器人ChatGPT中,以进一步加强与这家人工智能初创公司的联系,并挑战谷歌在搜索领域的主导地位。4399游戏盒好玩游戏...
日期:05-24
乐视控股名下908件商标拍卖因无人出价流拍「乐视商标被拍卖」
10 月 11 日消息,今日,乐视控股(北京)有限公司名下包括“LE”、乐视手机“LeMobile”等 908 件商标一拍因无人出价而以流拍告终。根据京东拍卖平台显示,该项拍卖于今年 9 月上线,...
日期:10-18
魅族21官宣发布地点魅族21焕新正当时 魅族2023年终盛典开启
来源:中关村在线中关村在线消息:12月20日,魅族宣布2023年终盛典开场,魅族21可享12期免息、限量赠移动电源, 魅族20系列限时至高立省1500元、享至高24期免息,还有更多优惠等你解锁...
日期:12-21
DeepMind 联合创始人:AI 行业不应盲目追求快速行动,打破常规的发展模式
11 月 1 日消息::DeepMind 的联合创始人 Demis Hassabis 最近在接受 BBC 采访时表达了对 AI 行业发展的担忧,他警告说,与传统科技巨头不同的是,AI 行业不应盲目追求快速行动,打破...
日期:11-01
城市ngp功能「城市NGP在北京正式开放-小鹏汽车」
【】6月15日消息,据小鹏汽车官方消息,今日,城市NGP在北京正式开放!这是行业内首个在北京城区内开放的高等级智能辅助驾驶,当前主要适用于北京各环线及主要快速路。目前,该功能已面...
日期:09-24
groupon上市市值_专家预计Groupon上市时间或推迟至夏末秋初
6月17日消息,据国外媒体报道,自从Groupon提交IPO文件以来,业内权威人士和分析师一直很关注它的财务数据,同时对其长期增长性提出了严重质疑。虽然Groupon自己希望快速推进IPO计...
日期:07-30
晚高峰提前!滴滴预测跨年夜打车需求上涨300%_除夕滴滴打车涨价吗
快科技12月28日消息,即将告别2023年,你的元旦假期打算出游还是宅家看剧呢?今日,滴滴出行数据预测,元旦假期期间的打车需求同比去年预计上涨100%,预约顺风车跨城出行的订单比去年同...
日期:12-29
荣耀Magic V2预约人数超6万 将于今晚发布「荣耀magic2定价」
7月12日 消息:荣耀Magic V2在京东自营店和各大非自营店的预约订单量已经突破了6.1万人,这一数据证明了该款手机在市场上的高度关注度和热度。中端芯片选天玑还是骁龙 看完就...
日期:07-12
抢秋冬女装上新先机,抖音电商综合业务女装行业为产业带商家增信
声明:本文来自于微信公众号 派代(ID:paidaiwang),作者:文定,授权转载发布。从事服装行业的派友应该知道,在全球女装品牌崛起的背后,有一股不可忽视的力量——中国纺织制造产业带。多...
日期:09-22
淘特公布双11玩法 主推搜索“比价王者”可享五折_淘宝特价购物
10月11日 消息:双十一就快到了,各大电商平台纷纷公布了今年的玩法。主打性价比的淘特,今年的玩法也还是围绕性价比,主推搜索比价功能。10月22日、11月11日,淘特搜索“比价王者”...
日期:10-12