您的位置:首页 > 互联网

3秒让AI变乖,生成风险图片减少30%!复旦新研究拿下扩散模型概念移除新SOTA|ECCV 2024

发布时间:2024-08-26 17:15:30  来源:互联网     背景:

声明:本文来自于微信公众号 量子位,作者:量子位,授权转载发布。

让AI绘画模型变“乖”,现在仅需3秒调整模型参数

效果be like:生成的风险图片比以往最佳方法减少30%!

像这样,在充分移除梵高绘画风格的同时,对非目标艺术风格几乎没有影响。

图片

在移除裸露内容上,效果达到“只穿衣服,不改结构”。

图片

这就是复旦大学提出的概念移除新方法——RECE

目前,基于扩散模型的AI生图有时真假难辨,常被恶意用户用来生成侵犯版权和包含风险内容(如虚假新闻、暴力色情内容)的图像。

SD中使用的的安全措施是使用安全检查器,对违规的生成图像不予展示,还集成了一些用classifier-free guidance来规避风险概念的方法。

但在开源条件下,恶意用户可以轻松绕过这些机制,网上甚至有大把的教程……

针对此,学界提出了“概念移除”,即通过微调来移除文生图扩散模型中特定的风险概念,使其不再具备生成相应内容的能力。

这种方法的资源消耗远低于从头重新训练的SD v2.1版本,也不能被轻易绕过。

而最新研究RECE,拿下概念移除SOTA效果,并且对无关概念破坏极小,论文已被顶会ECCV2024接收。

锐龙7000系列cpu

图片

整个过程基于高效的解析解

此前,尽管概念移除进展迅速,其问题仍然明显:

  • 已有的方法为了安全性牺牲了较多的生成质量。

  • 已有方法即使对模型破坏较大,仍不能充分移除不当概念,有很大几率生成风险图像。

  • 大多数方法需要大量的微调步数,计算资源消耗大。

那么RECE是如何实现的?

RECE主要包含两个模块:模型编辑和嵌入推导

首先,RECE以解析解的形式,在交叉注意力层中将风险概念映射到无害概念。

然后,RECE以解析解的形式推导出风险概念的新嵌入表示并用于下一轮的模型编辑。

RECE还包括了一个简洁有效的正则项,可以证明其具有保护模型能力的作用,进而保证概念移除可以交替进行多轮。整个概念移除的过程都基于高效的解析解。

图片

风险概念嵌入推导

RECE的有效性来自于对已有方法概念移除不彻底的观察:

  • 以”裸露“为提示词,SD生成了裸露图像,UCE(一种概念移除方法)成功避免了裸露内容的生成;

  • 然而,输入有意设计的提示词或文本嵌入,UCE再次生成了裸露内容。

图片

为引导编辑后的模型重新生成裸露内容,接下来将以“裸露”为例,介绍RECE是如何推导上述具有攻击性的概念嵌入的。

既然是文生图,那首先思考文本引导的机制——交叉注意力

SD利用CLIP作为文本编码器得到提示词的嵌入形式,并且获得key与value,与表征视觉特征的query一起,得到输出:

图片

如果能得到一个新的概念嵌入,满足在编辑后的交叉注意力映射后,足够接近经过编辑前的映射值,那么应能够诱导生成裸露图片:

图片

上式为凸函数,因此具有解析解,不需要繁琐的梯度下降近似求解:

图片

模型编辑

接下来RECE将编辑交叉注意力以移除风险概念。RECE借鉴了已有的方法UCE,通过解析解来编辑交叉注意力的权重,一步到位,避免繁琐微调。

给定“源”概念(例如,“裸露”),“目标”概念(例如,空文本“ ”),以及交叉注意力的K/V投影矩阵,UCE的目标是找到新权重,将新权重下的映射值对齐到。

图片

其中后面两项是为了控制参数变化,最小化对无关概念的影响。这也是凸函数,将解析解直接赋值给新权重:

图片

正则项

苹果14刘海屏

理想情况下,将公式(五)得到的移除就可以避免生成裸露内容了,然而团队发现这会对模型能力产生极大的破坏。

因此在相邻的两轮概念移除中,RECE对无关概念的映射值变化做了约束:

图片

学过线性代数的同学是不是觉得很熟悉呢?

利用矩阵范数的相容性,证明得到:

图片

因此只需在推导时添加一个范数约束项,就能保护模型的能力:

图片

其解析解为:

图片

综上,RECE的算法流程归纳为:

图片

RECE效果如何?

不安全概念移除

首先来看最敏感的内容——色情。在I2P基准数据集上,RECE的裸露移除效果超过了全部已有方法。

团队还评估了概念移除后模型的正常内容生成能力,即无关概念集COCO-30k上的FID指标,也远超CA等方法。

图片

艺术风格移除

平安科技

保护艺术版权不受AI侵犯同样十分敏感。综合效果方面,RECE优于所有方法。

并且细致来看,RECE是唯一一个在目标艺术家擦除效果和无关艺术家保留效果方面都表现优异的方法。

图片

红队鲁棒性

RECE对恶意用户的有意攻击同样可以有效防护,在红队攻击下,RECE生成风险图片的几率仍是最低。

图片

模型编辑耗时

RECE5个Epoch仅需3.4秒,参数改动比例、编辑耗时远低于CA等方法。UCE的耗时也很短,但UCE的概念移除效果与RECE相差较大。

图片

作者简介

论文共同第一作者为复旦大学视觉与学习实验室的硕士新生公超和博士生陈凯

通讯作者为陈静静副教授。

研究团队专注于AI安全的研究,近年来在CVPR,ECCV,AAAI,ACM MM等顶会上发表过多篇AI安全的研究成果。

论文地址:https://arxiv.org/abs/2407.12383

2020下半年小屏手机消息

代码地址:https://github.com/CharlesGong12/RECE


返回网站首页

本文评论
网店为什么不收税_网店店主称不怕实名就怕收费征税
  据新华社电 网店“实名制”出台引发广泛关注。记者采访发现,公众主要关注三大焦点问题:实行“实名制”是否意味着今后开网店要工商登记?是否为了缴纳税费“开路”? 是否能...
日期:07-29
美国云计算上市公司_美国云计算软件股纷纷大涨 需求仍强劲
撼讯6600xt显卡   讯 北京时间8月15日早间消息,据报道,今年年初,美国云计算软件股纷纷下跌,但现在许多股票的价格已经较低点反弹50%。过去三个月WisdomTree云计算基金上涨26%,...
日期:08-16
谷歌2021新机「谷歌新一代旗舰手机曝光 Pixel 8a或将带来诸多惊喜」
蔚来全国有多少个换电站距离Google I/O大会开幕还有不到两周的时间,数码爱好者们都在期待这场盛会。据悉,谷歌将在会上发布最新款的智能手机Google Pixel 8a。以下是该手机的...
日期:05-06
肖战主演网剧《玉骨遥》大结局:腾讯视频18元提前看6集「肖战的玉骨遥什么时候上映」
7月17日消息,电视剧《玉骨遥》今日迎来大结局,该剧由腾讯视频独播,目前腾讯视频已放出超前点映”,额外支付18元即可看第35集-40集,也就是看完大结局。目前,话题玉骨遥大结局”冲上...
日期:07-18
软件开发工程师马真:塑造数字时代的智慧,引领仓储运营的技术变革
(原标题:软件开发工程师马真:塑造数字时代的智慧,引领仓储运营的技术变革) 随着信息技术和数字化的飞速进步,如何巧妙整合、创新...
日期:08-21
京东快递服务升级 推出1小时未取件必赔等承诺_京东1小时送达
10月11日 消息:京东物流近日宣布,京东快递服务再次升级,提出“1小时未取件必赔”和“全程超时必赔”,以及“派送不上门必赔”的三项承诺。苹果全球零售店数量长虹海思5g实验室...
日期:10-12
多行业复苏趋势明显 《2023行业突围与复苏潜力报告》发布_各行业复苏
随着疫情防控机制优化调整,近期来自多方数据均显示,中国经济尤其是实体行业、线下消费已呈现出加速恢复的态势。1月10日发布的《2023行业突围与复苏潜力报告》(下简称报告)显示,2...
日期:01-11
2017年腾讯净利润「腾讯三季度营收1400.93亿元 净利润399.43亿元」
11月16日消息,腾讯控股发布2022年第三季度财报,财报显示,腾讯控股第三季度营收1400.93亿元,同比下滑2%;公司权益持有人应占盈利399.43亿元,同比增长1%;非国际财务报告准则下净利...
日期:11-23
苏宁易购启动618大促,发布“家电新底价计划”「苏宁电器618活动」
5月24日消息,苏宁易购发布“618家电新底价计划”,全面开启2023年618大促。据了解,苏宁易购618将于5月26日晚8点开启预售,覆盖开门红、超级秒杀日、超级会员日、最终爆发期等多个...
日期:05-24
支持iPhone-14/15 苹果宣布在日本开通卫星通信服务_日本卫星通信系统
7月31日消息,苹果公司宣布,iPhone卫星通信服务已经扩展到日本,iPhone 14系列、iPhone 15系列日本用户更新到iOS 17.6之后,即可体验到卫星通信。资料显示,iPhone卫星通信首次上线...
日期:07-31
女子0.6折网购36件衣服 网店拒发货:结局舒适了_女子网购十八件衣服
对于那些爱网购,还是要注意了,如果你正常购物,遇到店家不发货的情况,这个可以作为参考。特斯拉汽车不能自动驾驶汽车近期,上海法院审结了一起因定价错误而引发的涉互联网购物的案...
日期:06-18
百度王海峰:文心大模型3.5的模型效果提升50%「文心 pdf」
7月6日 消息:7月6日,2023世界人工智能大会(WAIC)在上海世博中心开幕,在会上,百度首席技术官王海峰透露,截至目前飞桨已凝聚750万名开发者,这也是百度2023年以来首次对外披露飞桨生...
日期:07-06
魅族2020年销量有500万「全品牌销冠!魅族20系列成3000元档周线上销量第一」
快科技4月18日消息,魅族官方今天宣布,魅族20系列在3000元到4000元价位段的周线上销售额,已经成为了全品牌第一。同时,在4000元到5000元价位段,魅族20系列的周线上销售额,也已经成...
日期:04-18
Chrome已在两个大洲超越Firefox
  据国外媒体报道,Chrome浏览器已在7个大洲中的2个攫取第二大浏览器称号。   互联网数据统计公司StatCounter 数据显示,10月份的第一周,Chrome亚洲市场份额首次超越Firef...
日期:07-23
京东或即将上线「百亿补贴」:拼多多、抖音、快手、淘宝等全网比价
2月21日消息:日前有消息称,京东计划在3月初上线百亿补贴频道。根据被曝光的内部PPT披露的上线节奏来看,关于百亿补贴频道前期的规则与品池共建、沟通、确认已经完成,现在则在筹...
日期:03-01
量化巨头,决战“AI炒股”?「ai量化选股」
声明:本文来自于微信公众号锌刻度(ID:znkedu),撰文/ 陈邓新 编辑/ 高 智,授权转载发布。AI热潮,传入投资圈。日前,量化赛道头部玩家幻方量化发布公告,称将集中资源和力量,全力投身到...
日期:04-25
日照铁塔圆满完成中国山马越野系列赛(首站)-五莲站通信保障工作
通信世界网消息(CWW)9月24日,2023中国山马越野系列赛(首站)-山东五莲站启动仪式暨中国·五莲第四届“绿水青山”运动会在国家4A级景区五莲山旅游风景区鸣枪开跑。赛事吸引了全国...
日期:10-09
中科院院士高褔「中国工程院院士高文:没有大算力做大模型就是天方夜谭」
凤凰网科技讯 7月7日消息,中国工程院院士、鹏城实验室主任高文在世界人工智能大会昇腾人工智能产业高峰论坛上演讲时表示,没有大算力做大模型就是天方夜谭,这就和电力是一样的,...
日期:07-07
“挖呀挖呀挖”童谣为何火爆全网?专家解释原因
5月6日消息,今年五一假期前夕,浙江省杭州市一幼儿园老师桃子老师”在抖音平台上传的一条挖呀挖呀挖”的上课视频意外走红网络。在小小的花园里面挖呀挖呀挖,种小小的种子开小小...
日期:05-07
英特尔称10纳米Ice Lake处理器第二季度已开始出货(ice lake cpu)
  英特尔10纳米制程历经数次延期之后,在英第二季财报电话会议上,英特尔表示10纳米Ice Lake处理器已经在第二季开始出货,消费者可以在第四季度购买到搭载Ice Lake处理器的笔...
日期:03-05