您的位置:首页 > 互联网

解读1秒生成高精准图片模型——SDXL Turbo_图像生成app

发布时间:2023-12-23 10:29:38  来源:互联网     背景:

声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。

前不久,著名开源生成式AI平台Stability.ai发布了,全新文生图模型SDXL Turbo。该模型只需1秒甚至更少的时间就能生成高精准图片,可将通常50个生成步降至1—4步。

Stability.ai表示,SDXL Turbo能有如此快的推理效率是使用了全新的技术——对抗式扩散蒸馏(Adversarial Diffusion Distillation,简称ADD)。

简单来说,ADD就是在“疯狂内卷+严师指导”的双重模式下,用最短的时间、最高效的学习方法考上了清、北。

一张照片生成模型

现在你读上面那段话可能有点迷糊,看完全文后你就会心疼ADD,像极了当年学习的自己。

荣耀系统magic6.0的通知栏

荣耀Magic X折叠屏

论文地址:https://stability.ai/s/adversarial_diffusion_distillation.pdf

开源地址:https://github.com/Stability-AI/generative-models

什么是大模型蒸馏

为了更好地理解ADD技术原理,AIGC开放社区先用通俗易懂的方式为大家介绍一下大模型中的“蒸馏”到底是什么技术。

模型蒸馏是一种将大型复杂模型(通常称为“教师模型”)的知识传输到小型简化模型(即“学生模型”)的技术。

蒸馏过程就像把水果压榨成精华果汁一样,我们尝试保留大模型中最重要的信息,并且让小模型能够捕获并模仿这些内容。

或者可以理解成老师教学生的过程,全部知识不一定都学会,但重要知识点肯定都掌握了。

而ADD能以最快的推理效率生成高质量图片,便使用了对抗损失和分数蒸馏两项重要技术。

一个负责生成图片的质量,另外一个充当“老师”负责教会小模型捕捉重要知识点并进行指导修正。

对抗损失

对抗损失是ADD框架中的一大关键功能。引入了对抗学习的思想,让学生模型与判别器之间进行激烈对抗。

对抗学习源于GAN模型,其核心思路是通过竞争促进模型快速逼近复杂分布。学生模型想方设法生成高质量图像蒙骗判别器,而判别器则全力识破这些虚假的图片。

所以,两人就不得不拼命的内卷,最后生成的图片质量越来越高。此外,对抗过程还可引入条件信息,如文本或图像的特征向量,以增强对应性。

对抗损失中的判别器包含两部分:一个特征提取器和几个判别头。特征网络可以预先在图像分类等任务上训练,然后切掉分类层拿特征向量。这样可以重复使用以前学到的知识。

判别头则在特征的基础上判断图像真伪。训练目标就是最大化真实图的分数,最小化假图的分数。

分数蒸馏

surface laptop cpu

分数蒸馏的核心思想是,让老师模型教学生模型传授重要知识帮助ADD捕获模型的知识点。就是咱们前面介绍的“模型蒸馏”概念。

ADD的老师模型使用了Stability.ai自研性能强大的Stable Diffusion XL和Stable Diffusion2.1两个扩散模型,来监督学生模型ADD-M和ADD-XL生成的图片结果。

具体流程是,先将学生模型生成的图片进一步加噪声,模拟扩散过程,然后让老师模型基于噪声图像输出它的还原结果。

这个还原结果可以作为学习目标,并成为学生模型的生成目标,使自己的图片可以匹配老师模型。同时在老师的指点下,逐步修正偏差达到最佳效果。

在训练过程中,学生模型需要同时面对判别器的对抗,和老师模型的严厉监督,在二者的双重驱动下不断进步。

联想z5怎么设置全面屏

所以,在最终输出阶段学生模型能用极少的采样步骤1—4,就能输出高质量精准图片。

哎~~万万没想到现实中的高压学习、生活方法也适用于大模型界,看来开发灵感真的无处不在啊,真是名师出高徒,严父出孝子。


返回网站首页

本文评论
2022年抖音双11好物节活动招商规则公布 十余种玩法助力商家「抖音618购物节品牌策划」
9月28日 消息:昨日,抖音双11好物节招商大会面向全体商家、达人正式召开,并公布了详细的招商规则。本次活动提供了十余种重磅玩法助力商家实现平台生意新突破。其中,「跨店每满...
日期:09-28
中国移动北京5g信号覆盖有哪些地方「北京5G领航城市丨北京移动与中兴通讯再启深度合作新阶段」
通信世界网消息(CWW)6月4日,正值2023中国国际信息通信展览会开幕第一天,中国移动北京公司(北京移动)、中兴通讯和多家产业伙伴共同参与了由中国工信出版传媒集团举办的“5G领航,智...
日期:06-05
传美收紧对华AI芯片出口限制,或影响英伟达H800,预计本周公布_美国芯片对华出口
芯东西(公众号:aichip001)编译 | 程茜编辑 | Panken芯东西10月16日消息,今日,外媒首次报道了美国加码对华AI芯片出口限制的新规细节。据悉,新规将填补之前对华AI芯片限制的“漏洞...
日期:10-16
iPhone X等神机被弃!苹果iOS 17正式版推送:这些新功能你要知道_苹果17.1
快科技9月19日消息,今日凌晨01:00左右,苹果正式推送iOS 17正式版升级,系统安装包大小为3.32GB(不同机型会有差异)。据了解,iOS17为电话、信息、FaceTime通话带来了重大更新,同时还...
日期:09-19
瑞幸造假的后果「泰国假瑞幸向中国瑞幸索赔20亿元 官方回应:情况待核实」
快科技12月20日消息,今日,词条#泰国瑞幸向中国瑞幸索赔100亿泰铢#登上微博热搜榜,引来众多网友围观热议。今日午间,瑞幸咖啡官方微博对此回应称,关于被泰国假瑞幸索赔100亿泰铢问...
日期:12-21
马上金融深化AI+应用,科技实力赢权威认​可
  近日,聚焦于人工智能在各行各业的创新应用的“2021人工智能分类排行”榜单重磅揭晓,除了华为、百度、微众银行等头部企业或机构,马上消费金融也凭借深厚的技术沉淀和丰富...
日期:03-12
快手称正在开展大规模语言模型研究
var cid = "1494984".toString(); var czPay = localStorage.getItem('czpay'); if(czPay != null){ if(czPay.indexOf(cid)!=-1){ var pids = czPay.spli...
日期:02-09
卡布达归来!《铁甲小宝》高清修复版将至:已开通B站账号_铁甲小宝卡布达图片
还记得童年的铁甲小宝卡布达、蜻蜓队长吗?现在这部剧的高清修复版可能快来了。前不久,《铁甲小宝》官方在国内注册了微博、抖音和B站账号,带来了不少相关内容。今天,官方发布了...
日期:03-16
Q+或许是社交行业最后一个新起之秀!颜值社交真的很容易吗?(有价值的社交)
  本人40+,工作关系经常出差,在外地没什么朋友可以叫出来,人在孤独久了以后慢慢会变得麻木,不再介意提及自己的孤独,学会美化孤独,有时甚至觉得很享受……但无数个夜深人...
日期:01-08
马斯克:特斯拉要到2024年底才会开始量产Semi电动半挂卡车「特斯拉电动卡车价格」
6月15日消息,据外媒报道,特斯拉首席执行官(CEO)埃隆·马斯克表示,由于在电池供应方面受到限制,特斯拉要到2024年底才会开始量产Semi电动半挂卡车。iphone 13美国发售价任天堂switc...
日期:06-15
华为nova 11开箱:正面四边等宽 美极了_华为nova11什么时候上市
在这个周末,有博主提前开箱了华为nova 11手机,新机正面采用中置挖孔直屏,边框基本是四等宽,屏占比控制的非常好。华为nova 11屏幕尺寸是6.7英寸,材质为OLED,机身厚度只有6.88mm,比i...
日期:04-16
永劫无间安妮数据「《永劫无间》尼尔联动第二批来了:A2、凯妮、尼尔全员上线」
快科技8月22日消息,前不久《永劫无间》正式上线了《尼尔:机械纪元》的联动内容,不过当时只上线了2B和9S对应的时装、武器。根据官方最新消息,第二批内容将会在8月24日正式上线,A2...
日期:08-23
追赶微软和亚马逊 谷歌将AI芯片团队并入云计算部门_谷歌芯片公司
4 月 24 日消息,据 The Information 获得的消息,谷歌一位发言人证实,该公司已将负责制造 AI 芯片的工程团队转移到了谷歌云计算部门,此举可能使云部门在向企业销售人工智能软件...
日期:10-01
oppo findx3pro颜色「OPPO Find N3配色全曝光:四种颜色 素皮版本亮眼」
OPPO Find N3 折叠屏手机即将于10月19日正式发布,近日爆料者evleaks公开了该机的全部配色渲染图。据了解,OPPO Find N3提供黑色、金色、绿色和红色四种配色可选,并且其中两款采...
日期:10-19
当之无愧的明星店长!苏宁员工“组合拳式”营销方法走红
  近日,苏宁红孩子济宁店一员工想出“组合拳式”营销方法走红网络,鉴于疫情期间的特殊情况,通过直播、社群、小程序、推客等多种营销方式带动门店业绩,服务母婴群体,不仅超额...
日期:12-28
印尼总统:希望特斯拉在本地造车,而不仅仅是电池(特斯拉已经与印尼达成协议)
8月19日消息,印尼希望特斯拉公司能在该国生产电动汽车,而不仅仅是电池,并愿意花时间说服埃隆·马斯克(Elon Musk)将那里视为资源丰富的宝地。paypal支付优惠券飞利浦电视发展史印...
日期:08-20
突发!融资135亿,罕见独角兽诞生:打破垄断_中国独角兽凶猛 融资额仅次于纽交所ipo
铅笔道作者 | 爱羽你见过这么大的单笔融资吗?135亿元。这是个什么概念?一笔融资超过国内约60%的上市公司市值。然而近期,就有这么一家“神仙公司”宣布融资(135亿),它就是积塔半导...
日期:09-08
越来越像微信?马斯克:X将推出语音和视频通话功能
财联社9月1日讯(编辑 夏军雄)当地时间周四(8月31日),埃隆·马斯克在社交媒体平台X(前身为推特)表示,X将允许用户能够在该平台上进行语音和视频通话,且无需手机号码。苹果 iphone 8和7...
日期:09-01
沃尔玛紧跟潮流:9月起向会员提供流媒体服务 试图挑战亚马逊_沃尔玛+亚马逊模式
编辑/周子意   美国最大传统零售商沃尔玛公司周一(15日)与影视公司派拉蒙环球(Paramount Global)达成协议,向沃尔玛会员计划的订户提供Paramount+的流媒体服务。沃尔玛试图通过...
日期:08-16
印度的法官是怎样一种情况?「印度法官无法判决向ChatGPT求助 或可帮助加快案件审理」
本周,印度的一个法院在询问Openai旗下的AI人工智能产品ChatGPT有关一起案件的审判,这是一起涉及了谋杀案的起诉。事情发生在印度旁遮普邦和哈里亚纳邦高等法院,一名名叫辛格的...
日期:03-31