您的位置:首页 > 互联网

SDXL Turbo、LCM相继发布,AI画图进入实时生成时代:字打多快,出图就有多快

发布时间:2023-11-30 15:15:24  来源:互联网     背景:

声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心,授权转载发布。

本周二,Stability AI 推出了新一代图像合成模型 Stable Diffusion XL Turbo,引发了一片叫好。人们纷纷表示,图像到文本生成从来没有这么轻松。

你可以不需要其他操作,只用在文本框中输入你的想法,SDXL Turbo 就能够迅速响应,生成对应内容。一边输入,一边生成,内容增加、减少,丝毫不影响它的速度。

你还可以根据已有的图像,更加精细地完成创作。手中只需要拿一张白纸,告诉 SDXL Turbo 你想要一只白猫,字还没打完,小白猫就已经在你的手中了。

SDXL Turbo 模型的速度达到了近乎实时的程度,让人不禁开始畅想:图像生成模型是不是可以干些其他事了。

有人直接连着游戏,获得了2fps 的风格迁移画面:

据官方博客介绍,在 A100上,SDXL Turbo 可在207毫秒内生成512x512图像(即时编码 + 单个去噪步骤 + 解码,fp16),其中单个 UNet 前向评估占用了67毫秒。

如此,我们可以判断,文生图已经进入实时时代。

这样的即时生成效率,与前不久爆火的清华 LCM 模型看起来有些相似,但是它们背后的技术内容却有所不同。Stability 在同期发布的一篇研究论文中详细介绍了该模型的内部工作原理。该研究重点提出了一种名为对抗扩散蒸馏(Adversarial Diffusion Distillation,ADD)的技术。SDXL Turbo 声称的优势之一是它与生成对抗网络(GAN)的相似性,特别是在生成单步图像输出方面。

论文地址:https://static1.squarespace.com/static/6213c340453c3f502425776e/t/65663480a92fba51d0e1023f/1701197769659/adversarial_diffusion_distillation.pdf

论文细节

简单来说,对抗扩散蒸馏是一种通用方法,可将预训练扩散模型的推理步数量减少到1-4个采样步,同时保持高采样保真度,并有可能进一步提高模型的整体性能。

为此,研究者引入了两个训练目标的组合:(i)对抗损失和(ii)与 SDS 相对应的蒸馏损失。对抗损失迫使模型在每次前向传递时直接生成位于真实图像流形上的样本,避免了其他蒸馏方法中常见的模糊和其他伪影。蒸馏损失使用另一个预训练(且固定)的 扩散模型作为教师,有效利用其广泛知识,并保留在大型扩散模型中观察到的强组合性。在推理过程中,研究者未使用无分类器指导,进一步减少了内存需求。他们保留了模型通过迭代细化来改进结果的能力,这比之前基于 GAN 的单步方法具有优势。

训练步骤如图2所示:

表1介绍了消融实验的结果,主要结论如下:

接下来是与其他 SOTA 模型的对比,此处研究者没有采用自动化指标,而是选择了更加可靠的用户偏好评估方法,目标是评估 prompt 遵循情况和整体图像。

实验通过使用相同的 prompt 生成输出来比较多个不同的模型变体(StyleGAN-T++、OpenMUSE、IF-XL、SDXL 和 LCM-XL)。在盲测中,SDXL Turbo 以单步击败 LCM-XL 的4步配置,并且仅用4步击败 SDXL 的50步配置。通过这些结果,可以看到 SDXL Turbo 的性能优于最先进的 multi-step 模型,其计算要求显著降低,而无需牺牲图像质量。

图7可视化了有关推理速度的 ELO 分数。

ios15和ios14哪个大版本更好

表2比较了使用相同基础模型的不同 few-step 采样和蒸馏方法。结果显示,ADD 的性能优于所有其他方法,包括8步的标准 DPM 求解器。

作为定量实验结果的补充,论文也展示了部分定性实验结果,展示了 ADD-XL 在初始样本基础上的改进能力。图3将 ADD-XL(1step)与 few-step 方案中当前最佳基线进行了比较。图4介绍了 ADD-XL 的迭代采样过程。图8将 ADD-XL 与其教师模型 SDXL-Base 进行了直接比较。正如用户研究所示,ADD-XL 在质量和 prompt 对齐方面都优于教师模型。

更多研究细节,可参考原论文。


返回网站首页

本文评论
华为胡厚崑:人工智能已让药物研发周期从数年缩至数月_人工智能对药物研发的影响
  讯 9月1日上午消息,2022世界人工智能大会开幕式上,华为轮值董事长胡厚崑发言指出,人工智能和电力和互联网一样,是一类新的通用技术,只有将他深深地嵌入到各种运用场景中去,化...
日期:09-04
宁夏农业农村经济运行态势监测预警平台荣获全国数字乡村创新大赛三等奖
通信世界网消息(CWW)10月20日-21日,2023年全国数字乡村创新大赛决赛及颁奖仪式在四川省德阳市举行。本次大赛旨在深入贯彻落实习近平总书记关于网络强国的重要思想、习近平总书...
日期:10-26
杭州法华寺月薪8万招聘和尚?传授72绝技?假的「杭州法华寺主持是谁」
2月7日,一则所谓法华寺招聘和尚”的消息在网上流传,号称方丈住持津贴为每月8万元以上,不过经证实这是虚假信息。据悉,法华寺位于杭州市西湖区北高峰下,是一处佛教活动场所。美团...
日期:02-08
iPhone 15两大绝招背刺iPhone14Pro_iPhone12背刺
iPhone14因为升级不明显和售价导致销量不如预期,新的爆料显示,苹果明年将推出无实体按键的iPhone,iPhone15 Pro系列大概率采用实体触控按键。金融壹账通估值htc vive sdk荣耀ma...
日期:11-30
日本福岛核污水排放时间「不顾反对声 日本最快22日决定福岛核污水排海时间」
尽管存在反对声,但是日本方面最终还是冒天下之大不韪要把福岛核电站的核污水排入大海,此前一直没有确定时间,日本方面表示最快22日决定。iQOO会员礼盒苹果电脑pro芯片和max芯片...
日期:08-22
在抖音生活服务做服务商,是一门好生意吗「抖音本地生活服务商推荐做吗」
声明:本文来自于微信公众号 窄播(ID:exact-interaction),作者:庞梦圆,授权转载发布。抖音正在释放关于本地生活的巨大红利。2021年1月,抖音启动抖音生活服务业务。截至目前已经覆盖...
日期:10-31
被发现后道歉 科技媒体指控谷歌Bard抄袭文章_谷歌paper
日前,聊天机器人“巴德”(Bard)正式开放公测,并邀请用户加入等待名单。不过,国外的科技媒体Tom's Hardware指控Bard提供的内容抄袭其站点文章内容。Tom's Hardware表示,其在向 Bar...
日期:10-05
今年可能发生什么?2023新闻媒体业5大趋势预判「2020年国内新闻有哪些」
声明:本文来自于微信公众号全媒派(ID:quanmeipai),作者:甄敏,授权转载发布。每年年初,许多关心传媒的人们可能会关注一个相似的话题——今年的新闻媒体行业会涌现出哪些新趋势?对...
日期:02-01
Adobe Photoshop iPadOS 版即将支持 RAW 图像,包括 iPhone 13 Pro/12 Pro 拍摄的 ProRAW 照片
  10 月 13 日消息,据 MacRumors 、9to5 Mac 报道,Adobe 今天宣布,iPad 上的 Photoshop 即将支持 Adobe Camera RAW,这将使 Photoshop iPad 用户能够导入、打开和编辑 RAW 文...
日期:05-14
国产4TB硬盘只要999 网友吐槽苹果太抠:升级256GB要1500元「4t硬盘多少钱」
快科技6月9日消息,在连续跌了一两年之后,内存及SSD价格已经是白菜价了,32GB只要400来块,DDR5也只是500-600左右,SSD硬盘更是被国产品牌杀到了4TB 999元的门槛,还是满血PCIe 4.0的...
日期:06-09
三星洗衣机撤出中国「2023中国家庭洗衣及烘护高峰论坛举办 三星以AI创新探索洗护新未来」
9 月 26 日,“新场景·衣常新·楚留香” 2023 中国家庭洗衣及烘护高峰论坛在北京举办。三星亮相本次论坛,展示了三星通过AI科技赋能的BESPOKE缤色铂格系列产品,不断洞察用户深...
日期:09-27
315晚会:部分破解版App成永不消失的追踪器
3月15日 消息:目前,各种破解版App广受欢迎。然而,许多消费者因贪图便宜而选择免费使用这些有问题的破解版App,其实就像给手机安装了“监控”或埋下了“地雷”,存在极高的风险。...
日期:03-16
小米平板5前摄「隐私安全稳了!小米平板6 Max前摄自带权限指示灯」
在笔记本电脑中,通过指示灯或者物理挡板的方式遮蔽摄像头,避免可能出现的隐私泄露已经不是什么稀有的设计。携号转网各运营商情况但是在平板电脑领域,这样的设计仍存在明显空白...
日期:08-13
年末5G手机芯片市场大盘点,领跑市场的将会是谁?_手机芯片市场占比
  伴随5G时代的到来,2019年下半年各大手机芯片厂商陆续发布自家5G芯片。而国内消费者所熟知的主要有高通5G的骁龙865/骁龙765G、MediaTek的天玑1000/天玑1000L、华为的麒...
日期:03-15
苹果发布会紫色12「突发!苹果iPhone14发布会画面流出 紫色iPhone 14 Pro现场曝光」
近日,海外爆料人抛出了一张苹果iPhone 14发布会录制现场画面,从此前官方发布的预告海报中已经提及今年iPhone 14发布会的地点为苹果总部的乔布斯剧场。而这张iPhone 14发布会...
日期:09-13
3元一根土烟换包装变2000元一盒雪茄 涉案金额600余万元「两块钱一根雪茄」
上海警方成功破获一起制造、销售劣质雪茄案,抓捕犯罪嫌疑人2名,缴获劣质雪茄4000多支,以及假冒雪茄烟嘴1万多个、包装盒1300多件,涉案金额超过600万元。安卓微信键盘怎么设置上...
日期:03-15
苹果关闭ios15.3验证通道意味着","info":{"wordid":"7065965611965093156"}},{&qu
来源:中关村在线马斯克被告苹果公司已经关闭了iOS 16.6.1、iOS 17和iOS 17.0.1的验证通道,这意味着已经升级到新版本系统的用户无法降级到这些版本。据报道称,苹果于10月5日凌...
日期:10-05
微信话题标签功能怎么用?35.8万篇文章告诉你_公众号文章添加话题标签
本期看点:“央视财经”时隔6个月重返榜首;健康类账号升幅明显,“都市全接触”夺得升幅榜桂冠;新面孔百科类账号“一只学霸”加入全10万+俱乐部;“海报时尚“重夺原创榜冠军,原...
日期:08-07
任正非:苹果是华为的老师 我们不要排外
9月20日消息,近日,任正非与ICPC基金会及教练和金牌获得者的学生的谈话纪要内容曝光。纪要显示,在提到对苹果的评价时,任正非表示,华为也经常探究苹果的产品为什么做得好,也能看到...
日期:09-20
微软2011上半年安全报告 0day不可怕
  10月13日消息:微软最新的安全漏洞报告中称,所谓的零日漏洞威胁被夸大了。   0-day漏洞被利用攻击的概率只有0.1%   微软安全情报报告第十一卷研究表明,在2011上半年...
日期:07-23