您的位置:首页 > 互联网

微软 开源「微软开源创新LoRA组合方法,增强文生图复杂细节控制」

发布时间:2024-03-25 10:37:44  来源:互联网     背景:

声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:xxxxx,授权转载发布。

江苏爱驰新能源

LoRA(低秩适应)的高效能力已在文生图领域获得广泛应用,可以准确渲染、融合图像中的特定元素,例如,不同字符、特殊服装或样式背景等,同时可对图像进行压缩、去噪、补全进行优化操作。

但想在模型中应用多个LoRA构建更复杂的图像时,会出现图像失真、难以控制细节的难题。因此,微软和伊利诺伊大学的研究人员开发了Multi-LoRA Composition(多重 LoRA 组合方法)。

该方法包括LoRA Switch和LoRA Composite两种,无需微调就能集成多个LoRA一起使用,并且能保持每个LoRA 的权重完整性。

研究人员使用GPT-4V对该方法进行了综合评测,结果显示,LoRA Switch 在图像合成质量方面表现出卓越的性能,而 LoRA Composite 在图像质量生成方面表现出色,并且随着LoRA数量的增长效果将更明显。

论文地址:https://arxiv.org/abs/2402.16843

Github地址:https://github.com/maszhongming/Multi-LoRA-Composition

项目地址:https://maszhongming.github.io/Multi-LoRA-Composition/

春节4399游戏盒

LoRA Switch

LoRA Switch的技术原理是在每一个消噪步骤中, 选择性地激活一个LoRA模型,同时在多个LoRA模型之间轮流切换,确保每个元素都能得到充分的渲染。

LoRA Switch主要由3大块组成:1)扩散模型,用于生成图像的基模型,并执行顺序消噪的过程;2)多个LoRA模型,每个LoRA模型专门渲染图像中的一个元素,例如,人物、服装、背景、风格等;

3)切换功能,用户控制在消噪步骤中,按需激活每一个LoRA模型。

LoRA Switch的底层运行机制包括:首先设置LoRA模型的激活顺序,如先后激活人物LoRA、服装LoRA、风格LoRA等。

然后从第一个LoRA模型开始生成图像,每隔N个消噪步骤就切换激活下一个LoRA。当切换完所有LoRA后,再从头开始新的一轮切换,直到图像最终生成。

例如,在虚拟试穿场景中,LoRA Switch会在连续的去噪步骤中轮换角色LoRA和服装LoRA,从而确保每个元素都以精确和清晰的方式呈现。

LoRA Switch可以确保每个元素都得到充分渲染,避免了直接融合LoRA权重矩阵时出现的不稳定问题,也可以灵活调整LoRA之间的切换速率,适应不同的场景。

LoRA Composite

LoRA Composite的技术原理是在每个消噪步骤计算每个LoRA的无条件和有条件分数估计。然后对这些分数进行平均,作为图像生成过程的指导。这样可以极大平衡不同LoRA的作用,实现更协调的成像合成。

LoRA Composite主要包括2大块:1)扩散模型,用于执行去噪流程;2)多个LoRA模型:对扩散模型的参数进行适应,每个LoRA负责渲染一个元素。

iphone13的股价

LoRA Composite在运行时,首先计算每个LoRA模型的无条件和条件分数估计,然后对所有LoRA模型的分数进行平均,得到一个综合分数。以这个综合分数作为指导,驱动扩散模型执行顺序消噪过程并逐步生成图像。

与LoRA Switch不同的是,LoRA Composite综合了所有LoRA,并直接影响扩散过程,而不是操纵权重矩阵。

LoRA Composite可以集成任意数量的LoRA,并突破了目前研究中通常只合并两个LoRA的技术限制。

评估数据集

微软开源dapr

研究人员还开发了首个面向LoRA组合图像生成的专业测试基准ComposLoRA。该基准包含6大类、22个LoRA模型,480个组合样本,可以全面评价不同的LoRA组合。

夏普电视为什么这么便宜了

实验结果表明,在保证图像质量的同时,新提出的两种组合方法相比目前主流的LoRA融合技术,可以实现更协调、逼真的多元素图像生成效果。尤其是使用数量较多的LoRA组合时,生成高质量的效果更加明显。


返回网站首页

本文评论
Intel显卡驱动更新:7年前的《战地1》性能飙升30%_战地1显卡驱动要求384是什么意思
快科技12月15日消息,Intel今天发布了31.0.101.5081-5122版显卡驱动,这是新一代酷睿Ultra处理器所集成的Arc锐炫核显的首发驱动。游戏支持方面只有一款,但非常有趣,2016年就已发...
日期:12-16
华为Mate X3全版本/全配色开放现货:依然发售价 12999元起
快科技9月23日消息,华为Mate X5新一代折叠屏前不久已经开售,不过新品非常抢手,很多心仪的朋友参与多轮抢购依然落空。现在华为提供了一个新选择,华为Mate X3已全版本现货,全配色...
日期:09-23
一定要做个人IP!一定!_个人ip需要注册商标吗
声明:本文来自于微信公众号 十里村(ID:shilipxl),作者:村长住在十里村,授权转载发布。各位村民好,我是村长。尽管打造个人IP异常的困难,也不是每一个人都能成功的。但我依然建议各...
日期:11-01
叮咚买菜:国庆期间预制菜销量同比增长60%「叮咚买菜市场占有率」
10月8日 消息:国庆期间,叮咚买菜平台迎来订单高峰。近几日,火锅、烧烤类预制菜销量增长迅猛。iphone15长得什么样子今年国庆,由于市民减少了远途出行,更多人会选择家庭聚餐、近...
日期:10-08
第二代The Freestyle三星随享智能投影仪开启预约登记,快来解锁多重专属好礼
近日,第二代The Freestyle三星随享智能投影仪即将上市,三星商城已开启新品预约登记服务。 8 月 1 日至 8 月 31 日期间进行预约登记的用户可尊享腾讯视频VIP年卡、投影仪便捷...
日期:08-10
陌陌签约主播在抖音直播被索赔千万违约金:一审判赔300万_陌陌王牌主播解约要多少钱
10月8日消息,据澎湃新闻报道,中国裁判文书网公布的判决书显示,2019年10月17日,原告天津合尔公司(陌陌科技全资子公司)与被告秦某某签订了《王牌主播直播协议》。约定甲方系乙方直...
日期:10-09
油价居高不下!中石油、石化、海油三桶油赚大:一季度轻松几百亿
快科技4月28日消息,中国石油发布一季报,2023年一季度实现营业收入7324.71亿元,同比下降6%;归母净利润436.24亿元,同比增长12.1%;基本每股收益0.24元。扎克伯格财富首次超过1000亿...
日期:04-29
专家解读:如何构建全国一体化算力体系?_全国一体化算力网络国家枢纽节点建设
专家解读:如何构建全国一体化算力体系? 通信产业网|2024-03-14 09:39:55作者:崔亮亮来源:通信产业网【通信产业网讯】(记者 崔亮亮)李强总理在今年政府工作报告中指出,适度超前建设...
日期:03-14
无惧挑战!《壮志凌云2》票房今年稳第一:超强战机狂奔震撼「壮志凌云2豆瓣评分」
作为今年票房最牛的电影,空战爽片《壮志凌云2》总票房已经超过14.6亿美元,如此亮眼的成绩,让《阿凡达》续集也是压力山大。据Variety报道,分析公司Cinelytic预测《阿凡达2》在美...
日期:10-06
小姐姐上路实测极狐华为自动驾驶:技术宛如老司机「极狐夜间自动驾驶视频」
7月份,极狐阿尔法S华为HI版已经开启交付,新车共推出了进阶版(39.79万元)和高阶版(42.99万元)两款,二者的配置差异主要为辅助驾驶,高阶版有城市辅助驾驶和高阶自动泊车功能(AVP 等)。极...
日期:11-04
安卓智能手机_第一台安卓智能手机
是指搭载安卓操作系统的智能手机。安卓系统是由Google公司开发的基于Linux内核的移动操作系统,于2007年首次推出。随着智能手机行业的快速发展,已成为市场上最流行的智能手机...
日期:05-30
小米Civi 2手机Hello Kitty特别款发布:限量发售「小米Civi新品发布」
下午小米的发布会中,不仅发布了全新小米Civi 2手机,新机除了冰冰蓝、怦怦粉、朦朦黑的常规颜色以外,还发布了与Hello Kitty联合设计的特别款“小白裙”配色,从后壳的设计感和定...
日期:09-28
关于“搜狗拼音输入法”在360软件管家出现升级安装问题的公告(搜狗拼音下载安装)
  近日,大量搜狗拼音输入法的用户向我们反馈,在使用360软件管家升级安装搜狗拼音输入法最新版本之后,出现无法正常使用的情况。为保障用户利益、确保搜狗输入法良好的使用体...
日期:07-25
正式官宣,合作达成!数字化商业服务平台陪跑兔与广东快付达成战略合作_网易科技
(原标题:正式官宣,合作达成!数字化商业服务平台陪跑兔与广东快付达成战略合作) 023年8月8日,数字化商业服务平台陪跑兔与广东快付...
日期:08-14
全球首款双星卫星通信手机!华为Mate 60 Pro 价格公布:8999元起_华为发6g卫星
快科技9月25日消息,今日下午,华为举行全场景秋季新品发布会,带来多款重磅新品。在发布会结束后,华为终于公布了早已上架预订的华为Mate 60 Pro 售价,共有两款配置,16GB 512GB售价8...
日期:09-25
中东4g频段「渐入佳境的5G-A:发现中东运营商新“锚点”」
通信世界网消息(CWW)12月6–7日,第17届《电信评论(Telecom Review)》领袖峰会在迪拜正式召开,本届大会由ICT行业媒体Telecom Review主办,旨在展示中东地区在5G技术领域的领先地位以...
日期:12-11
进军TikTok,小杨哥公司要赚外国人的钱了_小杨哥 抖音
声明:本文来自于微信公众号 鸟哥笔记(ID:niaoge8),作者:蟹-,授权转载发布。互联网的奇妙在于,前一刻还默默无闻,后一刻就家喻户晓。“疯狂小杨哥”的名字大家肯定不陌生,从2018年在...
日期:01-26
坐实国产!苹果Vision Pro产地首次公布:原汁原味的中国制造_苹果国内厂家
快科技2月4日,被苹果视作下一代空间计算设备”的Vision Pro头显已经在美国正式开售,起售价3499美元(约合2.5万元)。ai谷歌和微软谁强尽管售价高昂,依然挡不住果粉们买买买的热情...
日期:02-04
Cisco发布新AI战略,增强Webex视频会议平台AI功能_cisco webex
怎么自学装机极智嘉物流有限公司眼镜取代手机...
日期:10-26
2023年竟还真有厂商在做小屏旗舰:不要命了?
就在6月29日,华硕推出了自家最新的智能手机产品:华硕 Zenfone 10,并宣布该手机将从该日起至7月31日接受预订。有新机并不出奇,但让人不得不惊讶的是,这款新机尺寸仅有5.9 英寸...
日期:07-17