您的位置:首页 > 互联网

研究人员提出AI免优化框架DreamIdentity 保持身份一致且可编辑_研究人员接着探讨了这种效应会不会扩展到其他人

发布时间:2023-07-19 17:20:57  来源:互联网     背景:

7月19日 消息:为了解决人脸身份保存和可编辑性方面的问题,研究人员提供了一个独特的免优化框架(名为 DreamIdentity)。通过创建一个独特的多词多尺度身份编码器 (M2ID 编码器),以实现准确的身份表示,并使用自增强的可编辑性学习方法将编辑任务移到训练阶段。他们的方法既保持了身份的一致性,又实现了文本引导的灵活修改,有效实现了身份再语境化。

据了解,传统的文本到图像模型可以根据自然语言描述生成与特定人脸身份相关的不同情境的图像。然而,现有的优化无关方法在保持身份的同时保持模型的可编辑性方面存在困难。

由于基于扩散的大规模文本到图像 (T2I) 模型,创建视觉材料的学科最近发生了变化。这些 T2I 模型使制作引人入胜、富有表现力且以人为本的图形变得简单。这些模型的一个有趣的用途是,它们能够根据日常生活中特定人的面孔(我们的家人、朋友等),使用自然语言描述生成与身份相关的各种情况。身份重新情境化挑战与图1所示的典型 T2I 任务不同,要求模型在遵守文本提示的同时保持输入面部识别(即 ID 保留)。

研究人员表示,必须采取更多的行动来应对这一情况

为每个人脸身份个性化预训练的 T2I 模型是一种可行的方法。它需要学习通过增强单词嵌入或微调模型参数来将特定单词与本质相关联。由于每个身份的优化,这些基于优化的方法可能会更有效。为了避免耗时的每个身份优化,各种免优化方法建议直接将从预训练图像编码器(通常是 CLIP)获得的图像特征映射到词嵌入中。然而,这会损害 ID 的保存。因此,这些技术存在损害原始 T2I 模型编辑技能的危险,因为它们要么需要微调预训练 T2I 模型的参数,要么改变原始结构以注入额外的网格图像特征。

简而言之,所有并发的免优化工作都在努力保持身份,同时保持模型的可编辑性。他们认为,两个问题,即(1)错误的身份特征表示和(2)训练和测试目标不一致,是现有无优化研究中上述困难的根本原因。一方面,目前最好的 CLIP 模型在 top-1人脸识别准确率上仍然比人脸识别模型差很多(80.95% vs.87.61%),这表明所使用的通用编码器(即 CLIP)通过同时努力不足以完成身份重新情境化工作。此外,CLIP 的最后一层功能主要关注高级语义而不是精确的面部描述, 输入面部的可编辑性受到使用普通重建目标来学习单词嵌入的所有并发任务的负面影响。为了解决上述身份保存和可编辑性方面的困难,他们提供了一个独特的免优化框架(名为 DreamIdentity),具有准确的身份表示和一致的训练/推理目标。更准确地说,他们在 Vision Transformer 的架构中创建了独特的多字多尺度 ID 编码器(M2ID 编码器),以实现正确的识别表示。该编码器在相当大的人脸数据集上进行了预训练,并将多尺度特征投影到多词嵌入中。

中国科学技术大学和字节跳动的研究人员提出了一种新颖的自我增强可编辑性学习方法,将编辑任务转移到训练阶段。该方法使用 T2I 模型通过生成名人面孔和各种目标编辑的名人图像来构建自增强数据集。M2ID 编码器使用此数据集进行训练,以提高模型的可编辑性。他们对这项工作做出了以下贡献:他们认为,由于错误的表示和不一致的训练/推理目标,现有的免优化方法对于 ID 保存和高可编辑性来说是无效的。

从技术上讲,(1)他们建议使用 M2ID 编码器,这是一种具有多重嵌入投影的 ID 感知多尺度特征,用于适当的表示。(2) 它们结合了自我增强的可编辑性学习,使底层 T2I 模型能够提供高质量的数据集进行编辑,以实现一致的训练/推理目标。综合研究证明了他们的方法的有效性,有效地实现了身份保留,同时允许灵活的文本引导修改或身份重新上下文化。

英特尔10代超薄本

用固态硬盘做nas的坏处


返回网站首页

本文评论
糖醋排骨里竟然藏着"量子点"!它咋这么厉害?_糖醋排骨里有什么
继纳米材料之后,量子材料在这些年火了起来。关于防范打击电信网络诈骗犯罪的通告当然,不止是材料,什么东西挂上个量子”之后都立刻变得高大上了起来。毕竟量子力学这东西听上去...
日期:01-16
WPS AI 接入金山办公多个办公产品组件 可申请体验官资格「金山办公怎么用」
【网易科技7月7日报道】今日,金山办公旗下基于大语言模型的智能办公助手WPS AI在2023世界人工智能大会展出,WPS AI官网同步上线,并开启招募智能办公体验官的通道,WPS Office个人...
日期:07-07
继葛优后#冯小刚老炮儿维权案获赔超 100 万「葛优还有谁」
3月30日 消息:3月30日 消息:近日,葛优打葛优躺官司获赔759万引发关注,而继葛优后,冯小刚数百起“网络侵权责任纠纷”维权案也迎来了结果。四月国内手机出货量企查查APP显示,自20...
日期:03-30
联想控股估值2020「联想创投获新浪2022科技风云榜年度最佳投资机构奖」
  讯12月16日下午消息,由新浪财经客户端、联合主办的“2022科技风云榜”线上年度盛典今日开幕,今年活动主题为“守正创新,科技向上”。小米 汽车 合作  活动现场,来自各领域...
日期:12-16
STT(Statter Network)揭下面纱,展示元宇宙基础设施的自信与创新
作为区块链+元宇宙领域的大热门项目,Statter Network的发展动向备受投资机构和从业者的关注。过去半年,Statter官方公布的有限信息以及媒体的报道,可以拼凑出一个模糊的元宇宙...
日期:01-12
三星p729「三星p7500平板电脑参数」
Samsung P729 was a popular flip phone released by Samsung in the mid-2000s. It was part of the company's 'P' series of phones that included models business user...
日期:05-31
华为Mate 50 Pro全球开售:比国行贵1800元「华为mate50pro预售价」
华为于9月底面向海外市场推出了Mate 50 Pro手机,目前新机已经在波兰市场开售,法国和德国预计将于11月开启销售。从目前的电商页面来看,8+256GB售价约为8599元人民币,比国行的679...
日期:10-15
中国春节档电影市场重焕活力:总票房破67亿 列历史第2「2017春节档电影票房」
沉寂三年之后,在今年春节的七天长假期间,电影市场重新焕发了活力,尤其是多部国产电影相当火爆,并且涵盖了古装、科幻、动画等多个门类。据猫眼专业版数据,截止1月27日21时,2023年...
日期:01-28
百度健康疫情指数:我国2~3个月后或将出现疫情高峰「百度全球疫情最新数据统计」
步入十二月,随着“新十条”重磅发布,我国的疫情形势可能会如何发展?疫情峰值大概出现在什么时段?百度健康医典结合百度搜索大数据和百度指数,预测后续流行趋势。根据预测,在“放开...
日期:12-18
京东的3c是什么意思「五一旅行必备清单新鲜出炉 速来京东3C数码出游季选购好物」
五一将至,相信很多人已经迫不及待要出门玩耍啦!你是计划到北京打卡鼓楼和景山的日落,还是去火遍全网的淄博撸串吃烧烤,又或是化身“特种兵”登顶泰山、去音乐节肆意唱嗨、带上露...
日期:04-28
中国万网:域名不只买卖那么简单_中国万网域名管理
  据《2011年中国域名服务及安全现状报告》显示, 2010年5月到2011年5月之间,影响较大的域名攻击事件多达十六起。相比显性的网络欺诈和病毒攻击,域名故障的影响范围更大,损失...
日期:07-22
清北网校联合北大中文系展开战略合作,为课程注入“北大基因”
  1月21日,大力教育旗下聚焦K12赛道的教育产品——清北网校,正式宣布与北大中文系达成战略合作。签约仪式当天,清北网校负责人杨康和北大中文系主任杜晓勤,代表合作双方出席...
日期:04-04
一张图看懂 | 2022年十大电动汽车电池制造商「中国电动汽车电池生产」
10月9日 消息:预计2019年至2028年间,全球电动汽车 (EV) 电池市场将从170亿美元增长到超过950亿美元。iphone 13 pro max发货情况随着对交通运输行业减碳需求不断增加,为电动汽车...
日期:10-22
华为P60发布时间曝光 影像实力或更强「华为p60概念图曝光」
中关村在线消息:今日,微博博主曝光了华为P60系列的发布时间为明年第一季度,此前传出出的华为P60渲染图真实性存疑。该渲染图显示,华为P60采用了与P50相同的万象双环设计,正面屏幕...
日期:10-15
Win10出现Teams广告横幅:帮助界面都不放过
快科技6月5日消息,近日,有用户发现,微软在Win10的帮助界面,加入了新的推广横幅。据表述,当用户打开获取帮助”应用寻求帮助时,会出现一条关于Microsoft Teams Essentials的横幅,横...
日期:06-06
英特尔月底将与合作伙伴推十几款平板电脑_英特尔平板电脑处理器
5月19日消息,据国外媒体报道,英特尔周三披露一些计划,要推出10几款配置英特尔处理器的平板电脑,以便把它在PC领域的优势扩大到移动设备领域。在移动领域,竞争对手ARM的设计已经...
日期:07-28
华为把鸿蒙捐了_华为:鸿蒙全都捐出去了!
  (原标题:华为:已捐献鸿蒙全部基础能力、全部开源)   日前,华为官方刊文称,已于2020年、2021年分两次将鸿蒙OS的基础能力全部捐献给了开放原子开源基金会,并整合其他参与者...
日期:04-12
「一站式」解决企业数字化工作难题,奇安信发布“奇安天信”零信任工作系统
通信世界网消息(CWW)“信息化环境日益复杂,企业安全边界模糊,如何确保数字化工作安全、可信、合规、敏捷的开展?”7月7日,奇安信集团在2023全球数字经济大会上正式发布“奇安天信...
日期:07-10
节后朋友圈摄影大赛 用三星Galaxy Z Fold4轻松集赞朋友圈_三星手机摄影大赛获奖作品
每到五一长假结束,各类社交网络与朋友圈都会成为分享假期生活的秀场:各类美图、视频精彩纷呈,仿佛置身于一场亲朋好友间的“摄影大赛”。在人人都用手机记录生活的当下,如果想要...
日期:05-04
《普通人用AI创作爆款内容指南》「用ai做出来的作品」
声明:本文来自于微信公众号 头号AI玩家(ID:AIGCplayer),作者:月山橘,授权转载发布。AIGC创作的风潮已经席卷内容领域的各个角落。一边是ChatGPT、Midjourney等明星产品的走红、...
日期:07-04