您的位置:首页 > 互联网

Stable Diffusion团队放大招!新绘画模型直出AI海报,实现像素级图像生成

发布时间:2023-04-30 12:50:02  来源:互联网     背景:

声明:本文来自于微信公众号 量子位(ID:QbitAI),梦晨 发自 凹非寺,授权转载发布。

开源AI绘画扛把子,Stable Diffusion背后公司StabilityAI再放大招!

全新开源模型DeepFloyd IF,一下获星2千+并登上GitHub热门榜。

图片

windows 10怎么更新到windows 11

DeepFloyd IF不光图像质量是照片级的,还解决了文生图的两大难题:

准确绘制文字。(霓虹灯招牌上写着xxx)

以及准确理解空间关系。(一只猫照镜子看见狮子的倒影)

网友表示,这可是个大事,之前想让Midjourney v5在霓虹灯招牌上写个字AI都是瞎划拉两笔,对于镜子理解的也不对。

图片

使用DeepFloyd IF,可以把指定文字巧妙放置在画面中任何地方。

霓虹灯招牌、街头涂鸦、服饰、手绘插画,文字都会以合适的字体、风格、排版出现在合理的地方。

这意味着,AI直出商品渲染图、海报等实用工作流程又打通一环。

还在视频特效上开辟了新方向。

目前DeepFloyd IF以非商用许可开源,不过团队解释这是暂时的,获得足够的用户反馈后将转向更宽松的协议。

图片

有需求的小伙伴可以抓紧反馈起来了。

像素级图像生成

DeepFloyd IF仍然基于扩散模型,但与之前的Stable Diffusion相比有两大不同。

负责理解文字的部分从OpenAI的CLIP换成了谷歌T5-XXL,结合超分辨率模块中额外的注意力层,获得更准确的文本理解。

负责生成图像的部分从潜扩散模型换成了像素级扩散模型

也就是扩散过程不再作用于表示图像编码的潜空间,而是直接作用于像素。

图片

官方还提供了一组DeepFloyd IF与其他AI绘画模型的直观对比。

图片

可以看出,使用T5做文本理解的谷歌Parti英伟达eDiff-1也都可以准确绘制文字,AI不会写字这事就是CLIP的锅。

不过英伟达eDiff-1不开源,谷歌的几个模型更是连个Demo都不给,DeepFloyd IF就成了更实际的选择。

具体生成图像上DeepFloyd IF与之前模型一致,语言模型理解文本后先生成64x64分辨率的小图,再经过不同层次的扩散模型和超分辨率模型放大。

微信拍了拍是怎么发的

图片

在这种架构上,通过把指定图像缩小回64x64再使用新的提示词重新执行扩散,也实现以图生图并调整风格、内容和细节。

图片

并且不需要对模型做微调就可直接实现。

另外,DeepFloyd IF的优势还在于,IF-4.3B基础模型是目前扩散模型中U-Net部分有效参数是最多的

在实验中,IF-4.3B取得了最好的FID分数,并达到SOTA(FID越低代表图像质量越高、多样性越好)。

图片

谁是DeepFloyd

DeepFloyd AI Research是StabilityAI旗下的独立研发团队,深受摇滚乐队平克弗洛伊德影响,自称为一只“研发乐队”。

图片

芯片国家补贴

主要成员只有4人,从姓氏来看均为东欧背景。

这次除了开源代码外,团队在HuggingFace上还提供了DeepFloyd IF模型的在线试玩。

我们也试了试,很可惜的是目前对中文还不太支持。

图片

原因可能是其训练数据集LAION-A里面中文内容不多,不过既然开源了,相信在中文数据集上训练好的变体也不会太晚出现。

图片

One More Thing

DeepFloyd IF并不是Stability AI昨晚在开源上的唯一动作

语言模型方面,他们也推出了首个开源并引入RLHF技术的聊天机器人StableVicuna,基于小羊驼Vicuna-13B模型实现。

目前代码和模型权重已开放下载。

完整的桌面和移动界面也即将发布。

图片

Deepfloyd IF在线试玩:

https://huggingface.co/spaces/DeepFloyd/IF

代码:

https://github.com/deep-floyd/IF

StableVicuna在线试玩:

https://huggingface.co/spaces/CarperAI/StableVicuna

权重下载:

https://huggingface.co/CarperAI/stable-vicuna-13b-delta

参考链接:

[1]https://deepfloyd.ai/deepfloyd-if

[2]https://stability.ai/blog/deepfloyd-if-text-to-image-model

[3]https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot

[4]https://stable-diffusion-art.com/how-stable-diffusion-work/


返回网站首页

本文评论
新版ChatGPT火速发布:十大变化带来升级但也有不足
凤凰网科技讯 北京时间3月15日消息,美国人工智能研究实验室OpenAI周二为其爆红聊天机器人ChatGPT发布了最新GPT-4语言模型,这距离ChatGPT的上线仅仅过去了4个月时间。外媒称,和...
日期:03-15
微软,期望2020_微软2020年新系统
  2019年即将结束,回顾微软今年所做的所有事情,很明显的是,Redmond-based软件最近一直很忙。   新的Windows 10功能更新(Windows 10 May 2019更新和Windows 10 November 2...
日期:06-08
实战时代兰云科技的网络安全观
——HW思考系列:检测只是开始,调查才能结案(上)   五年的HW行动,将网络安全从“合规”时代,带入“实战化”时代。面对这一变化,安全理念应如何进化,安全产品应如何进阶?   ...
日期:07-16
微信公众号后台崩了!无法登陆 无法加载图片「微信公众平台无法上传图片」
今天下午,有大量网友反馈微信公众号后台崩了。据反馈,目前有很多用户直接无法登陆公众号后台。三星s6广告音乐女娲捏泥人故事即便登陆上了,公众号管理后台发布文章的所有封面图...
日期:10-28
拿下京东,极兔如何成为主流电商的“团宠”_极兔怎么样了
声明:本文来自于微信公众号 霞光社(ID:Globalinsights),作者:李小天,授权转载发布。快递“黑马”极兔,最近又有了新动作。近日,有截图显示极兔速递完成与京东平台的对接测试,极兔出...
日期:03-27
字节教育推新业务大力空间,阿里、腾讯、喜马拉雅有这些人事新动向
特斯拉电池生产车间封面来源 | 图虫创意纽交所总裁与阿里巴巴   原标题:阿里云原总经理胡丹任腾讯云副总裁;字节教育推新业务大力空间;前趣奇互娱CEO加入腾讯XR事业线;前美术...
日期:08-12
苹果盗窃用户数据_黑客承认窃取12万iPad用户信息 面临长期监禁
(小贝)北京时间6月24日消息,据国外媒体报道,一名涉嫌窃取12万iPad用户个人信息的黑客周四向法庭认罪,这些罪名可能使他面临最长达10年的监禁。美国司法部女发言人里贝卡·卡米切...
日期:07-30
一周认证270项专利 IBM三星争夺“专利领导权”_ibm专利战略是什么
  据国外媒体报道,近年来很多“年轻”的企业被授予了大量的专利,不过IBM和三星是IT业界的专利巨人,没有其他任何公司申请的专利数量能与这两家公司相近,并且也没有任何其他公...
日期:07-24
格力电器:竞得银隆新能源 30.47% 股权,将成为其控股股东_格力电器股权融资
  8 月 31 日消息 格力电器今日发布公告,公司通过参与司法拍卖公开竞拍方式竞得银隆新能源股份有限公司 30.47% 股权,同时,董明珠女士将其持有的银隆新能源 17.46% 股权对应...
日期:07-17
鱼塘突现深坑 2万斤观赏鱼一夜消失原因成谜:官方回应「鱼塘里的鱼为什么突然少了」
3月14日凌晨,重庆市北碚区天府镇文星村一个鱼塘内突然出现一个直径10余米的深坑,鱼塘里的水和近2万斤鱼一夜之间不见踪影。视频发布者告诉极目新闻记者,鱼塘是她叔叔家的,位于重...
日期:03-15
热腾腾的包子冒热气「包子铺惊现热气腾腾神器 网友:原来包子也有气氛组」
11月16日,湖南长沙一家早餐店惊现热气腾腾神器,引发网友围观。视频中,在一摞包子蒸笼的后面,居然藏着一个喷热气的设备,不断的向蒸笼方向喷着热气。呼呼冒出的白色水雾与刚刚蒸好...
日期:11-19
开仓计划后,苏宁冰洗撒亿元补贴助力“焕新”
  疫情的持续影响,打乱了人们的生活节奏。线上购物、直播购物成为当下热门的消费方式。2月10日,作为家电第一渠道的苏宁,首度联合行业各大品牌线上“开仓”,精选坐标价格产品...
日期:09-18
果粉分享:iPhone14 Pro的升级和槽点_iphone11pro升级14.4
随着每年9月的“科技春晚”的落幕,今年的新款iPhone 也公诸于世。作为果粉的我,也第一时间入手了iPhone 14 Pro 银色版。使用了一段时间沉浸在新机的喜悦同时,来分享一些我对新...
日期:10-16
烧水杯推荐_原来你离爱上喝水只差一个好看的烧水杯
  我是个宝妈,平常专职在家带孩子,累并快乐着!但不得不说熊孩子真的是会把你折腾到没有一点休息时间。这几天,好不容易孩子不在家,所以赶紧给自己放个假,忙里偷闲悠哉一...
日期:07-10
黄冈中学广州学校开展智学网个性化教学助力教学质量稳步提升_黄冈中学广州学校实验小学
  高考、奥赛和教辅,“三箭齐发”成就了今天的黄冈中学。而黄冈中学广州学校不仅继承了母体的“独门秘笈”,还利用人工智能+教育优势,积极推广智教智学智慧校园,成为了新中高...
日期:12-22
超越RTX 3060是有条件的 Intel显卡喜新厌旧:要看平台、游戏_rtx3060显卡和3070
Intel在9月底正式发布了Arc A770及A750系列显卡,这是Arc品牌下的旗舰级显卡,算上A380、A310及A580等,代号炼金术师”的GPU家族布局算是完成了。售价方面,A750 8GB显卡售价289元,A...
日期:10-11
特斯拉降价会掀起电动车价格战吗「特斯拉降价丰田不装了!首款电动车bZ4X狂降3万:仅需16.98万起」
2月9日消息,广汽丰田官方宣布称,旗下首款电动车bZ4X厂家限时直降30000元,降价后,起售价仅16.98万元。去年10月份广汽丰田bZ4X正式上市,新车共推出5款配置车型,售价格区间为19.98-2...
日期:02-10
宁德时代子公司与哪吒汽车签约 就CIIC一体化智能底盘开展合作
1月11日 消息:1月10日,宁德时代全资子公司时代智能与哪吒汽车在上海举行签约仪式,双方将在CIIC(CATL Integrated Intelligent Chassis)一体化智能底盘项目上开展合作,首款搭载CII...
日期:01-11
今年全球在移动设备使用的内存芯片市场将上升71%(全球芯片市场占比)
  2月13日消息,据国外媒体报道,预计今年在移动设备使用的内存芯片市场将上升71%。根据研究公司IHS iSuppli的最新报告显示,这主要得益于不断发展的的移动电话和平板电脑市场...
日期:07-26
前 Meta 员工爆料:Facebook 系应用可“榨干”手机电池「Facebook员工」
IT之家 1 月 31 日消息,一位前 Meta 数据科学家指出,Facebook 系应用程序可以加速消耗 iPhone 和 Android 手机的电量。近日在接受纽约邮报时,乔治・海沃德(George Hayward)表示...
日期:01-31