您的位置:首页 > 互联网

OpenAI 发布 DALL-E 3 文生图模型:与 ChatGPT 完全集成 在细节和提示保真度方面挑战极限

发布时间:2023-09-21 19:55:21  来源:互联网     背景:

9月21日消息:本周三,OpenAI 宣布了 DALL-E 3,这是其最新版本的 AI 图像合成模型,它与 ChatGPT 完全集成。

DALL-E 3 通过紧密遵循复杂的描述并处理图像内文本生成(如标签和标志)来渲染图像,这是早期模型所面临的挑战。目前处于研究预览阶段,将于十月初提供给 ChatGPT Plus 和企业客户。

与其前身一样,DALL-E 3 是一种文本到图像生成器,根据称为提示的书面描述创建新颖的图像。尽管 OpenAI 没有透露关于 DALL-E 3 的技术细节,但以前版本的 DALL-E 的核心 AI 模型是基于由人类艺术家和摄影师创作的数百万张图像进行训练的,其中一些是从像 Shutterstock 这样的库网站获得许可的。DALL-E 3 很可能也遵循了这一相同的方法,但使用了新的训练技术和更多的计算训练时间。

从 OpenAI 在其宣传博客上提供的示例来看,DALL-E 3 似乎是迄今为止可用于按提示操作的图像合成模型中的一个巨大突破。尽管 OpenAI 的示例是精选的,以展示其效果,但它们似乎忠实地遵循了提示的指令,并以无需任何黑科技或提示工程即可令对象逼真地呈现出来。

与 DALL-E 2 相比,OpenAI 表示 DALL-E 3 能够更有效地细化手部等小细节,从而默认情况下创建引人入胜的图像。

相比之下,来自另一竞争对手供应商 Midjourney 渲染了逼真的细节,但仍然需要对提示进行大量反直觉的调整才能控制图像输出。

DALL-E 3 似乎还可以处理图像中的文本,而其前身无法做到这一点(一些竞争模型,如 Stable Diffusion XL 和 DeepFloyd,在这方面表现得越来越好)。例如,包含一幅画中,一个鳄梨坐在治疗师椅子上,说着『我感到内心空虚』,中间有一个坑孔大小的洞的提示,创建了一个卡通鳄梨,角色的台词完美地被包含在一个对话气泡中。

攀枝花浪潮智慧城市科技有限公司

图片来自OpenAI

值得注意的是,OpenAI 表示 DALL-E 3 是在 ChatGPT 上本地构建的,并将作为 ChatGPT Plus 的一个集成功能推出,使 AI 助手能够作为头脑风暴的合作伙伴以一种与当前对话的背景相一致的上下文环境方式生成图像。这可能会带来新的能力。微软的 Bing Chat AI 助手,也是基于 OpenAI 的技术构建的,自去年三月以来就能够在对话中生成图像。

DALL-E 的原始版本于 2021 年 1 月出现,OpenAI 在 2022 年 4 月推出了更强大的续作,以令人震惊的方式引发了 AI 生成图像的新时代,深深吸引了最初的封闭测试者。DALL-E 模型使用一种称为潜在扩散的技术,将噪音转化为它从训练数据集中获得的知识和提示的图像。同样的技术在去年 8 月也使开放权重模型 Stable Diffusion 诞生。

由于 DALL-E 是通过从人类创作的艺术作品的大规模数据集中获取概念来学习图像的,自从去年引入主流以来,AI 图像生成技术一直备受争议。这项技术引发了艺术家的抗议,他们担心它会取代他们或不道德地复制他们的风格,引发了关于未经版权持有人同意使用作为训练数据的被抓取图像的版权侵权的诉讼,以及关于美国版权办公室和美国地方法院对版权的新裁决。

作为对这些争议的回应,OpenAI 表示,DALL-E 3 将拒绝要求以在世艺术家风格制作图像的请求。OpenAI 还提供了一个表单,供创作者选择不让他们的图像用于训练未来的模型。这些措施似乎不太可能满足那些通常认为 AI 训练应该仅限于选择加入而不包含在默认图像数据集中的艺术家。

目前,美国的版权政策规定,纯粹由 AI 生成的艺术作品无法获得版权保护,因此使用 DALL-E 3 创建的任何图像都将属于公有领域。尽管 OpenAI 没有明确承认这一点,但它表示您使用 DALL-E 3 创建的图像属于您,您无需我们的许可即可重新印刷、销售或制作商品。这与去年 OpenAI 根据拥有所有生成物权的许可限制 DALL-E 2 图像使用的情况有了显著变化。

关于安全性,OpenAI 表示,与 DALL-E 2 一样,DALL-E 3 已经实施了关键字和图像检测过滤器,以限制其生成暴力、性或令人讨厌的内容。该系统还被编程拒绝生成涉及具名公众人物的请求,这一点在竞争的 AI 图像生成器 Midjourney 生成唐纳德·特朗普的虚假逮捕图像时曾引发问题。

OpenAI 表示,已经与被称为红队成员的专家合作,以识别和减轻潜在风险,如有害的偏见或制造宣传和虚假信息。OpenAI 没有提及其工具潜在用于以具有说服力的虚构来扭曲历史记录,尽管它表示正在尝试使用来源分类器工具,该工具可以帮助确定图像是否由 DALL-E 3 生成。

OpenAI 表示,这款 AI 图像生成器正在进行封闭测试。计划通过 API 在十月提供给 ChatGPT Plus 和企业客户,并在今年晚些时候在实验室中提供。


返回网站首页

本文评论
苹果播客好不好「Podnews:苹果扩大了其作为播客平台的领先地位」
3月16日消息:近期发布的一份行业「成绩单」显示,苹果播客仍然是创作者最喜欢的播客平台。这项调查由Podnews进行,结果基于 135 位不同的播客创作者的反馈。报告细分了「播客创...
日期:03-16
片方称分账试水不理想 视频付费点播趋向普及
  “价廉物美”的视频网站付费点播业务大面积普及,将不可避免地打击到盗版音像产业。   网络院线发行联盟普及收费观影业务,网站看好收益前景,片方试水观望2011年3月风头...
日期:07-27
京东加强双11期间定向营销短信审核 这七种情况将被驳回
10月31日 消息:今日早间,京麦商家中心发布消息称,为规范双11营销短信服务行为,确保短信内容的安全性与合规性,保障京东零售短信业务良好的用户体验,减少大促期间用户客诉,现针对营...
日期:11-03
小红书IPO或无望,亟待商业模式突围_小红书发展战略
  撰文 | 茜茜题图 | IC Photo  近日,小红书原CFO杨若因家庭原因离职,又给小红书IPO之路再添迷雾。  艾媒咨询张毅对DoNews直言,“在小红书目前的阶段,CFO的功能就是为上...
日期:10-05
迅雷:第二季度营收7830万美元 同比增长41.9%_迅雷净利润
营销资源红包化是什么意思 查看最新行情   讯8月16日晚间消息,今日,迅雷公布了截至2022年6月30日第二季度未经审计的财报。据财报显示,迅雷第二季度总营收...
日期:08-18
马斯克被美证监会调查 因“假”自动驾驶广告视频「美国证监会 马斯克」
凤凰网科技讯 1月28日早间消息,特斯拉CEO埃隆马斯克因自动驾驶广告视频争议面临美国证交会(SEC)调查。据路透社1月17日报道,特斯拉Autopilot软件总监阿肖克埃鲁斯瓦米(Ashok Ell...
日期:01-28
华为WATCH,Ultimate 非凡大师惊喜亮相 全球首款支持双向北斗卫星消息
本月科技圈最具看点的当属华为2023年华为春季旗舰新品发布会,随着去年Mate50系列凭借首发向上捅破天的北斗卫星通信技术引发市场一边倒好评,今年的华为便想要更多花粉通过不同...
日期:09-18
工信部出手!手机预装App终于能卸载了:2023年执行「工信部下架app怎么办」
买了新手机发现厂商预装的App无法卸载?别急,明年就能和无关紧要的预装App彻底告别了。为进一步规范移动智能终端应用软件预置行为,保护用户权益,提升移动互联网应用服务供给水平...
日期:12-14
周鸿祎宣布360安全大模型将发布 已在内部落地应用「2021年周鸿祎谈360发展」
8月10日 消息:在昨日的ISC2023第十一届互联网安全大会上,360创始人周鸿祎表示,360不仅有通用大模型,还围绕数字安全做了安全大模型。如果得到大家的认可,会在360的云化、安全大...
日期:08-10
今日端午节!假期出行人数或为5年来最高:预计1亿人次
快科技6月22日,今天是端午节,也是端午假期的第一天,大家都踏上行程了吗?据央视新闻报道,多家在线旅游平台数据显示,今年端午假期出行人数或将达到5年来最高,出游选择呈现短途、多元...
日期:06-22
安卓q root_Android Q还没正式发布,已经被开发者Root了
  谷歌Google I/O 2019开发者大会已经定档5月7日到9日,届时最新版的安卓系统Android Q将会正式亮相。不过在那之前,这个系统已经被第三方开发者Root了。   知名Root工具M...
日期:09-17
马斯克今天在推特说什么「马斯克已经掌管推特公司:希望其成为“最受尊敬的广告平台”」
10月28日消息,据国外媒体报道,推特原CEO已经离开公司总部,马斯克已经掌管社交媒体推特公司,并已经开始规划这家社交媒体平台的未来。据悉,10月27日,马斯克在推特上做出承诺,表示在...
日期:10-28
特斯拉一季度中国销量「乘联会:特斯拉1月份中国产汽车销量66051辆 环比增长18%」
2 月 8 日讯:乘联会公布数据称, 1 月新能源乘用车零售销量达到33. 2 万辆,同比下降6.3%,环比下降48.3%。其中,特斯拉销量 66051 辆,环比增长18%。彭昱畅代言螺蛳粉三星galaxy boo...
日期:02-08
社区做电商,左右为难「社区电商会代替电商吗?」
声明:本文来自于微信公众号 字母榜(ID:wujicaijing),作者:彦飞,授权转载发布。双11历来是阿里、京东唱主角。最近两年,抖音和快手高调加入,搅动旧格局。今年的新变化是,B站、小红书...
日期:11-06
行而不辍,载誉而归!盘点荣泰产品2022年的那些奖项!
  ​2020年,凭借“更专业”的产品优势,荣泰产品在诸多知名科技评选中,屡次斩获大奖!   都是哪些产品,在竞争激烈的按摩科技行业中脱颖而出,获得专业评测机构与媒体的一致肯...
日期:07-10
打造小折叠终极形态 moto razr 40 Ultra开启全面外屏时代
通信世界网消息(CWW)2023年6月1日,联想召开“心动,何止一面”moto razr 40系列折叠屏手机新品发布会。moto razr 40 Ultra与moto razr 40两款重磅小折叠新品正式亮相。联想集团...
日期:06-02
轻盐官网「轻盐App停用 宣布服务器将永久关闭」
4月7日 消息:互动交友软件轻盐App宣布,因业务调整,原轻盐App服务器将永久关闭,轻盐App即日起正式停止使用。将全力协助用户进行个人数据备份、迁移,并推进原轻盐App付费用户的退...
日期:04-07
安卓失速,降价过冬_安卓手机降价太快
声明:本文来自于微信公众号 深燃(ID:shenrancaijing),作者 | 王敏 编辑 | 向小园,授权转载发布。手机厂商们急了。最近“双11”大促,手机厂商们集体开启了大降价。一向价格稳定的...
日期:11-01
ChatGPT背后的算力博弈,中国企业亟待打破美国桎梏_china算力
声明:本文来自于微信公众号锌财经(ID:xincaijing),作者:孙鹏越,授权转载发布。如今AIGC市场一片鲜花着棉烈火烹油,不论是ChatGPT、AUTOGPT,或者国内的文心一言,市场乱烘烘你方唱罢...
日期:04-25
零售MAC_微软或可能通过Mac App Store销售Office
  2011年1月29日消息,据国外媒体报道称,微软高管阿曼达·莱夫布勒(Amanda Lefebvre)表示,该公司不排除通过苹果Mac App Store软件商店销售Office的可能性。   莱夫布勒当地...
日期:07-26