您的位置:首页 > 互联网

用嘴指挥别人怎么形容「体验当甲方的快乐!用嘴指挥DALL·E 3设计LOGO、做梗图、画漫画……」

发布时间:2023-10-13 04:53:29  来源:互联网     背景:

声明:本文来自于微信公众号头号AI玩家(ID:AIGCplayer),作者 | 卷毛,编辑| 松露,授权转载发布。

*头图来源于DALL·E3,描述:一个由拟人化的秋天树叶组成的民谣乐队的2D动画,每一片树叶都演奏着传统的蓝草乐器,在乡村森林的背景中,点缀着丰收之月的柔光。

全自动画图神器来了!ChatGPT现在能直接出图了。

只需要告诉ChatGPT你想要一张什么图,ChatGPT就能直接帮你写好完整的描述词,给到DALL·E3生成图片。像这张混合星云爆炸的扣篮创意图,换成以往的AI绘图产品,一般都需要费力编写大段的“咒语”才能实现。

“一幅表现篮球运动员扣篮的油画,描绘的是星云的爆炸”,图源DALL·E3

DALL·E3是OpenAI最近推出的新版AI绘图模型,原生构建在ChatGPT之上,进一步降低了AI绘画门槛,用户可以在对话中将自己的想法转化成准确的图像,甚至还能画出正确的文字。

用户问ChatGPT“我5岁的孩子说的超级向日葵刺猬,它应该长什么样子”,ChatGPT立马写了四段不同风格的提示词,并生成对应图像

“这幅插画描绘了一颗由半透明玻璃制成的人心,矗立在惊涛骇浪中的基座上。一缕阳光穿透云层,照亮了心脏,揭示了其中的小宇宙。地平线上镌刻着一行醒目的大字 Find the universe within you”,图源DALL·E3

目前只有一小部分ChatGPT Plus用户获得了内测资格。不过很快,与OpenAI深度合作的微软便将DALL·E3集成在浏览器Bing中,可供所有Bing Chat和Bing Image Creator用户免费使用。由于来尝鲜的用户太多,Bing最近流量激增,报道称微软又紧急增加了数千台服务器上线。

有了ChatGPT支持的DALL·E3真的像介绍的这么厉害吗?和Midjourney等其他AI绘画产品又有什么区别呢?“头号AI玩家”在Bing上对DALL·E3进行了一番测评。

p.s. 想要体验的玩家可以访问以下两个入口,登录微软账户即可使用,目前Bing Image Create每天有25次免费的快速生成额度,用完之后生成图片需要更长的时间。

Bing Image Create网址:https://cn.bing.com/create

Bing Chat网址:https://www.microsoft.com/zh-cn/edge/launch/bing-chat-3p?form=MY02CJ&OCID=MY02CJ&q

文章插图

内容创作者为了减少购买版权素材的成本,或者快速找到符合需求的图片,可能会试着用AI生成配图。

我们先用简短的提示词试试,输入“画一个招聘市场”,DALL·E3默认生成了四张1024*1024分辨率的图片,内容相似,都是拿着放大镜观察市场数据。

我们可以给出更详细的要求,比如“画一个现实里的招聘市场,人来人往,非常热闹”。不过DALL·E3理解错了现实里的意思,变成了插画风格,并写上了文字“Real Job Market”,部分图片的文字还出现了错误。

作为甲方,我们再次提出了修改意见——“人头攒动的招聘市场,写实摄影,不含文字,横屏”。可惜的是,DALL·E3给出的图比较抽象,虚实结合,还是出现了文字。

相比之下,同样的提示词,Midjourney的理解就比较准确了,满屏都是求职者。

Crowded recruitment market, realistic photography, no text --ar16:9--v5.2

换一个简单点的描述看看,“两个中国人在面试中”,这下DALL·E3的表现基本不错,只是交叉的手指都没处理好。

而Midjourney与DALL·E3的理解不同,认为是两个人在面对面对谈,四张图的人物、环境、风格差异都比较大,细节上比DALL·E3更真实一些。

Two Chinese people during the interview --ar16:9--v5.2

DALL·E3的特色在于能够在对话中生成图像,除了给出明确的提示词,我们还可以试着直接输入一段文字,要求生成符合文意的配图。

这段话讨论了非技术人员怎么跟上AI浪潮,语义复杂,并没有描述具体的人或事物,DALL·E3的结果令人惊喜,有一座富有科技感的未来城市和工作在其中的人们,也有许多人围绕着智慧大脑的脉络进行工作,从不同角度切中了文意。

我们试着在其中一张原图的基础上继续加入文字“AI”,但是DALL·E3重新生成了四张跟原图无关的图片,似乎不能直接修改已生成的图片,比如调整一些细节。

LOGO设计

既然有了ChaGPT支持,我们不妨让DALL·E3帮我们完善想法,自动生成详细提示,定制一张个性化的LOGO。

一开始Bing认为“头号AI玩家”与人工智能和游戏有关,所以设计的LOGO主体是一个机器人拿着游戏手柄。在补充了账号信息和主色调后,Bing以人工智能头像和数字1为主要元素重新设计了四张图。

第三张感觉更简洁一些,我们继续沟通修改。

可以看到,Bing能比较好地理解需求,但生成的文字有时不太准确,需要再后期修改。对比Midjourney,我们无法实现这样来回的沟通,只能自己琢磨提示词,并且很难生成AIGC这么多文字,Midjourney的优势在于生成的图片质量比较高,设计感更强。

The logo named after AIGC PLAYER, Purple, simple, technological sense, no complicated lines --v5.2

产品图/营销图

在广告营销、电商领域,AI商品图的应用越来越多,那么DALL·E3能生成可用的素材图吗?

我们先让Bing生成一只中式风格的、适合秋冬使用的手提包,看来它理解的中式是喜庆、刺绣、流苏。

换成传统与现代结合的新中式风格呢?果然变成了黑色、金色为主的皮质包包,不过还是保留了复杂的刺绣图案。即使要求装饰简约一点,Bing理解的中式风格依旧离不开刺绣。

而Midjourney生成的显然更素雅一些,背景也更简洁。

A new Chinese-style handbag that combines tradition and modernity for autumn and winter, with light and neutral colors and patterns --v5.2

如果想换个背景和场景,比如秀场上,一个优雅的女模特拿着这只包,那Bing暂时还做不到,会像前文一样重新根据描述生图。

最近推特上还流行一种DALL·E3的玩法,用来生成一些排列整体的Knolling摄影照片,如下图所示,一个主体周围有许多相关物品环绕,放置在干净的背景上。

X@chaseleantj

想生成类似的图片却不知道怎么写提示词, 没关系,直接问Bing就行了。

创意梗图

AI降低了创作的门槛,可以帮助我们把脑中的奇思妙想画出来,其随机性也扩宽了想象力的边界。因而,创意梗图一直是AI绘图领域的热门类型。

我们来开开脑洞,让Bing画一只巨大的猫咪爬在东方明珠电视塔上。

只有左下的一张比较符合要求,其他东方明珠塔的数量和造型都有些错误,而且猫咪看起来像是动画建模,不太真实。

Midjourney虽然画出了真实的猫,但地点不在东方明珠塔,大小比例也不对。

A giant cat climbing on the Oriental Pearl TV Tower --v5.2

下面我们再画一张最近的热门IP表情包,“Loopy正在上班”。

起初Bing不认识Loopy,理解成了古怪的、疯狂的意思。我们告诉Bing它来自韩国动画片《小企鹅Pororo》之后,Bing表示明白了,却把正在工作的主角换成了企鹅。

看来DALL·E3还缺乏对于最新流行的素材训练。如果换成更经典的IP,那么DALL·E3和Midjourney都能准确表现,并且DALL·E3还配上了文字“假装上班,正在摸鱼”。

A meme of Pikachu working at a computer --v5.2

最近AI绘画还流行一种模仿iPhone拍摄的恐怖照片风格,非常贴合万圣节的氛围,我们试试直接输入这一大段的描述。

提示词:“a picture being taken of a cryptid sighting of [your character] as he runs into the bushes. [your character] has gone completely insane. He turns his head and creepily looks into the camera as he makes his getaway. There's a thick fog, and the scene is dimly lit."

四张图片基本都满足要求,左上的皮卡丘有点怪可爱的。但是同样的提示词,Midjourney就不能完全理解,还是需要转换成“咒语”。

红米k60上市时间和价格

故事书/漫画

在OpenAI官方演示中,ChatGPT可以通过自然的对话生成一只想象中的刺猬,并逐步生成完整的故事情节、绘本和系列贴纸。所以画故事书/漫画的流程被大大缩短了,如果你有一个想法,可以让AI先帮忙扩写故事、描绘场景,然后根据自动生成的提示词画出完整作品。

以丑小鸭变天鹅的故事为例,我们要求Bing把这个过程以儿童绘本的形式画出来。

Bing虽然一口气生成了三个画面,的确有丑小鸭和白天鹅,是儿童绘本的形式,但是前后缺乏逻辑关系,情节呈现不完整,可能还是需要自己按照一个个情节依次引导生成。

Bing还可以重新创作一个新的故事,比如它帮我设想了一个拥有超能力的超级英雄“洋葱侠”,画出了它和邪恶厨师的战斗画面。真别说,故事梗概和画面都挺符合我的想象的,你觉得怎么样呢?

小结

通过以上测评,可以看到DALL·E3在搭载了ChatGPT后,可以完全用自然语言进行交流,在对话中绘图创作,不用复杂的提示工程,简短的提示词就能生成不错的图片,对抽象需求的理解能力也比较强,支持中文。不过文生图仍然是越详细的描述,输出越准确,这一点没有变。

DALLE·3和Midiourney等其他AI绘图产品相比,各有其优劣势:

在使用体验和交互上,DALLE·3的交互式绘图比较直观方便,降低了使用门槛,还能直接读懂大段文字自动作图。Midjourney目前主要在Discord平台上运行,需要在特定的频道里输入描述,不能文字交互。文心一言虽然也可以在网页上通过对话绘图,但缺少上下文理解,不能继续调整,目前一次只能生成一张图。

图源文心一言

在生成图片方面,DALL·E3的优势是能生成较为准确的文本,可能有错误,但其他AI绘画产品目前直接文生图得到的文字都难以辨认,需要借助微调模型上传参考文字再融合。DALL·E3默认生成1024*1024的正方形图片,适用范围较窄,而Midiourney可自定义多种尺寸,其他AI绘图产品基本都支持不同比例。

对于写实风格的图片,DALL·E3生成的人脸和手看起来可能失真,而Midiourney目前V5.2版本已经非常逼真了,Stable Diffusion也有超写实的人像模型。

用嘴指挥别人怎么形容

另外,在Bing上要求修改图片的时候,Bing是根据对话修改提示语再输入DALL·E3进行生成,而不是直接修改已生成的图片,DALL·E3暂时还不能像Midjourney一样快速进行微调,包括扩图、修改局部细节,更不用说Stable Diffusion复杂的参数调整了。所以作为专业创作者的生产力工具而言,DALL·E3的实用性还不够强。

在安全问题上,DALL·E3的内容限制较为严格,拒绝生成涉及公众人物、暴力、成人或仇恨内容的图像,比如要求画一张马斯克在火星上的照片,Bing显示无法创建。

詹姆斯获得得分王

根据OpenAI发布的DALL·E3的22页技术报告,ChatGPT会改写提示,包括删除公众人物的名字、将人物与特定属性联系起来,以及以通用方式书写品牌。OpenAI还开发了图像分类器来检测图像中的存疑内容并阻止模型继续生成。

报告地址:https://cdn.openai.com/papers/DALL_E_3_System_Card.pdf

同时,微软表示,为了保证用户通过Bing Image Creator创建的内容的安全性,已经在生成的图片中内置了,符合C2PA规范的数字水印,包含图片创立日期、出处等信息。人的肉眼无法看见这些水印,但AI能识别出来。

总之,OpenAI的DALL·E3现在加上了理解文字和图像的智慧大脑,我们可以把ChatGPT作为合作伙伴一起头脑风暴进行创作,无论是出于娱乐爱好或者专业需求。AI绘画模型正在不断进化,根据不同的用户需求和适用场景可以选择不同的工具,DALL·E3不会完全替代其他产品,但新的创作方式已经更进一步了。


返回网站首页

本文评论
Netflix《The Playlist》发布预告:一部关于Spotify崛起的剧集「Netflix新剧列表」
Netflix已经发布了《The Playlist》--它即将推出的关于Spotify创建的节目--的官方预告片。这个近两分钟的预告片表明该节目将非常严肃地审视这个流媒体巨头如何建立其帝国。...
日期:09-29
拼多多为什么能在竞争激烈的电商平台中运作成功「电商内卷,我们为何需要拼多多式“天天618”?」
声明:本文来自于微信公众号极点商业(ID:jdsy2020), 作者|刘珊珊,编辑|Cindy,授权转载发布。低价正成为618大促博弈关键,消费者关心问题却变得简单:产品是否真的做到了最低价?618之...
日期:06-14
法拉第未来卖掉总部「法拉第未来:将向贾跃亭交付车辆」
10月7日 消息:昨日晚间,FF(FaradayFuture)宣布,向FF创始人兼首席产品和用户生态官贾跃亭交付FF912.0Futurist Alliance。据悉,贾跃亭的交付共创活动将分为三个阶段。性价比高的投...
日期:10-07
“国庆参加完23场婚礼 我破产了”上热搜:全国份子钱大比拼 广东只要100?
国庆假期尾声已至,许多打工人已经隐隐有了上班前综合征”发作的征兆。很吓人,我感觉还没干什么呢,怎么假期余额就奔着清零去了!”Peakdo60GHz毫米波投屏器到今年,假期还没开始,有...
日期:10-05
没钱的只有我?大批人正在买30万以上高端汽车 今年销量暴增32%_30万汽车排名
快科技7月14日消息,根据乘联会公布的6月份全国乘用车市场深度分析报告现实,大批人正在购买30万以上汽车。三星z flip3续航数据显示,今年1-6月份,超过30万元以上汽车累计零售销量...
日期:07-14
杭州阿里巴巴由122亿减资至1亿 官方回应:系公司正常工商登记变更
最近,杭州阿里巴巴网络科技有限公司发生工商变更,将注册资本从122亿元人民币减少到大约1.05亿元人民币。该公司成立于2018年3月,法定代表人、董事长兼总经理为张勇,淘宝(中国)软件...
日期:04-07
卢伟冰揭秘Redmi Book 14:4000元档四大升级 厂商良心所在_redmibook14二代
快科技5月15日消息,Redmi红米官方今天上午预告了一款新产品Redmi Book14,这是一款轻薄本,号称要重新定义4000元档轻薄本,5月22日发布。在笔记本电脑产品线上,Redmi这两年主推的还...
日期:05-15
Windows 11更新22H2后又遇远程桌面问题 微软正在调查「win10家庭版20h2远程桌面」
Windows 11 2022更新已经在Windows Insider计划中度过了大约一年的时间,允许用户报告尽可能多的错误,以便微软在向公众推送之前进行修复。尽管如此,一些错误还是设法在眼皮子底...
日期:10-09
铁路12306账号内出现陌生人信息?官方最新回应来了_12306里面有其他人信息是什么情况
  【CNMO新闻】9月24日,CNMO注意到,不少网友反映自己的12306平台内出现了陌生乘客的购票出行信息,还无法删除,怀疑自己的信息遭到泄露。有相关媒体从铁路部门了解到,这是由于部...
日期:09-25
普通笔记本电脑功率「笔记本电脑功率」
笔记本电脑的功率是一个非常重要的参数,它直接关系到笔记本电脑的使用体验,同时也会影响到笔记本电脑的性能表现以及耗电情况。在选择笔记本电脑的时候,我们需要了解不同型号之...
日期:05-28
京东集团CEO徐雷:京东是中国人数最多的民企 体系员工数已超过42万
11月9日 消息:在今日的2022世界互联网大会上,京东集团CEO徐雷表示,京东始终重视推动稳定的更大规模的高质量就业,截止2021年底,京东体系员工数已经超过42万,是中国人数最多的民营...
日期:11-17
蔡老板上诉特斯拉 蔡老板特斯拉名誉权纠纷案将二审_特斯拉诉讼案
2月1日 消息:天眼查App显示,车评人蔡甲(蔡老板)与特斯拉(上海)有限公司相关名誉权纠纷案新增开庭公告,二审上诉人为蔡甲,被上诉人为特斯拉(上海)有限公司,相关案件将于2月7日在浙...
日期:02-01
当游戏遇见文化,网易创新传播途径,助力青少年感悟多重魅力
  游戏走进千家万户,有许多孩子从小学、甚至是幼儿园开始就已经在接触游戏,而国内许多游戏所呈现的不光是玩法和机制,世界观设定和剧情的构思在一定程度上也会影响未成年玩...
日期:07-13
小米3g手机多少钱「小米3报价多少钱」
小米3是2013年7月发布的一款智能手机,它是小米公司的旗舰产品之一。小米3的价格取决于配置和版本,以下是一些关于小米3报价的信息。首先,小米3的最初发布价格是1999元人民币。...
日期:05-30
谷歌前员工创办的聊天机器人公司成10亿美元独角兽,仅成立16个月
3 月 24 日消息,据华尔街日报报道,由两名谷歌前员工创办的聊天机器人初创公司 Character.AI 成立仅 16 个月,便已成长为价值 10 亿美元(注:当前约 68.3 亿元人民币)的独角兽公司。...
日期:10-05
任天堂Switch将破3000万台 净利润下降21%_任天堂switch总销量
任天堂的游戏机Switch今年6月在日本市场创下销售新高,售出38万台,同比增长68%,这一成绩主要得益于游戏《塞尔达传说:王国之泪》的推动。 然而,市场分析师预测,Switch游戏机的销量...
日期:07-10
工信部部长肖亚庆同志接受中央纪委国家监委审查调查
工业和信息化部党组书记、部长肖亚庆同志涉嫌违纪违法,目前正在接受中央纪委国家监委审查调查。招行快递优惠中国智能手机用户数量近年来以惊人速度苹果员工买applewatch小米...
日期:07-31
iphone6s推出时间_iPhone6将于明年上半年推出 一波未平一波又起
  北京时间4月19日消息,苹果下一代iPhone5预期秋天才能上市,但是关于iPhone6的传言已经露面。Concord证券分析师郭明池(Ming-ChiKuo)表示,iPhone 6可能会在2012年上半年推出,设...
日期:07-27
OPPO Reno9售价公布:2499元起_oppo renok9
OPPO Reno9手机正式发布,新机有着不错的外观以及独特的工艺,首发共有4款配色,配置也有三款,发布价格如下:8GB+256GB版本售价2499元。12GB+256GB版本售价2699元。12GB+512GB版本...
日期:11-25
特斯拉汽车自燃原因「特斯拉回应ModelY自燃导致多辆豪车被烧:无迹象表明和特斯拉有关」
11月25日 消息:11月24日,上海一位车主反映,他刚买的奔驰大G送到汽车装饰店保养,没开过几次,却被一场大火烧毁。车主称,包括劳斯莱斯、奔驰、迈凯伦、法拉利等品牌在内的十多辆汽...
日期:11-28