您的位置:首页 > 媒体评论

作画bug_改BUG、编故事、绘画 我不如AI

发布时间:2022-12-08 03:03:34  来源:互联网     背景:

写代码、修复BUG、编故事......

作画bug

这些看似只有人类才能完成的任务,都出自同一个聊天机器人之手。

当地时间11月30日,OpenAI发布了一个全新的对话式大规模语言模型ChatGPT。作为GPT-3.5系列的主力模型之一,通过对话的形式,ChatGPT可以回答后续问题、承认错误、挑战不正确的前提并拒绝不适当的请求。

这一模型在开放测试以后,迅速涌入了大批用户,并在社交媒体上晒出自己与ChatGPT的互动。有人用来给自己的猫写诗,有人用来给代码改BUG,还有人问它关于人类的意义......12月5日,OpenAI首席执行官Sam Altman发推表示,OpenAI 训练的大型语言模型ChatGPT于上周三推出,目前已突破100万用户。

甚至于马斯克也为其称赞“ChatGPT非常好。我们离强大到危险的AI不远了。”

之所以ChatGPT能够引起如此大的反响,是因为这一次算法模型的升级让AI的认知智能更上一层台阶,换句话说,现阶段的AI能够对人类意图的理解更为深刻、准确。

让AI更懂人、更像人,一直是技术不断在攻克的难题,而同样作为生成式AI(AIGC)中一员的AI绘画,也因为Diffusion扩散模型的加入,闯入了更多公众的视野。

只需要输入几个关键词,就能获得一幅由AI生成的绘画。今年以来,AI绘画可谓是在社交媒体上赚足了眼球,从年初Disco Diffusion的流行,再到8月,由AI绘画程序Midjourney生成的《太空歌剧院》获奖,Stable Diffusion扩散模型的使用,让AI绘画在图像细节的处理上更为出色。

如果将ChatGPT和Stable Diffusion模型两者进行“强强联合”,便能够让模型更懂创作者的需求。一方面,利用ChatGPT强大的语言理解能力生成文本描述,另一方面,扩散模型能够最大程度保持图像的细节,既保留了图像中的语义结构,又能够生成高质量的AI绘画作品,“甲方爸爸”看了都直呼满意。

无论是ChatGPT还是Diffusion扩散模型,一个作为多轮对话模型,一个作为辅助多模态生成的模型,都让AI的能力从“机械执行”,进阶到“创造性”,这也意味着AIGC迎来了一个新的发展阶段。

荣耀magic3与小米mix4销量

“我不如AI”,在多久后会成为现实?

生成式AI到底有多牛?

AI给你改BUG、编故事,是一种什么体验?

“帮我以鲁迅的文笔写一段话,表达一下我现在因为疫情连门都不敢出的惨状,还有想吃火锅的心情”,有网友在ChatGPT中输入一段自己的需求。几秒钟后,ChatGPT就给出了一篇质量颇高的小作文。

除了让它写小作文以外,它还拥有解决数学、逻辑和编程问题的能力,有网友直呼:妈妈以后再也不用担心我的作业不会做了!

与此同时,ChatGPT还能根据用户提出的调整建议不停地对回答内容进行修改,同时也能对不恰当的假设和要求提出挑战和拒绝。

一改AI智障的面孔,能让聊天机器人如此优秀,ChatGPT究竟有哪些创新?

2020年,OpenAI推出自然语言模型GPT-3,这是ChatGPT的上上一代产品,其在总结和简化文本方面表现出强大的能力,甚至还在《卫报》上公开发表过专栏文章,一时间引起了不小的轰动。

两年过去,就在众人对GPT-4翘首以盼的时候,OpenAI在今年年初出其不意地先推出了GPT-3.5,并训练了InstructGPT模型,能够帮助GPT-3输出的结果更为准确。

而ChatGPT则是InstructGPT的兄弟模型,同属于GPT-3.5。虽然ChatGPT目前仍然处于测试阶段,并且还没有真正联网,但已经展现出了足够惊艳的性能。

黑莓公司现状

这次ChatGPT的走红,除了有社交媒体裂变优势的助力以外,很重要的一个原因还是其跟上一代的GPT-3相比,在生成内容的效果上有了两方面的显著提升:一是有记忆功能,可以实现连续对话;二是能够更好的理解和完成人类的指令。

在对于人类指令的理解和执行上,可以发现,ChatGPT生成的结果在尽可能地贴合人类的意图和期望,而GPT-3更像是设定好的套路模版。比如说同一个指令“写一首简短的关于青蛙的诗歌”,右边ChatGPT的可读性明显要更强。

对比下来,GPT-3的局限性在于不擅长逻辑的推理和决策,而在ChatGPT中,结果的反馈也成为了学习过程的一部分,实现了在认知智能层面上的提升。这一次ChatGPT的推出,大概率也是为了能够收集更多的用户数据反馈,以饲养模型,让AI更懂人类。

事实上,对于人类意图的理解一直都是AI难以横跨的一道坎。

就拿同样火热的AI绘画为例,能够出圈的一大原因是因为生成的作品“翻车”太厉害。把宠物识别成人,把人物识别成建筑...画风开始偏离,诸如此类的乌龙开始频繁出现。

图片来源于网络,如有版权问题请联系我们

对于一些简单的人物和环境都无法准确识别、理解,更别提具有复杂意象的诗歌了。在某个AI绘画产品中,光锥智能输入“醉后不知天在水,满船清梦压星河”后,生成的结果也跟诗歌意境相差甚远。

作画bug

不难发现,在AI绘画爆火背后,大多数软件对于如何保证准确的语义理解和图片生成能力的敏感度并不算高。

现阶段AI绘画的槽点虽然很多,但进步却是毋庸置疑的。据一位二次元画师透露,在今年年初的时候,圈子里的人对于AI绘画的印象还是“生成速度慢”“生成质量差”,但谁也没想到AI能够在短短几个月时间进步神速。特别是今年8月,AI绘画作品《太空歌剧院》的获奖,更是让大家炸开了锅,“从来没感觉到自己离失业那么近。”二次元画师小元(化名)说道。

算法的迭代之路

从“人工智障”到“人工智能”,背后是算法模型的几次大幅迭代。

从最早基于手写规则的简单学习,到神经网络的诞生,AI开始像人脑一样学习,开始尝试大量数据。

图片来自真格基金分享

直到2017年,谷歌首次提出了Transform模型,取代了此前的CNN和RNN两种神经网络学习方式,这一模型的核心在于注意力机制,让AI在学习的过程中关注重点而非全部,大大降低了模型训练所需的时间。Transform模型问世以后,很长一段时间里都是机器翻译领域的主流模型。

而将Transform模型拆开来看,可以分成编码器和解码器两个部分,编码器负责把自然语言序列转化成数学表达,而解码器则是负责把数学表达再转化为自然语言序列,即我们日常能够看得懂的语言。

OpenAI的自然语言模型GPT就是属于后者。

图片来自真格基金分享

从2018年推出了GPT-1之后,该自然语言模型系列一共经历了3次迭代。相较于GPT-1,GPT-2并没有太多结构上创新,只是数据更多了,参数从原来1.17亿增加到了15亿。而在GPT-3上,OpenAI再一次加大了对于数据量的投入,训练参数直接达到了1750亿个,上千亿的参数和更类人的智能也让其成为了自然语言模型里程碑式的产物。

到了今天的主角ChatGPT,再一次颠覆了“AI究竟能够多像人类”的认知。

上文提到,ChatGPT现在更能理解人类的指令和意图,根本原因在于ChatGPT和InstructGPT都加入了“从人类反馈中强化学习”的训练方式。

相比于原来训练标注师单纯输入固定的结果模版,这种训练方式加入了人类有可能对于结果的反馈,并将不同的结果进行排序,通过奖励模型让AI不断地在人类的反馈中迭代、调整,这样一来,提前让ChatGPT与有可能的反馈产生交互,使得最后生成更符合人类指令或者意图的答案。

值得一提的是,虽然是兄弟模型,但InstructGPT无法判断人类下达的指令是否是不正当的,仍然存在一些“毒性”,而优化过后的ChatGPT则能够意识到这一点,敢于质疑不正确的前提。

在算法模型的不断迭代下,加上数据量不断提升,“AI越来越聪明,也越来越努力。”

同样,AI绘画能够在今年爆火,也是因为底层技术实现了重大突破。

从识别用户输入的文字语义,再到生成一幅AI绘画作品,这其中的难点之一在于AI需要实现从文字到图像的跨模态生成。

让我们先把时间拨回2014年。彼时,GAN对抗生成网络的提出标志着AI图像生成迈出了关键一步,但遗憾的是,GAN生成的结果可控性差、图像分辨率较低、不能实现文字和图像之间的跨模态生成。

因此,CLIP模型出现了。2021年,OpenAI提出了基于NLP(自然语言理解)和CV(计算机视觉)的多模态预训练算法CLIP,可以将CLIP模型简单地理解为不同模态之间架起的一座桥梁。

不过,真正引爆AI绘画的,还是Diffusion扩散模型的应用。

扩散模型就是一种生成图像的方法,在正扩散过程中,给图像添加噪声,让图像变成了一堆随机的噪声,然后通过逆扩散给图像去噪,学习图像是如何生成的,相当于让AI换了一种学习画画的方式。

伴随着今年Stability AI对扩散模型的改进之后,模型的计算降低了对算力的要求和对内存的消耗,从前动辄半天、一天的生成速度已经快进到秒级别,这也是为什么在Stable Diffusion开源以后,AI绘画能够迅速在C端走红的原因。

目前的AIGC已经能够实现文字、图像、音频以及视频等多领域、跨模态的内容生成。

产品经理日常使用的交互原型工具有哪些特点

招商证券认为,得益于深度学习模型的不断完善、开源模式的推动以及数字内容供给需求的不断增长,AIGC将会呈现指数级的发展增速。在技术加持下,一场AIGC的变革正在酝酿。

寻找技术和商业化的交点

生成式AI的进步不断地给人以惊喜,在应用层,应该如何寻找技术和商业化的交点?

近日,ChatGPT的火爆之余,马斯克在推特上也对ChatGPT提出了关键性的问题:每次对话的平均费用是多少?

而OpenAI首席执行官Sam Altman给出的回复是“每次对话的平均费用可能只有几美分”,正试图找出更精确的测量方法并压缩费用。

类似于ChatGPT这样的对话式AI产品,最早出现在2016年。随着技术的发展,近些年来也被广泛运用在AI客服、虚拟数字人和电话营销等领域。不过,从效果上看,这些产品仍然不够智能,此前中国联通的AI客服冒充人工,还被用户识破发到网上调侃了一番。

此次ChatGPT的出现,不仅仅带来了技术的关键性变革,也让对话式AI产品的商业化前景变得更加清晰。

而相较于ChatGPT,AI绘画的商业化则走在更前面。

量子位智库发布的报告认为,多模态能力的提升将成为AI真正实现认知智能和决策智能的关键转折点,在未来1-2年,“文字-图像”的生成将快速落地。

从海外市场的情况来看,不仅有谷歌、Meta、微软等科技巨头跑步入场,随着Stable Diffusion的开源,一大批初创企业也如雨后春笋般涌现。

再看国内的情况,百度较早地嗅到了AI绘画的机会,在今年8月就发布了基于其飞桨、文心大模型的AI绘画软件文心一格,而初创企业里,也有盗梦师、TIAMAT、达利AI、6pen等公司开始冒尖。

现阶段AI绘画仍然处于大量投入的早期阶段,商业模式仍然在探索中。

就拿这次在C端爆火的众多AI绘画软件来看,光锥智能了解到,意间AI绘画是积分制,初始积分是20,当积分消耗完毕后可以通过观看广告视频来继续获取积分;盗梦师、6pen以及百度的文心一格都是免费生成一定数量的作品之后,按量进行收费。

总的来看,目前国内的AI绘画软件变现模式单一,且C端的用户大多数只是出于好奇心的尝试,愿意付费的仍是少数。根据6pen的调研,60%的用户从未在AI绘画产品上有过付费行为,剩下40%的用户中,付费超过100元占比仅10%。

C端的付费意愿并不高,因此,诸如工业设计、游戏制作等B端场景或许会成为AI绘画未来的一个重要落地方向。

值得注意的是,AI绘画如果真的在不久的将来实现大规模商业化落地,那么内容生产方式的变革也会进一步加速。

光锥智能向盗梦师的To B产品负责人李庆功了解到,过去专业设计师大多使用的都是PS这类的工具,但目前盗梦师已经在尝试研发面向专业生产场景的AI生成工具,这种全新的创作交互方式不仅能够让AI来执行设计流程,甚至于连设计师的灵感都可以由AI来提供。

这就意味着,跟原先被AI替代的单一、重复工种一样,AI绘画的出现也会替代掉一部分的工作。谁会成为下一个被替代的?

结语

当我们在谈论AI时,我们究竟是在谈论什么?

从AI诞生之日起,它的任务就是要进一步解放生产力。顺着AI发展的脉络来看,通过不断模拟人脑的思考过程,AI逐渐具有了对数据和语言的理解、推理、解释、归纳、演绎的能力,越来越像一个人类。

当然,目前的AI对于人脑的探索远远未触及核心情感层,但我们不得不承认,AI正在酝酿着一场生产力的变革,而这必然会引起新一轮人类价值的转移。

回顾人类历史,每一次生产力变革的背后,技术都在不断地将人类从单一、繁重、重复的劳动中解放出来。从体力劳动开始,到脑力劳动,在这一过程当中,人类的劳动形式逐渐发生改变,并依次叠加。而伴随着AI往更高阶的智能进发的同时,另外一种劳动形式也顺势出现。

借用知乎上一位答主的话,那就是想象力劳动。

区别于脑力劳动,想象力劳动的核心在于灵感和创意的提供。

上文提到,ChatGPT能够根据人类简短的指令生成代码、编写故事,AI绘画也能够识别关键词的语义进行创作,本质上AI正在承担并且有能力承担一部分的人类劳动。因此,人类已经无需去思考其中的过程,只需要给AI提出问题、把自己的灵感告诉AI即可。

作画bug

也正因为AI天然具有根据指令执行的机械思维,所以AI无法真正理解人的情感和多样性,即使AI可以替代程序员写代码、替代作家写故事,但是它所有的灵感来源依旧要从人类那里获得。

英伟达gtc大会2021

根据传播学者梅尼赛的研究,技术进步之后,引发社会变革的途径之一就是创造新机会和产生新问题,前者引发产业结构和社会结构的变化,而后者推动新制度的转型。

AI作为新一代科技革命技术,它的进步也在不断反推人类去思考,我们的新问题、新机会在哪儿。


返回网站首页

本文评论
马斯克推特消息_马斯克收购推特第一件大事,是把那个男人请回来?
许多人都被一张叫“川普祝贺马斯克收购推特”的声明刷屏了。这是从外网传起的截图,一路火到了中文朋友圈。内容写着,“川普表示,他将于下周一重返推特”。很多国外名人也纷纷转...
日期:11-01
苹果推送iOS 16.2正式版_苹果正式发布iOS 14.6
  今天凌晨,苹果正式向iPhone用户推送了iOS 16.2正式版,带来了一大批的新功能。  本次版本号与上周的RC版完全相同,也就是说各方面功能基本保持不变。  隔空投送10分钟限...
日期:12-15
特斯拉电动重卡终于投产 马斯克不敢再等_特斯拉电动汽车马斯克
亮相5年之后,特斯拉的纯电卡车Semi Truck(下称Semi)终于要投产了。10月6日,马斯克在推特上发文称,Semi将于今年12月1日交付给百事可乐。在百事加州工厂园区内,已经有若干个特斯拉M...
日期:10-12
寺库向下,新投资能救场吗?_寺库 投资
9月15日上午,子怡接到了寺库客服来电,称“预计在12月底之前完成退款”。此前,她于今年3月在寺库平台先后下了两单,却迟迟未能发货,取消订单也不予退款,长达4个月的投诉维权后仍需...
日期:09-24
双11第14年了,电商购物节还“灵”吗?_双11干脆叫购物节得了
记者 | 李叙瑾编辑 | 倪 妮11月12日凌晨,今年的双11正式收官。从2009年诞生至今,双11战报中最受关注的就是各大电商平台的交易总额GMV,但这个数字在今年消失了。天猫、京东和抖...
日期:11-17
2022回头看:互联网大厂组织架构调整盘点「互联网大厂管理」
出品|三言Pro 作者|DorAemon‍‍‍‍‍‍‍‍‍‍‍‍‍2022年马上就要结束,这一年,想必对我们每一个人说,相比往年更加记忆犹新。普通人如此,那些互联网公司亦是如此。每年,各个公...
日期:01-01
抖音最火蛋糕_火不过三秒,抖音山寨男团动了谁的“蛋糕”?
撰文|大可编辑|纪南成名于“山寨”,走红于土味,前段时间,山寨男团ESO频繁登上热搜,在社交平台上引发了不小的争议。ESO凭着“撞脸”明星的短视频表演在抖音出圈,其成员包括“鹿哈”...
日期:09-16
回港上市能“治好”腾讯音乐的竞争“焦虑”吗?「腾讯音乐股价会涨吗」
200万摄像机h.265存储空间文|第七笔画来源|博望财经在诞生的第六年,纽交所上市的第四年,腾讯音乐决定回归港股。2022年9月15日,腾讯音乐发布公告称,将以介绍方式于香港联合交易...
日期:09-24
5G芯片新战场 高通与联发科盯上了你的车_国产手机5g芯片都是联发科
近日,一则消息的传出再次引起了大家对联发科的关注,作为全球数得上名字的半导体企业,联发科在最近半年时间确实有些低调,就在大家猜测联发科是否在酝酿新的手机旗舰芯片时,台湾工...
日期:10-04
国产App最烦人的操作 又卷土重来了「国产app全是流氓」
坏了,恶心人的骚操作又回来了。说起手机广告,大家应该都很熟悉了,这几乎是国产应用生态下的一大特色。首先是国内的厂商们,会给自家的安卓定制UI增加一些系统App和广告。为了不...
日期:11-05
奈雪改名,换个马甲就成国潮了?_奈雪改名,换个马甲就成国潮了吧
文|孙美娜编辑|顾彦美国营销大师艾尔·里斯和杰克·特劳特在他们的著作《定位》中说过:“名称是把品牌吊在潜在顾客心智中产品阶梯的挂钩。在定位时代中,你要做的最重要的营销决...
日期:12-08
布洛芬原料药涨价_布洛芬都炒到3千块了,药企赚翻了么?
不知道最近各位差友们,有没有备足药物。反正差评君天天都在看直播节目抢购物资。而这里头最难抢的,无疑就是现在的硬通货,以布洛芬为代表的退烧药了。从 12 月 7 日《 新冠病毒...
日期:12-26
台湾为什么造不好电动车?_台湾电动车为什么这么多
7年前,马斯克为了炫耀自家工厂,略带几分不屑地踩了一脚富士康:“相比手机,汽车工业非常复杂,你总不能去找富士康这样的供应商,告诉他‘给我造辆车’。”马斯克怎么也没想到,自己的...
日期:10-31
欧洲,跟李斌想象中不太一样
在德国时间 10 月 7 日的 NIO Berlin 2022 活动现场,虎嗅记者对一位有宝马集团工作经验的德国媒体人进行采访,对方表示:我非常理解为何中国消费者越来越不喜欢德国豪华车,因为宝...
日期:10-11
银行倒闭的可能性_为啥要救倒闭的银行?现在的诺奖得主40年前就给出了答案
前两天,本 · 伯南克( Ben S.Bernanke ),道格拉斯 · 戴蒙德( Douglas W.Diamond )和菲利普 · 戴布维格( Philip H.Dybvig )三个人共同夺得今年的诺贝尔经济学奖。根据官方说明,这次...
日期:10-18
格力核心经销商倒戈 董明珠回应_格力集团董事长董明珠
原标题:格力核心经销商倒戈 董明珠回应:不志同道合的人离开正常药品网购安全吗10月13日消息,据老板联播报道,今年以来,核心经销商“倒戈”事件频频将格力电器推上风口浪尖。车险...
日期:10-18
芯片制裁华为_谈谈芯片制裁
作者:曾航这几天因为美国新一轮对中国的科技制裁,导致A股半导体和科技板块出现暴跌,一时间各种消息满天飞,产业界人心惶惶。这次的制裁和打击力度是空前的,已经有很多文章展开分...
日期:10-17
人人都能用的“AI 作画”,要成为英伟达的杀手锏?_ai绘画
如果说2021年是“元宇宙”的元年,那么2022年或许就是“AI作画”的元年。稍微对互联网热点有所关注的人都不难发现,最近,“AI作画”产出的作品似乎已经成了一股互联网风潮。这些...
日期:10-28
手机里的微信群 都在变成DAO_如何把手机的微信群转到另一个手机中
叮咚,微信提醒又收到了一个群公告:“邀请全体成员参与投票”。这已经是本周我收到的第三个来自群组的投票邀请,而这些微信群都有一个共同点,它们群名的后缀都有着同样的一个单词...
日期:08-20
网易云音乐推出音乐社交应用MUS,用音乐认识知己「网易云音乐 音乐应用」
  【ITBEAR科技资讯】6月29日消息,近日,网易云音乐推出了一款主打音乐社交的APP——MUS,为“Music with us”的缩写,宣传slogan为“音乐连接你我”,目前该应用正处于邀请内测...
日期:04-02