您的位置:首页 > IT热点资讯

ChatGPT的前世今生:风靡全网的“最强AI”是如何做到这一切的?

发布时间:2022-12-13 14:09:13  来源:互联网     背景:

  记者/李京亚 姜菁玲

接入matter的智能家居品牌

  编辑/宋佳楠

  在美剧《硅谷》中,曾有这样一幕有趣的剧情:程序员Gilfoyle用AI聊天软件“安东之子”捉弄他的好友Dinesh。该软件能模拟独属于Gilfoyle的闷骚幽默,让Dinesh误以为是在与Gilfoyle本人聊天。发现真相后,同为程序员的Dinesh也做了一个AI机器人用来报复Gilfoyle。结果,两个AI机器人热聊了起来,还把网络给聊崩了……

  这样的场景已经走入现实。美国人工智能实验室OpenAI推出的语言模型系统GPT-3就曾构建出两个人工智能之间的对话,谈论如何成为人类,令看客大呼脊背发凉。

  但OpenAI并未止步于此,而是将GPT-3进化为最近风靡全网的ChatGPT,后者不仅在大量网友的“疯狂”测试中表现出各种惊人的能力,如流畅对答、写代码、写剧本、辩证分析问题、纠错等等,甚至让记者编辑、程序员等从业者都感受到了威胁,更不乏其将取代谷歌搜索引擎之说。

  作为OpenAI的幕后老板,尚在主导推特变革的马斯克也公开表达了对ChatGPT的力挺,认为“我们离强大到危险的AI不远了。”

  全球用户争相晒出自己极具创意的与ChatGPT交流的成果。一位网友要求ChatGPT用《坎特伯雷故事集》风格改写90年代热门歌曲《Baby Got Back》;有网友晒出ChatGPT参加美国高考SAT考试之后的得分:1020(总分1600分);亦有网友收获了ChatGPT用《老友记》几大主角口吻创作的剧本对白。

  据OpenAI的CEO,硅谷著名投资人山姆·奥特曼(Sam Altman)透露,自11月30日至12月5日,ChatGPT的用户数量已突破100万。由于太过火爆,OpenAI不得不暂时关闭了用户的测试入驻窗口。

  可以说,继AlphaGo击败李世石、AI绘画大火之后,ChatGPT开启了人工智能对人类社会产生深远影响的又一扇窗。不禁让人好奇,它究竟是怎么做到的?

  为何是ChatGPT?

  如果用一句话来说明ChatGPT是什么,可以将它理解为由AI驱动的聊天机器人。

  外界往往认为语言学领域是人工智能派上用场的绝佳地带,而事实并非如此。截至目前,人工智能还没有找到征服语言领域的暗门,即使是谷歌、苹果这样的顶级科技公司,都面临着相关AI研究成果派不上用场的苦恼。

  尚处在免费试用阶段的ChatGPT,关注度短短几天扩大到燎原之势,正是因为人们从中看到了人工智能和语言本体之间的真正接口。

  那么,ChatGPT采取了什么方式达到了如此惊艳的效果呢?为何苹果的Siri至今无法生成一篇学术论文,亚马逊的Alexa无法吟出一首莎士比亚十四行诗呢?

  过去十年间,谷歌、 Facebook、亚马逊、苹果和微软等硅谷科技巨头纷纷开启AI军备竞赛,先后成立专门的AI实验室,而最终业界公认的做纯AI研究的顶级实验室只有三家:背靠谷歌的DeepMind、背靠微软的OpenAI和背靠Facebook的FAIR。其中,被谷歌收购的DeepMind因拥有AlphaGo最为家喻户晓。

  OpenAI在2015年底创立于旧金山,其联合创始人是马斯克以及硅谷知名孵化器Y Combinator的前掌门人奥特曼。不过,近年马斯克多以OpenAI的出资人角色出现,奥特曼才是这家公司的主导者和现任CEO。

  不到五年时间,OpenAI就依靠GPT3跃升为全球AI领域顶级公司,与DeepMind并称AI圈的“双子星”。事实上,Meta的Fair实验室也一直在自然语言处理和对话型AI领域深耕,但其成果以发表论文为主,显得较为低调。今年6月,大举向元宇宙转型的Meta决定AI部门不再“集中化研究”,而是分布式下放,以便与实际业务结合,导致Fair的前途并不明朗。

  OpenAI足以与AlphaGo一战的“武器”正是GPT3,这个2020年推出的巨型语言处理模型怪兽,可以完成诸如答题、写论文、文本摘要、语言翻译和生成代码等壮举,其诞生被视作人工智能竞赛的里程碑事件。

  ChatGPT的前世今生

  如果梳理OpenAI的GPT(Generative Pre-trained Transformer)系列技术路线,可以探寻出OpenAI的布局思路。

  OpenAI最初提出的GPT1,采取的是生成式预训练Transform模型(一种采用自注意力机制的深度学习模型),此后整个GPT系列都贯彻了这一谷歌2017年提出,经由OpenAI改造的伟大创新范式。

  简要来说,GPT1的方法包含预训练和微调两个阶段,预训练遵循的是语言模型的目标,微调过程遵循的是文本生成任务的目的。

  2019年,OpenAI继续提出GPT-2,所适用的任务开始锁定在语言模型。GPT2拥有和GPT1一样的模型结构,但得益于更高的数据质量和更大的数据规模,GPT-2有了惊人的生成能力。不过,其在接受音乐和讲故事等专业领域任务时表现很不好。

  2020年的GPT3将GPT模型提升到全新的高度,其训练参数是GPT-2的10倍以上,技术路线上则去掉了初代GPT的微调步骤,直接输入自然语言当作指示,给GPT训练读过文字和句子后可接续问题的能力,同时包含了更为广泛的主题。

  现在的ChatGPT则是由效果比GPT3更强大的GPT-3.5系列模型提供支持,这些模型使用微软Azure AI超级计算基础设施上的文本和代码数据进行训练。

  具体来说,ChatGPT在一个开源数据集上进行训练,训练参数也是前代GPT3的10倍以上,还多引入了两项功能:人工标注数据和强化学习,相当于拿回了被GPT3去掉的微调步骤,实现了在与人类互动时从反馈中强化学习。

  也因此,我们得以看到一个强大的ChatGPT:能理解人类不同指令的含义,会甄别高水准答案,能处理多元化的主题任务,既可以回答用户后续问题,也可以质疑错误问题和拒绝不适当的请求。

  当初,GPT-3只能预测给定单词串后面的文字,而ChatGPT可以用更接近人类的思考方式参与用户的查询过程,可以根据上下文和语境,提供恰当的回答,并模拟多种人类情绪和语气,还改掉了GPT-3的回答中看似通顺,但脱离实际的毛病。

  不仅如此,ChatGPT能参与到更海量的话题中来,更好的进行连续对话,有上佳的模仿能力,具备一定程度的逻辑和常识,在学术圈和科技圈人士看来时常显得博学而专业,而这些都是GPT-3所无法达到的。

  尽管目前ChatGPT还存在很多语言模型中常见的局限性和不准确问题,但毋庸置疑的是,其在语言识别、判断和交互层面存在巨大优势。同属于生成式AI范畴,ChatGPT在速度上已经比DeepMind研究人员提出的聊天机器人Sparrow(麻雀)模型领先一步。

  有分析指出,OpenAI一直坚定不移的只用自然文本的上文来训练模型推动了GPT3到ChatGPT的成果,其顺应了人类思考的逻辑,最终由量变推动了质变。

  商业模式的通路与障碍

  不少人已经注意到,ChatGPT的能力已经涉及到AI模型之间的合作:一位网友要求ChatGPT写一个描述女孩的文案,然后用ChatGPT生成的文案画出了女孩的图像。

  除了GPT系列之外,OpenAI其实另有一条多模态领域研究支线闻名于世,即今年发布的明星产品——人工智能图像生成器DALL-E2。以DaLL E2为代表的Diffusion Model(扩散模型)几乎完成了此前爆火的AIGC(人工智能生成内容)领域的“大一统”,为AI绘画树立了全新标杆。

  顶级技术能力之外,OpenAI能抢在谷歌和Meta之前重新书写AIGC版图,与其精细化的布局相关。

  OpenAI月内的两笔收购都切中AIGC的增长点交叉地带,一桩投给了音频转录编辑器Descript ,一桩落子在AI笔记应用Mem。前者的处理场景刚好是文本、图片、音频以及视频,后者的技术底座是Transfomer模型,与ChatGPT同源。也就是说,OpenAI在打造自身处理下游任务的能力的同时,也在寻觅能承载下游任务的容器。

  OpenAI的研究领域包括机器学习、自然语言处理和强化学习,其能在短短几年间迅速崛起,与创始人奥特曼对AI的创意性理解力密切相关:“十年前的传统观点认为,人工智能首先会影响体力劳动,然后是认知劳动,再然后,也许有一天可以做创造性的工作。现在看起来,它会以相反的顺序进行。”

  在YC,奥特曼以激进大胆的投资风格著称,因其秉承直击腹地的简洁思维,备受创业者青睐。YC曾有创始人称奥特曼为“创业公司的尤达大师”(《星球大战》中的绝地武士导师)。

  这位CEO还有着实事求是的性情,当外界对GPT-3的能力发出铺天盖地的赞美时,他反而说“GPT-3被吹捧得太过了”。此后GPT-3在一系列问答中闹出笑话、表现不佳,也印证了他的说法。

  但奥特曼的冷静挡不住幕后金主马斯克对ChatGPT抱持的极大热情,他十分关注ChatGPT的商业化前景,并在推特上向奥特曼提问,“ChatGPT每回答一个问题的成本是多少?”奥特曼则如实地答道:“每次对话的平均费用可能只有几美分,我们正试图找出更精确的测量方法并压缩费用。”

董明珠评价小米贴牌

  实际上,谷歌和Meta等巨头目前都尚未将生成式AI领域的研究能力转化为商业化部署,作为创业公司的OpenAI却做了不少尝试。

  这家公司曾希望通过API(应用编程接口)方式来推动GPT-3的技术商业化,在2020年6月就开放了GPT-3的API接口,并曾与十余家公司展开过初步的商用测试,但由于GPT-3的功能并不完善未见成效。曾有传言称OpenAI为GPT3投入了至少1000万美元,为了摆脱入不敷出的窘境,才将GPT3作为一项付费服务来推广。

  据虎嗅报道,Facebook改名为Meta之后,Meta AI实验室在5月宣布开放自己的语言大模型OPT(预训练变换模型),而OPT一直对标OpenAI的GPT3。与之类似,硅谷大厂内部都有对标GPT3的产品,只是因为大厂都是关起门来做私密研究,因而不为外界所知。

  某种程度上,ChatGPT采取免费试用是OpenAI准备继续打磨这款产品的信号,用户给予的反馈会帮助该模型吸取足够的信息量,从而作出更恰当的反应。

  从GPT-3开始,ChatGPT及尚未出炉的GPT-4都面临训练成本过大的问题。有分析指出,是否收费是个两难决策:如果继续免费,OpenAI会无法承受,但收费又会极大减少用户基数。倘若训练成本能大幅下降,则两难自解。

  此外,GPT-3历经两年商业化尝试,并未“如愿”取代记者编辑或码农的职业生涯,OpenAI也从中发现,将GPT系列作为辅助生产力工具对商业化更为合适。此前业内传言微软对这家公司的新一轮注资即将落地,届时其估值预计超过200亿美元,商业化也必将提上日程。到那时,OpenAI可以倚仗的大概率是ChatGPT,或者是通过了图灵测试的GPT4。

  一片叫好声中,也不乏有人泼来冷水——程序员首选问答社区Stack Overflow日前便宣布,禁止用户复制ChatGPT的答案来回答其它用户的问题,理由是ChatGPT的答案正确比率太低,日后待社区讨论后再作出解禁决定。

  此举立刻引发了业界普遍关注,仿佛是对ChatGPT编程价值的彻底否定。与此同时,人工智能界的专家们也在激辩这些大型语言模型可能带来的负面效应,比如Meta的首席人工智能科学家Yann LeCun认为,虽然它们会有错误信息和不良输出,但并不会使文本的实际分享变得容易,而后者才是造成危害的真正原因。但也有人反驳称,这些语言系统的廉价文本生成能力必然会增加其后被分享的风险。

  而在OpenAI内部,一年半前曾遭遇核心员工集体出走,创办了一家名为Anthropic的新公司,致力于提高AI安全和可解释性,目前筹资已超过7亿美元,业内亦有声音认为,这支“AI叛逆者联盟”说不定会是另一个OpenAI。


返回网站首页

本文评论
线上拼图小程序_超拼科技一文读懂如何做一个小程序商城?大概需要多少钱?
超拼科技一文读懂如何做一个小程序商城?大概需要多少钱?很多商家企业的客户都在微信上,所以都想做一个微信小程序商城给客户在线浏览和下单,那么来说一下小程序商城的制作教程,希...
日期:07-22
ipad2020是实体home键吗_iPad 10渲染图抢先看:配备实体Home键 价格可能会涨
今日晚间,AppleInsider基于之前曝光的CAD图绘制了iPad 10渲染图。如图所示,iPad 10采用了直角中框设计,保留了实体Home键,这颗按键集成了Touch ID功能。AppleInsider指出,iPad 10...
日期:08-13
11月乘用车销量现同、环比双降 自主品牌累计批发份额首达50%「3月乘用车销量104.5万辆,车市跌幅收窄」
  经济观察报  周菊  12月8日,乘用车市场信息联席会(简称:乘联会)发布了国内11月乘用车销售情况。  数据显示,2022年11月乘用车市场零售164.9万辆,同比下降9.2%,环比下降10...
日期:12-13
美国登月火箭爆炸是什么号?_美国登月火箭“下台”避飓风 年内三次推迟发射
  为了避免即将到来的飓风“伊恩”造成破坏,当地时间9月26日深夜,美国宇航局将登月火箭“太空发射系统”从发射台上撤下。这是今年以来,美国宇航局第三次推迟登月火箭的发射...
日期:09-29
3499元起!荣耀80 Pro开启预售:首搭高通旗舰芯+1.5K屏「荣耀50起售价2699元,搭载高通骁龙778G芯片」
临近年底,各大手机厂商也开启了最后一波冲刺,除了顶级旗舰,不少中端机型也十分抢眼。就在11月23日,荣耀推出了全新的数字系列机型——荣耀80系列,包括荣耀80和荣耀80 Pro两款,搭载...
日期:11-27
2020年全球笔记本电脑出货量_TrendForce:预估2023年全球笔记本电脑出货量仅1.76亿台
11月2日消息:TrendForce集邦咨询表示,2022年第四季全球笔电出货量将下滑至4290万台,环比下降7.2%,同比下降高达32.3%,低于疫情前同期水平。搜狗输入法平板模式为什么要让家长选...
日期:11-09
三星手机电池极易鼓包引发老外集体吐槽:别的牌子很少见到_三星电池鼓包很常见吗
  新酷产品第一时间免费试玩,还有众多优质达人分享独到生活经验,快来新浪众测,体验各领域最前沿、最有趣、最好玩的产品吧~!下载客户端还能获得专享福利哦!安卓13什么时候发布...
日期:10-09
宁德时代和它的敌人们
头图来源 | 视觉中国  作者 |;苏鹏;编辑;|;王妍  来源:36氪  “动力电池成本已经占到汽车的40%-60%,那我现在不是在给宁德时代打工吗?”不久前在一场活动上,广汽集团董事...
日期:09-16
PopSockets推出iPhone 14环保手机壳 采用植物基聚合物材料打造
作为一家手机壳制造商,PopSocket 刚刚扩充了旗下 iPhone 14 配件产品线的阵容,并且提供了 MagSafe 与背夹钱包 / 电池等选项。如果你想要改善手机的握持手感、或更轻松在摆放...
日期:09-10
经济日报:平台使用大数据应更谨慎「经济运行大数据平台」
  对平台企业来说,比起被动应对消费者爆料带来一次次舆情危机,倒不如主动聚焦如何改进自身服务以消除消费者疑虑,提升消费者信任感和忠诚度。放下大数据“杀熟”的刀,也许反而...
日期:09-14
你的“电动爹”,这个国庆又又又趴窝了吗「电动爹再见」
  虎嗅  每个长假电动汽车都会准时上演的传统艺能,今年也没有缺席。  今年国庆假期刚开始,一位“尊贵的特斯拉车主”就分享了他的返乡故事:从深圳开特斯拉回湖南永州老家...
日期:10-22
稳定服役两年半后 Linux之父的AMD电脑挂了:意外牵出Intel恩怨_intel干不过amd
如果下一个Linux Kernel版本延期,那么不要太惊讶,因为Linux之父Linus Torvalds的电脑坏了。出问题的不是AMD线程撕裂者处理器,而是ECC内存。Torvalds说,自己已经装完机稳定运行...
日期:10-12
30秒就能看血压!Amazfit 跃我 GTR 4评测:千元全能智能手表首选「amazfit gtr智能手表怎么样」
一、前言:血压不容小觑 Amazfit跃我新品给你带来全面的健康功能如今的智能手表市场,同质化越来越严重,各个品牌都开始推出创新的功能,例如独立导航、车机互联等。一直以科技连接...
日期:09-20
5000元猫砂盆,收割上亿铲屎官?「一个猫砂盆多少元」
被各种商家营销套路侵害权益?买到的商品出故障投诉无门? 黑猫投诉平台全天候帮您解决消费难题【消费遇纠纷,就上黑猫投诉】   划重点:  1、在上亿养宠人群的需求下,宠物电器...
日期:10-23
88vip即将上线_或将接入88VIP?腾讯视频:暂无计划
  近日,有关“88VIP双十一前或将接入腾讯视频会员”的消息引发关注。钓鱼链接被骗华为mate50 pro5g版  对此,腾讯视频方面表示:“暂无接入计划,具体信息以官方公布为准。”i...
日期:10-14
applecare和换修无忧_苹果难得良心:AppleCare+用户iPhone可无限次维修
AppleCare+是苹果推出的一项售后服务计划,大多数苹果旗下的产品都可以通过购买该服务的方式,延长设备的售后服务时间,并获得一定次数的保修服务。此前,对于iPhone用户来说,AppleC...
日期:09-26
世界首富执掌推特后:谁逃离了?谁组成了抵制联盟?「美国推特老板是谁」
凤凰网科技讯 北京时间11月2日消息,随着世界首富埃隆马斯克(Elon Musk)入主推特,准备裁员并对产品进行调整,推特正面临高管和广告商的大批出走。谷歌手机pixel7在中国能用吗高...
日期:11-07
酷狗音乐播放列表导出_酷狗智能曲谱再升级 支持随时随地查看musicxml、mxl曲谱文件
近期,乐迷们在酷狗音乐智能曲谱功能里不断发现新的惊喜。不但功能上更完善、设计上更人性化,而且还有免费领取SVIP会员福利的彩蛋,让乐迷们体验更方便更贴心。这些惊喜都源于近...
日期:08-30
一张图看懂 | iPhone现在占据了美国智能手机大部分市场「美国手机市场占有率」
9月13日 消息:自2007年iPhone 在旧金山举行的 Macworld 大会上发布以来,目前该品牌手机全球销量已超过12亿部。如今,智能手机市场是一个竞争激烈的领域。在全球范围内,iPhone...
日期:09-14
谢娜快手首秀超400万人观看 明星直播不再新鲜_快本直播间谢娜回归
谢娜快手首秀超400万人观看明星直播不再新鲜近日,“快手代言人”谢娜在快手进行了一场直播首秀,吸引了超过400人在线观看互动!谢娜直播网友期待已久,直播开播仅1分钟同时在线观...
日期:07-22