您的位置:首页 > 互联网

考试能力超90%人类的GPT-4发布!网友为工作担忧和哀嚎

发布时间:2023-03-15 08:59:43  来源:互联网     背景:

作者|一橙

出品|网易科技《态℃》栏目

今天凌晨,OpenAI公布了其大型语言模型的最新版本——GPT-4。该公司表示,GPT-4在许多专业测试中表现出超过绝大多数人类的水平。

具体而言,GPT-4实现了以下几个方面的飞跃式提升:更聪明,做题水平越来越好;支持图像输入,拥有强大的识图能力,但目前只限内部测试;更长的上下文,文字输入限制提升至2.5万字;回答准确性显著提高;更安全,有害信息更少。

最先进的 OpenAI GPT-4 系统介绍 (来源:技术译站)

对于普通人而言,如何理解GPT-4到底有多强多聪明?

据OpenAI透露,GPT-4通过了所有基础考试而且是高分通过。例如,GPT-4在模拟律师资格考试的成绩在考生中排名前10%左右,在SAT阅读考试中排名前7%左右,在SAT数学考试中排名前11%左右。相比之下,曾经令人震撼的GPT-3.5 ,真实得分在倒数10%左右,GPT-4的强大已经可想而知。

lg5g专利

有网友评论,“如果真跟报告说的那样就太可怕了,我感觉能力已经远超我了。”也有人笑称,“我躺好了!我生在了适合我的时代!”

最多的声音则是对未来工作不保的担忧,“还有哪个行业可以不被替代?”“消除任何幻想,AI时代横扫全球,先思考下GPT-4不能做但你能做的。”

比以前的版本“更大”,或许也更烧钱

OpenAI称,GPT-4比以前的版本“更大”,这意味着其已经在更多的数据上进行了训练,并且在模型文件中有更多的权重,这使得它的运行成本更高。

同时,OpenAI并未公布这个模型的参数量有多少。

OpenAI表示,它使用的是微软(MSFT.US)Azure训练模型,微软已经向这家初创公司投资了数十亿美元。OpenAI没有公布具体模型大小的细节,也没有公布用来训练模型的硬件,理由是“竞争情况”。

目前,此领域的许多研究人员认为,人工智能领域的许多最新进展,都来自于在数千台超级计算机上运行越来越大的模型,这些模型的训练过程可能耗资数千万美元。

为了不断提高GPT-4性能,OpenAI还为其研发大搞“基建”。

在过去的两年里,OpenAI重建了整个深度学习堆栈,并与Azure一起为其工作负载从头开始设计了一台超级计算机。一年前,OpenAI 在训练GPT-3.5时第一次尝试运行了该超算系统,之后他们又陆续发现并修复了一些错误,改进了其理论基础。这些改进的结果是 GPT-4的训练运行获得了前所未有的稳定。

OpenAI联合创始人兼总裁格雷格·布罗克曼(Greg Brockman)表示,OpenAI预计,未来将由投资十亿美元超级计算机的公司开发尖端模型,一些最先进的工具将带有风险。OpenAI希望对他们工作的某些部分保密,以给初创公司“一些喘息的空间,以真正关注安全并做好它。”

局限性明显,GPT-4仍然不完全可靠

尽管功能已经非常强大,但 GPT-4仍与早期的 GPT 模型具有相似的局限性,其中最重要的一点是它仍然不完全可靠,也就是还有可能胡说八道。

三星固态硬盘涨价

OpenAI也警告称,GPT-4还不完美,在许多情况下,它的能力不如人类。该公司表示:“GPT-4仍有许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”

红米k30s工信部

总的来说,GPT-4相对于以前的模型(经过多次迭代和改进)已经显著减轻了幻觉问题。在 OpenAI 的内部对抗性真实性评估中,GPT-4的得分比最新的 GPT-3.5模型高40%。

同时,GPT-4训练数据还是截止到2021年9月份。这也意味着,GPT-4对于这个时间点以后的信息,缺乏足够的了解,也不会从其经验中学习。

在GPT-4发布之后,OpenAI创始人阿尔特曼发推文表示:“它仍然是有缺陷的,仍然是有限的,在你花了更多的时间第一次使用它时,它似乎比实际情况更令人印象深刻。”

中国的ChatGPT们要怎么追?

最令人震惊的在于,按照 demo 视频里 OpenAI 工程师们的说法,GPT-4的训练在去年8月就已经完成,剩下的时间都在进行微调提升,以及最重要的去除危险内容生成的工作。

这也意味着,OpenAI 内部技术,比大家想象中的领先外界更多年。更可怕的是,OpenAI还一口气开放了API接口和相关论文!这让中国的ChatGPT们还怎么追?

英诺天使基金合伙人王晟曾告诉《态℃》栏目,“中国的ChatGPT们即便奋起直追,静态来讲也许两三年能追上,我认为已经很乐观了。”

但随着更强大的GPT-4发布,OpenAI 的技术能力显然仍在不断进步,且进展速度远比我们追的速度还要快。王晟在之前的采访中判断,“除非这件事突然遇到了一个瓶颈,整个科技发展方向到头了,对方不得不停下来,或许我们还有机会追平,或者我们挖掘到一种新的技术路径有机会追上,不然可能没有机会了。”

与此同时,在该模型的落地和应用方面,OpenAI也有了最新进展。

新模型将提供给ChatGPT的付费用户,也将作为API的一部分提供,允许程序员将AI集成到他们的应用程序中。OpenAI将对750字左右的指令信息收费3美分,对750字左右的响应信息收费6美分。

OpenAI还介绍,摩根士丹利正在使用GPT-4来组织数据,而电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。其他客户还包括语言学习公司Duolingo、Khan Academy和冰岛政府。OpenAI合作伙伴微软周二表示,新版必应搜索引擎将使用GPT-4。

GPT-4取得的成绩令人兴奋,但对于还在起跑线上的中国ChatGPT们,还有大量的工作要去探索和研究,想必感受到了巨大的压力。风浪越大鱼越贵,对于这些迅速进入这个新领域的公司来说,也将会拥有巨大的机会。

GPT-4的强大告诫我们,未来唯一限制的因素,就是你的想象力!


返回网站首页

本文评论
360针对宪兵做优化:360杀毒接手开机王
8月8日,第三方安全评测机构灰帽子安全中心发布了一款“杀软宪兵”产品,其作用是检测杀毒厂商的安全产品对系统性能造成负面影响的情况。在杀软宪兵的参考排行榜中,排名如下:  ...
日期:07-22
评测:黑科技性价比AR奇幻魔盒,究竟比国外那些早教玩具强在哪儿?
  近年来,早教市场愈发火爆,家长们对于早教产品的选择也是日益严苛。最近比较火的一款AR奇幻魔盒,采用黑科技与高性价比的组合模式,一经上市就吸粉无数,但在众多新兴产品走上...
日期:11-04
HUAWEI AppGallery Connect携手多家服务商,打造翻译服务“新引擎”(huawei link app)
  HUAWEI AppGallery Connect翻译服务全新升级,携手新宇智慧、语言桥等多家服务商为全球开发者提供优质的翻译服务,解决应用在全球分发时面临的多语言本地化问题,通过平...
日期:07-16
redmi note7多少瓦快充「手机充电进入个位数时代 Redmi 210W快充9分钟充满」
10月28日 消息:近年来,国内手机厂商们在新机创新上,逐渐聚焦充电功率,快充技术成为新一轮的竞争焦点。新发布的一批安卓手机,基本上快充已经成为标配,不少入门级千元机都已经具备...
日期:10-29
迪普科技:水到渠成 挖掘运营商市场高价值潜力
  运营商市场一直是各个厂商“又爱又恨”的市场,“爱”的是运营商市场规模大,只要能够进入到运营商集采当中销售规模就一定能够上去;“恨”的是运营商市场竞争激烈,运营商把...
日期:06-09
租用业务增长快速 视高巩固行业领导地位
  近期,受全国性经济通胀大环境的影响,加上资金压力、人力成本、电力短缺等因素的干扰,我国众多中小企业进一步发展开始变得举步维艰。据全国工商联对广东、浙江、江苏等16...
日期:07-30
要取代iPhone了?苹果的AR头显团队设想该设备可以整天佩戴 无需携带手机
据报道,苹果对其即将推出的AR耳机有一个宏伟的愿景,据说它被称为Reality Pro。 显然,其发布背后的团队认为,这是一款实际上可以成为像iPhone一样创收机器的产品。然而,它的高价格...
日期:01-30
最美1000张脸,究竟谁才是颜“智”担当
核心提示: 9月19日,一个诺大的魔幻箱子空降上海大悦城,引来大量路人的围观,这个魔幻箱子究竟将......
日期:09-26
英特尔或6月推出上网本专用双核Atom处理器_atom四核处理器
  上网本预计在6月份之前将得到一种英特尔双核Atom处理器,最终使上网本达到多核处理器提供的良好性能。   惠普、联想、戴尔和东芝仅提供配置单核Atom处理器的上网本。...
日期:07-29
雷军回应对标iPhone被笑话:没有对标的勇气 怎么能把高端手机做好
  [TechWeb]12月12日消息,近日,小米创始人雷军在小米13发布会上的一段讲话视频在网上流传,他提到,一年多前他提出对标iPhone,网上不少人笑话他。他回应称,如果小米没有对标iPhon...
日期:12-12
快手打击帐号买卖行为 累计处罚7.43万个违规帐号_快手账号存在违规行为
10月9日 消息:今日,快手发布关于打击帐号买卖行为的专项治理公告第六期内容,2月至今已累计处罚7.43万个买卖帐号。华为p50 pro 纳米玻璃评测公告称,在日常审核中平台发现,部分帐...
日期:10-15
京东新百货年货节29日晚8点全面开启 买贵必赔_京东特卖节
12月29日消息,今晚8点,京东新百货年货节正式进入高潮期,时尚服饰、美妆护肤、运动户外、奢品钟表等各品类大牌好物汇聚,生肖年礼、新年礼盒、红色元素新年礼带来中意礼赠。三星n...
日期:12-30
饿了么:近一周新增骑手翻番 投入5000万元用于保供运力招募
12月26日消息,针对当前众多地区因疫情导致的运力紧张情况,饿了么宣布升级“城市守护者支持计划”:30天内首批追加过亿元骑手稳岗跑单补贴,投入5000万元用于新运力招募,并为骑手免...
日期:12-26
互联网券商Robinhood宣布将裁员23%(robinhood证券)
讯;北京时间8月3日凌晨消息,美国互联网券商股票交易服务公司Robinhood今天公布了该公司的2022财年第二季度财报。报告显示,Robinhood第二季度总净营收为3.18亿美元,与去年同期...
日期:08-04
叫板快手、怒斥抖音,辛巴称遭遇不公平对待「辛巴炮轰抖音双标,刘耕宏先“中枪”」
  文 / 梁又匀;责编 /;高梦阳;编辑;/;梁又匀  8月30日上午,辛巴的一篇举报长文使得一年前就已尘埃落定的“糖水假燕窝”事件再次发酵,引发各方关注。  在文中,辛巴不仅直...
日期:09-01
iPhone 5c被列为过时产品「苹果 11 月开始将 iPhone 5c 和 iPad mini 3 列为过时产品」
10月9日消息:苹果公司在2020年10月将iPhone5c标记为陈旧产品,这意味着该公司及其服务提供商只能为该产品提供某些维修服务,但要视零件供应情况而定。apple watch爆屏图片来自...
日期:10-10
雪佛兰spark和索尼爱立信两大品牌入驻《泡芙小姐》
  5月27日,《泡芙小姐》系列第五集《泡芙小姐的地图》在中国第一视频网站优酷(NYSE:YOKU)独家首播,雪佛兰spark和索尼爱立信两大品牌成为“泡芙小姐”在剧中生活的一部分,继人...
日期:07-28
申通快递获300亿元银行授信_申通快递申行者
9月28日消息,申通快递2022年全国网络大会今日正式召开,明确将打造“中国质效领先的经济型快递”,还与多家银行签署300亿战略合作协议,助力三年百亿产能基建。《快递》杂志报道称...
日期:09-29
ios14.5 beta2 bug「iOS16.1 Beta2正式推送:修复两项重要问题,果粉反馈也出炉了」
众所周知,iOS系统一直都是以出色的流畅度为主打方向,但没有想到,自从进入iOS16之后,市场中的争议声一直都没有停止,带来了很多问题,导致用户体验非常差。要知道,卡顿、发热量大、功...
日期:10-01
美国微软现任总裁「微软中国任命原欣为中国区总裁」
  微软公司9月26日宣布,任命原欣(Bessie Yuan)为微软中国区总裁。原欣将直接向微软公司全球资深副总裁、大中华区董事长兼首席执行官侯阳博士汇报。原欣将全面领导微软中国区...
日期:09-27