您的位置:首页 > 智能设备

openai gpt-4 横空出世「OpenAI总裁:GPT-4并不完美但却绝对与众不同」

发布时间:2023-03-16 12:07:03  来源:互联网     背景:

3月16日消息,人工智能研究公司OpenAI于昨日发布了备受期待的文本生成AI模型GPT-4。OpenAI联合创始人兼总裁格雷格·布罗克曼(Greg Brockman)在接受采访时表示,GPT-4并不完美,但却绝对与众不同。

GPT-4在其前身GPT-3的基础上,在许多关键方面进行了改进,例如提供了更多真实的陈述,并允许开发人员更容易控制其风格和行为。从某种意义上说,GPT-4也是多模式的,因为它可以理解图像,能给照片添加注释,甚至详细描述照片中的内容。

腾讯新闻用户量

但GPT-4也有严重的缺陷。就像GPT-3一样,该模型会产生“幻觉”(即模型聚合的文本与源文本无关或不够准确),并会犯下基本的推理错误。OpenAI在自己的博客上举了一个例子,GPT-4将“猫王”埃尔维斯·普雷斯利(Elvis Presley)描述为“演员的儿子”,但实际上他的父母都不是演员。

openai gpt-4 横空出世

当被要求将GPT-4与GPT-3进行比较时,布罗克曼只给出了四个字回答:与众不同。他解释称:“GPT-4绝对与众不同,尽管它还存在很多问题和错误。但你可以看到其在微积分或法律等学科技能方面的跃升。它在某些领域的表现曾很糟糕,现在却已经达到超越普通人的水准。”

测试结果支持了布罗克曼的观点。在高考微积分考试中,GPT-4得4分(满分5分),GPT-3得1分,介于GPT-3和GPT-4之间的GPT-3.5也得4分。在模拟律师考试中,GPT-4成绩进入了前10%行列,而GPT-3.5的分数在后10%左右徘徊。

与此同时,GPT-4更受人关注的地方在于上面提到的多模式。与GPT-3和GPT-3.5不同,它们只能接受文本提示,例如可以要求“写一篇关于长颈鹿的文章”,而GPT-4可以同时接受图像和文本提示来执行某些操作,比如识别在塞伦盖蒂拍摄的长颈鹿图像,并给出基本的内容描述。

这是因为GPT-4是针对图像和文本数据进行培训的,而它的前身只针对文本进行了培训。OpenAI表示,培训数据来自“各种合法授权的、公开可用的数据源,其中可能包括公开可用的个人信息”,但当被要求提供细节时,布罗克曼表示拒绝。训练数据以前也曾让OpenAI陷入法律纠纷。

GPT-4的图像理解能力给人留下了相当深刻的印象。例如,输入提示“这张图片有什么好笑的?GPT-4会将整张图片分解,并正确地解释了这个笑话的笑点。

目前,只有一个合作伙伴可以使用GPT-4的图像分析功能,这是一款针对视障人士的辅助应用程序,名为Be My Eyes。布罗克曼说,在OpenAI评估风险和利弊的过程中,无论何时,更广泛的推广都将是“缓慢而有意的”。

他还称:“有些政策问题也需要解决,比如面部识别和如何处理人的图像。我们需要找出危险区域在哪里,红线在哪里,然后随着时间的推移找到解决方案。”

OpenAI在其文本到图像转换系统Dall-E 2上也遇到了类似伦理困境。在最初禁用该功能后,OpenAI允许客户上传人脸,以使用AI支持的图像生成系统对其进行编辑。当时,OpenAI声称,其安全系统的升级使面部编辑功能成为可能,因为它将深度造假以及试图创造色情、政治和暴力内容的潜在危害降至最低。

另一个长期问题是防止GPT-4在无意中被用于可能造成伤害的方式使用。该模型发布几小时后,以色列网络安全初创公司Adversa AI发布了一篇博客文章,演示了绕过OpenAI的内容过滤器并让GPT-4生成钓鱼电子邮件、对同性恋者的攻击性描述以及其他令人反感文本的方法。

openai gpt-4 横空出世

这在语言模型领域并不是新问题。Facebook母公司Meta的聊天机器人BlenderBot和OpenAI的ChatGPT也曾被诱惑输出不恰当的内容,甚至透露了它们内部工作的敏感细节。但包括记者在内的许多人曾希望,GPT-4可能会在这方面带来重大改进。

当被问及GPT-4的健壮性时,布罗克曼强调,该模型已经经过了六个月的安全培训。在内部测试中,它对OpenAI使用政策不允许的内容请求做出响应的可能性比GPT-3.5低82%,产生“事实”响应的可能性比GPT-3.5高40%。

布罗克曼说:“我们花了很多时间试图了解GPT-4的能力。我们正在不断更新,包括一系列改进,这样该模型就更具可扩展性,以适应人们希望它拥有的个性或模式。”

坦率地说,早期的现实测试结果并不是那么让人满意。除了Adversa AI测试之外,微软的聊天机器人Bing Chat也被证明非常容易越狱。使用精心设计的输入,用户能够让该聊天机器人表达爱意,发出威胁伤害,为大屠杀辩护,并发明阴谋论。

华为mate40pro5g版本定价

布罗克曼并未否认GPT-4在这方面的不足,但他强调了该模型的新限制工具,包括被称为“系统”消息的API级功能。系统消息本质上是为GPT-4的交互设定基调并建立界限的指令。例如,一条系统消息可能是这样写的:“你是一位总是以苏格拉底风格回答问题的导师。你永远不会给学生答案,而是总是试着问正确的问题,帮助他们学会独立思考。”

其思想是,系统消息充当护栏,防止GPT-4偏离轨道。布罗克曼说:“真正弄清楚GPT-4的语气、风格和实质一直是我们非常关注的问题。我认为我们开始更多地了解如何进行工程设计,如何拥有一个可重复的过程,让你得到对人们真正有用的可预测结果。”

布罗克曼还提到了Evals,这是OpenAI最新的开源软件框架,用于评估其AI模型的性能,这是OpenAI致力于“增强”其模型的标志。Evals允许用户开发和运行评估模型(如GPT-4)的基准测试,同时检查它们的性能,这是一种众包的模型测试方法。

布罗克曼说:“有了Evals,我们可以更好地看到用户关心的用例,并可以对其进行测试。我们之所以开源这个框架,部分原因是我们不再每隔三个月发布一个新模型以不断改进。你不会制造你不能测量的东西,对吧?但随着我们推出新版模型,我们至少可以知道发生了哪些变化。”

布罗克曼还被问道,OpenAI是否会补偿人们用Evals测试它的模型?他不愿就此做出承诺,但他确实指出,在有限的时间内,OpenAI允许提出申请的Eevals用户提前访问GPT-4 API。

布罗克曼还谈到了GPT-4的上下文窗口,该窗口指的是模型在生成额外文本之前可以考虑的文本。OpenAI正在测试一种版本的GPT-4,它可以“记住”大约50页内容,是普通GPT-4“内存”的5倍,是GPT-3的8倍。

布罗克曼认为,扩展的上下文窗口会带来新的、以前从未探索过的用例,特别是在企业中。他设想了一款为公司打造的AI聊天机器人,它可以利用来自不同来源(包括各部门员工)的背景和知识,以一种非常内行但具有对话性的方式回答问题。

openai gpt-4 横空出世

这并不是一个新概念。但布罗克曼认为,GPT-4的答案将比目前其他聊天机器人和搜索引擎提供的答案有用得多。他说:“以前,模型根本不知道你是谁,你对什么感兴趣等。而拥有更大的上下文窗口肯定会让它变得更强,从而大大增强它能为人们提供的支持。”(小小)


返回网站首页

本文评论
联发科helio p60mt6771相当于骁龙多少_华为P60最新爆料:不使用第二代骁龙8 仍搭载骁龙8+
最近这一段时间,关于华为P60系列新机的信息越来越多了,不久之前该系列机型的手机壳还被曝光,能够让我们从侧面了解一下P60系列的外观设计。关于P60系列,相信更多网友期待的是影...
日期:01-07
Redmi K40 游戏版“逆鳞特别款”今日开售:背部特殊纹理,售价 2699 元_redmik40外观
  7 月 29 日消息 Redmi K40 游戏版“逆鳞特别款”今日正式开售,该机配置保持不变,但外观更为硬核,采用了独特工艺,背部特殊纹理自然天成,售价 2699 元(12GB+256GB),跟普通版一...
日期:07-10
iPhone 14实测:信号更好 5G速度提升38%「iphone14的5g在国内可以用吗」
苹果的iPhone 14系列手机已经上市,目前有机构测试了iPhone 14系列的信号问题,目前来看,一直受信号诟病的iPhone终于有改观了,现在iPhone 14及iPhone 14 Pro不一样了,5G网速提升了...
日期:09-26
郭明錤苹果mr头显或将推迟上市_郭明錤:先进光电成为苹果iPad镜头供应商 下半年开始出货
集微网消息,天风证券分析师、苹果分析师郭明錤今(三)日公布新调查,指出先进光电成为苹果iPad新镜头供应商,与大立光合作以及出货相机模组(CCM)为中长期新成长驱动。“先进光电将...
日期:02-07
苹果新机开启预售:标准版遇冷,Pro系列不到一小时门店已无货
  记者/周玲华为Mate50 RS保时捷  中秋小长假前夜,苹果iPhone 14系列新机开启预售。  9月9日20时,苹果iPhone 14系列在多个渠道开启预定。据澎湃新闻记者观察,今年iPhone...
日期:09-10
中国市场手机近十年出货量_有点糟糕!2022年三季度全球智能手机出货量下降9%
  2022年开年以来,整个手机圈的形势不大好,今年的手机市场可谓是“哀嚎一片”。数据显示,2022年第一季度,全球智能手机市场的销量整体下滑了11%,第二季度销量整体下滑9%。然而...
日期:10-28
2040年的电动车续航_2040年全部新车都是电动车?行业调查:仅39%人相信能实现
3月12日消息,北美、欧洲以及亚洲多个国家都已经制定了提高电动汽车产量和销售的目标,并希望到2040年生产的新车全部都是电动汽车。然而最新行业调查发现,多数人对该目标能否实...
日期:03-12
苹果耳机airpodspro2老是断开_苹果AirPods Pro2用户反馈称其存在随机断连的问题
  IT之家9月26日消息,据macrumors,有部分苹果AirPods Pro2用户反馈称,这款耳机在听音乐或观看视频时会随机断开与设备之间的连接,无论是iPhone还是iPad都有这种情况出现。  ...
日期:09-27
库克的新套路是什么「守成者库克 放出酝酿七年的大招」
作者 | 丸都山iPhone产量头图 | 视觉中国“2023年将是属于苹果MR(混合现实)头显的一年,但也仅此而已。”1月8日,在最新一期的Power On节目上,行业记者Mark Gurman做出了这样的判...
日期:01-10
时隔6年:苹果最失败笔记本12寸MacBook要重新复活了!「苹果笔记本macbookpro12寸评测」
还记得12英寸的MacBook笔记本吗?它似乎要复活了。Galaxy Z Flip3 5G百度百科日前有爆料人称,从产业链渠道获悉,苹果打算全新推出12寸MacBook笔记本产品,目前考虑的是下半年投入...
日期:03-01
三星s23详细参数配置「三星Galaxy S23 Ultra渲染图曝光,S系列迄今为止最窄边框手机将至」
  在曝光三星 Galaxy S23 和 Galaxy S23 Plus 的渲染图后,国外爆料人;OnLeaks 今日再次放出了 Galaxy S23 Ultra 的渲染图。白云区公安网  从渲染图可以看到,三星 Galaxy...
日期:10-03
全新荣耀 MagicBook 14官宣5月16日发布,首发OS Turbo技术「荣耀magicbook16发布会」
  5月9日消息,荣耀智慧生活官微今日正式官宣将于5月16日举行荣耀笔记本新品发布会,届时将推出全新荣耀 MagicBook 14 笔记本。华硕无畏15 OLED屏京东会员买花win10 20h1正...
日期:07-14
诺基亚宣布向所有WP8手机开放Nokia Drive应用_诺基亚wp8应用下载
  北京时间11月1日消息,据国外媒体报道,诺基亚当地时间周三宣布,公司旗下Nokia Drive语音导航服务将对其他所有搭载Windows Phone 8操作系统的厂商开放。Lumia 810  诺基亚...
日期:07-25
神仙打架!今天3场发布会 华为、红米先后官宣新机「荣耀红米下周发布会产品爆料」
  一年一度的双11电商大促节即将到来,众多新机将于近期亮相。将在今天(10月24日)举办的发布会就有3场,包括vivo影像战略发布会、一加Ace Pro原神限定版发布会以及纬图web3.0手...
日期:10-27
超配中国市场全球资管巨头加仓_出手了!全球资管巨头抄底腾讯,加仓幅度超60%!
(原标题:出手了!全球资管巨头抄底腾讯,加仓幅度超60%!) 乔布斯和库克是什么关系“牛散”与机构相继增持港股,等待反弹时机。多重因...
日期:09-22
redminote12pro大概什么时候发布「为双十一做准备!Redmi Note 12系列三款新机即将发布」
  虽然距离双十一的到来还有一个多月,但是参考以往的情况,双十一的预热基本上会在十月中旬开始。而不少手机厂商为了提升手机销量,都会在双十一期间开展各种活动或者推出新机...
日期:10-03
一加显示器 E 24 海外上市 售价11999卢比「一加显示器x27」
品玩2月15日讯,据一加印度官网显示,一加显示器 E 24 现已在印度市场上架,售价11999卢比。一加 E 24显示器搭载 24 英寸 FHD 显示屏,分辨率为 1920 x 1080,支持 75Hz 刷新率。接口...
日期:02-22
如意推智能IM系统,比10个客服还厉害
  对于电商企业或销售型公司而言,客服是必不可少的角色。作为唯一可能与客户直接沟通的岗位,客服人员的沟通融合了情感,给客户带来最直观的沟通体验。  优秀的客服人员,对企...
日期:07-23
微星显示器最新款_微星发布新款高端机箱 配备4.3英寸IPS显示屏
IT之家 10 月 6 日消息,据 TechPowerUp 消息,微星发布了 MEG PROSPECT 700 系列高端机箱,其中 MEG PROSPECT 700R 型号配备了 4.3 英寸 IPS 显示屏。据介绍,这款 MEG PROSPECT 7...
日期:10-09
2023年智能手机行业继续低迷 三星押注中国市场想提振盈利「2021年三星智能手机销量」
2月2日消息,尽管有许多迹象表明,全球智能手机市场在2023年可能继续表现低迷,但韩国三星电子公司希望对高端设备的需求能推动Galaxy系列手机的销量实现两位数增长,而这可能需要依...
日期:02-07