您的位置:首页 > 互联网

GPT-5正秘密训练!DeepMind联创爆料,这模型比GPT-4大100倍

发布时间:2023-09-04 13:21:26  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】GPT-5仍在秘密训练中!DeepMind联合创始人在近日采访中透露,未来3年,Inflection模型要比现在的GPT-4大1000倍。

近来,DeepMind联合创始人Mustafa Suleyman,现Inflection AI的CEO,在采访时投出了重磅炸弹:

OpenAI正在秘密训练GPT-5。

我认为我们都直截了当地说会更好。这就是为什么我们披露了拥有的计算总量。

在未来18个月内,Inflection AI训练的模型比当前的前沿模型大100倍。未来3年内,Inflection的模型比现在大1000倍。

其实,Sam Altman此前曾否认训练GPT-5的这一说法。

对此,网友表示,OpenAI可能给它起了一个新名字,所以他们才说没有训练GPT-5。

这就像当时Code Interpreter推出一样,许多人感觉其能力早已不是GPT-4模型,而应该是GPT-4.5。

另外,采访中,Suleyman还爆出了很多自己在DeepMind和Inflection AI工作时的内部信息,包括了谷歌当时收购DeepMind和之后的抓马,某种程度上解释了为什么DeepMind相比于OpenAI「起了个大早,却赶了个晚集」。

他还认为,开源模型可能会增加AI带给人类的不稳定和危害。

而AI安全性最大的威胁来源并不是大语言模型,而是未来可能出现的自主智能体。

访谈全文

当被问到未来AI是否有可能会成为一个有自主进化能力的智能体时,Suleyman认为:

在短期之内,不太可能出现这种智能体——能够自主运行,能够制定自己的目标,能够识别环境中的新信息、新的奖励信号,并学会用它作为自我监督,并且随着时间的推移更新自己权重的人工智能体。

但是这种自主进化能力的AI是所有人都不应该忽视的东西,因为如果某种AI技术真的展现出这种能力的,它可能会有非常大的潜在风险。

至少他知道的范围之内,Inflection AI和DeepMind都没有在往这个方向上走。

Inflection AI不是一家AGI公司,他们想做的事就是希望能够做出一个非常好用的个人助理。这个助理在能够充分访问用户个人信息的前提下,为用户提供高度定制化的AI服务。

模型训练军备竞赛会加剧AI的风险吗?

他的公司,Inflection AI正在建造世界上最大的超级计算机之一,并且他认为在接下来的18个月内,他们可能会进行一次比制造GPT-4的语言模型训练运行大10倍或100倍的训练运行。

当被问到,这种军备竞赛式的训练模型可能会增加AI的风险吗,他回答到:

100倍的训练仍然会产生一个聊天机器人,可以理解为一个更好的GPT-4,尽管这会成为一个更令人印象深刻的模型,但这并不危险——因为它缺乏自主性,不能改造物理世界等让模型自身变得危险的基本要素。

仅仅生产一个非常好的、更好的 GPT-4还不算危险;为了让它变得危险,我们需要增加其他能力,比如前边提到的,让模型能够自我迭代,自我制定目标等等。

那大约是五年、十年、十五年、二十年之后的事了。

Suleyman认为,Sam Altman最近说过他们没有训练 GPT-5,可能没有说实话。(Come on. I don’t know. I think it’s better that we’re all just straight about it.)

他希望所有拥有大规模算力的公司都能尽可能的保持透明,这也是他们披露自己拥有的计算总量的原因。

他们正在训练比GPT-4更大的模型。目前,他们有6000台H100正在训练模型。

到12月,22,000个H100全面投入运营。从现在开始,每个月都会增加1000到2000台H100。

他认为谷歌DeepMind也应该做同样的事情,应该披露Gemini接受了多少FLOPS训练。

AI训练成本将如何变化

从算力成本的角度来看,未来AI训练的规模不可能达到训练某个模型需要100亿美元的成本,除非真的有人会花3年时间去训练一个模型,因为堆叠越多算力去训练一个越大的模型,需要的时间也会更长。

虽然花的成本越高,可能能带来更强的能力,但是这不是一个没有上限的数学问题,需要考虑很多实际情况的限制。

但是因为算力成本随着芯片算力的迭代在不断下降,所以未来可能会出现训练某个模型的成本相当于在2022年花费了100亿美元来训练。

但是因为芯片算力会以2-3倍的效率增长,所以到时候训练一个这样规模的成本会远远小于现在看起来的成本。

比如说,现在开源社区中的Llama2或者Falcon等模型,只有15亿参数或20亿参数,就获得了有1750亿参数的GPT-3的参数的能力。

开源的看法

作为一直在闭源科技公司工作的Suleyman,对于开源模型的价值和可能的风险,有非常与众不同的观点。

首先,他认为,在未来5年这个时间维度之内,开源模型始终会落后最前沿的闭源模型3-5年的时间

而且,开源模型会增加AI带来的社会风险。

如果所有人都能无限制地访问最新的模型,将会出现一个现象——「力量的快速扩散」。

举个栗子,就像新媒体平台让每个人都可以作为一份完整的报纸发挥作用,拥有数百万粉丝,甚至能影响全世界。

对于最前沿模型的无限制访问将会扩大这种力量,因为在未来3年内,人类能够训练出比现有模型规模大上1000倍的模型。

即便是Inflection AI,也能在未来18个月内获得比现在最前沿的模型大100倍的计算能力。

而开源的大模型会将这种力量交到每个人的手中,相当于给了每个人一个潜在的大规模不稳定破坏性的工具。

而到时候,再想办法避免这些工具可能产生的破坏性后果,有人做了一个很巧妙的比喻——图试图通过用手接住雨水来让雨停下来。

他曾经向监管部门解释过,AI技术未来会降低很多潜在危险化合物或者武器的开发门槛。

AI能在实际制作这些东西时提供大量的帮助——比如告知在实验室中遇到技术挑战时从哪里获取工具等等。不过确实,从预训练中删除这些内容,对模型进行对齐等等办法,可以有效地降低这样的风险。

总之,对于用大模型能力来做坏事的人,需要尽量让他们在做这些事的时候变得困难。

但是如果尽可能的开源一切模型,未来面对能力越来越强的模型,将会把更多的类似风险暴露出来。

所以虽然开源模型对于很多人来说确实是一件好事,能够让所有人都获得模型并且进行各种各样的尝试,带来技术上的创新和改进,但是也一定要看到开源的风险,因为并不是每个人都是善意和友好的。

虽然我说这样的话可能会被很多人理解为我做的事和开源社区存在利益冲突,因此很多人可能会很生气,但是我还是要表达我的观点。

他还强调了,他不是为了攻击开源社区才说出这番言论的:

「虽然我说这样的话可能会被很多人理解为我做的事和开源社区存在利益冲突,因此很多人可能会很生气,但是我还是要表达我的观点,也希望获得人们的支持。」

在谷歌和DeepMind期间的抓马

sim卡如何销毁

在DeepMind度过的10年里,他花了大量时间试图将更多的外部监督融入到构建AI技术的过程中。

这是一个相当痛苦的过程。虽然他认为谷歌的出发点是好地,但它运作的方式仍然像传统的官僚机构一样。

当我们设立了谷歌的伦理委员会时,计划有九名独立成员,是对于开发敏感技术过程中进行外部监督的重要措施。

但因为任命了一个保守派人士,而她过去曾发表过一些有争议的言论,很多网友就在推特等场合抵制她,同时也抵制其他支持她的几个成员,要求他们退出委员会。

这是一场彻底的悲剧,非常令人沮丧。我们花了两年时间来建立这个委员会,这是朝着对我们正在开发的非常敏感的技术进行外部审查的第一步。

不幸的是,在一周内,九名成员中的三名辞职了,最终她也辞职了,然后我们失去了半数委员会成员。

然后公司转身说:「我们为什么要招人来限制自己?这纯粹是浪费时间。」

其实,当DeepMind被收购时,我们提出了收购的条件,即我们要有一个伦理和安全委员会。

我们计划在伦理和安全委员会之后,我们要将DeepMind打造成一个全球利益公司:一个所有利益相关者在做决策时都能发声的公司。

它是一个按担保有限责任公司设立的公司。然后,我们计划制定一个宪章,为AGI的开发制定相关的伦理安全的目标;这样使得我们可以将收入的大部分用于科学和社会使命。

这是一个非常有创意和实验性的结构。但是当Alphabet看到设立伦理委员会发生的事情时,他们变得胆怯了。他们说:「这完全疯了。你们的全球利益公司也会发生同样的事情。为什么要那样做?」

最终,我们将DeepMind合并进入到了谷歌,从某种程度上说,DeepMind从未独立过——现在当然也完全从属于谷歌。

谷歌下一代大模型Gemini

The Information独家报道称,谷歌多模态人工智能模型Gemini即将面世,直接对标OpenAI的GPT-4。

其实,在今年谷歌I/O大会上,劈柴已经向大众宣布,谷歌正在研发下一代模型Gemini。

有传言说,该模型将至少有1万亿参数,训练将使用数以万计的谷歌TPU AI芯片。

与OpenAI类似,谷歌使用GPT-4的方法来构建模型,由多个具有特定能力的人工智能专家模型组成。

简言之,Gemini同样是一个混合专家模型(MoE)。

这也可能意味着,谷歌希望提供不同参数规模的Gemini,因为从成本效益上考虑是个不错的选择。

除了生成图像和文本外,Gemini接受过YouTube视频转录数据的训练,也可以生成简单的视频,类似于RunwayML Gen-2。

另外,比起Bard,Gemini在编码能力方面也得到了显著提升。

Gemini推出之后,谷歌也计划逐步将其整合到自家产品线中,包括升级Bard,谷歌办公全家桶、谷歌云等等。

其实,在Gemini之前,DeepMind还有一个代号为「Goodall」的模型,基于未宣布的模型Chipmunk打造,可与ChatGPT匹敌。

不过GPT-4诞生后,谷歌最后决放弃这一模型研发。

据称,至少有20多位高管参与了Gemini的研发,DeepMind的创始人Demis Hassabis领导,谷歌创始人Sergey Brin参与研发。

还有谷歌DeepMind组成的数百名员工,其中包括前谷歌大脑主管Jeff Dean等等。

Demis Hassabis在此前接受采访表示,Gemini将结合AlphaGo类型系统的一些优势和大型模型惊人的语言能力。

可以看到,谷歌已经在全力备战,就等着Gemini开启逆袭之路。

参考资料:

https://80000hours.org/podcast/episodes/mustafa-suleyman-getting-washington-and-silicon-valley-to-tame-ai/

https://twitter.com/AISafetyMemes/status/1697960264740606331


返回网站首页

本文评论
日本车企要跑了?「日本车企造假20年」
出品丨虎嗅汽车组作者丨李文博编辑丨周到头图丨视觉中国最近,有两条关于汽车供应链的新闻,似乎让全球汽车工业感受到了一股别样的风。第一条:日本《产经新闻》近日报导,本田汽车...
日期:09-07
报告|50%CRM品牌陷入竞争旋涡,破圈迫在眉睫_品牌crm是什么意思
  2020中国CRM指数测评报告   疫情影响,CRM市场短期利空,长期利好   随着中美贸易摩擦的持续以及疫情反复,CRM市场也受到严重影响,大量企业客户特别是制造、旅游、餐饮...
日期:07-14
中国移动内蒙古公司2G退网拆除回收处置项目公示
通信世界网消息(CWW)近日,中国移动内蒙古公司2023年2G退网报废资产拆除施工、回收处置服务项目公示中标候选人。该项目于2023—08—23 09:00开标,并按照国家招投标有关法律法规及...
日期:08-30
恒大 5000亿_恒大的1300亿朋友圈
恒大最近站上了风口浪尖。9 月 24 日,一份名为《恒大集团有限公司关于恳请支持重大资产重组项目的情况报告》在网上流传。报告中提到,如果 2021 年 1 月 31 日前重组未能完成,...
日期:08-01
美国富豪用17岁儿子血浆换血失败:疗法没检测到任何好处「美国血浆采集」
追求青春永驻是人类永恒的话题,人们通过运动、医疗、科技等方法对抗衰老。上海到海南旅游攻略路线快科技7月12日消息,45岁的美国超级富有科技企业家布莱恩约翰逊(Bryan Johnson...
日期:07-12
三大运营商将逐步取消不限量套餐_取消不限量套餐是什么意思
  根据一份中国电信集团公司公布的《关于调整电信畅享套餐的通知》文件,中国电信从即日起,开始切换达量降速版畅享套餐至普通版畅享套餐,并最晚于8月31日前切换完毕,集团将在...
日期:03-27
红米 双十一「红米新品11月上!低价高配冲刺双11」
中关村在线消息:10月9日,据相关爆料,卢伟冰最近频繁发布微博暗示红米即将发布的新机。根据外界消息来看,红米即将发布红米Note12系列,新机定位仍然为千元档,预计售价在1000-1500元...
日期:10-23
360安全中心:金山网盾高危漏洞早已被大规模利用_360防黑客
  身陷“笔误门”的金山公司,今日再度陷入新的诚信危机“漏洞门”。5月24日,中国国家信息安全漏洞库证实金山网盾存在一个高危的内核本地提权漏洞(国家漏洞库编号:CNVD-2010-...
日期:07-29
谷歌Stadia云游戏平台突然关闭,育碧将为玩家把游戏转移到PC
  IT之家 10 月 1 日消息,谷歌于昨日突然宣布将关闭旗下云游戏服务 Stadia,甚至许多游戏开发商都不知情。  在事件发生后,游戏厂商育碧宣布正加紧支持游戏转移,帮助玩家把在...
日期:10-01
维基解密创始人拍板两千万美金作为泄密罚款
【赛迪网讯】5月13日消息,据国外媒体报道,维基解密和美国政府的冲突终于告一段落之后,维基解密创始人朱利安·阿桑格(Julian Assange)要求他的合伙人签署有关的保密协议,该保密协...
日期:07-27
诺基亚安卓机怎么样_安卓系统领先 诺基亚等传统老牌影响力仍在
  iPhone5没来,来了iPhone4s。苹果公司的这招出其不意,打乱了很多人购买手机的计划。有些人捏着已经用厌的iPhone4,本来盘算着熬一熬等iPhone5上市,结果等来的是外形与四代几...
日期:07-24
中国台湾6月芯片出口暴跌21% ,创14年来最大跌幅_台湾芯片产业现状
近日,据彭博社报道,由于全球需求放缓,中国台湾6月份集成电路芯片出口连续第六个月下降。中国台湾财政部门的数据显示,6月出口额同比下降20.8%至126亿美元,为14年来,即2009年3月以...
日期:07-14
抖音开放出行小程序入驻「抖音小程序开放平台」
12月26日 消息:据Tech星球消息,抖音已经开放交通出行服务的平台服务商入驻资格。华为p50pro最新官方消息发布目前开放的细分类型有打车/网约车、顺风车/拼车、出租车等,作为出...
日期:12-26
消协炮轰电信资费 充值卡不退余额涉嫌违法_电信卡欠费充值不进去
  今天上午,北京市消协再谈电信资费改革,对于充值卡余额不退,市消协认为电信运营商涉嫌违法。   市消协秘书长董青表示,移动电话充值卡的使用存在两方面的问题,第一个问题,运...
日期:07-29
你的聊天记录有多大?微信官方公布存储空间清理教程「微信聊天记录 存储空间」
9月1日 消息:昨日,微信官方公布了存储空间清理教程。微信表示,在微信内依次点击“我-设置-通用”找到存储空间,待系统计算完已用空间后,就能直观看到微信已占用的空间,以及各项数...
日期:09-01
苹果信号有救了?iPhone SE4将首发苹果自研5G芯片「苹果se有四g移动的吗」
近几年,苹果一直在使用高通所生产的基带,但也因此iPhone信号问题常常遭到诟病。据报道,苹果内部也已经意识到这一问题,并正式开始自研基带。据分析师透露,苹果计划在2025年发布iP...
日期:04-13
小姐姐上路实测极狐华为自动驾驶:技术宛如老司机「极狐夜间自动驾驶视频」
7月份,极狐阿尔法S华为HI版已经开启交付,新车共推出了进阶版(39.79万元)和高阶版(42.99万元)两款,二者的配置差异主要为辅助驾驶,高阶版有城市辅助驾驶和高阶自动泊车功能(AVP 等)。极...
日期:11-04
借助华为云WeLink,中科睿芯“信息高铁”事业全速进发
  所谓“信息高铁”,其核心就是面向人—机—物三元融合的计算需求,提供高通量的计算与传输能力,构建万物互联时代的信息基础设施。持续推动“信息高铁”的发展进程,需要营造...
日期:06-09
谷歌、亚马逊、英伟达等科技巨头投资 Hugging Face 使其估值进一步攀升至 45 亿美元
8月25日消息:总部位于纽约的人工智能公司 Hugging Face 已从一些科技巨头公司筹集了 2.35 亿美元,使其估值攀升至 45 亿美元。Google、亚马逊、英伟达、Salesforce、AMD、英...
日期:08-25
身价没有几个亿,不好意思做类ChatGPT
声明:本文来自微信公众号“Tech星球”(ID:tech618),作者:王琳 何煦阳,授权转载发布。亿富豪、前美团联合创始人王慧文最近有了新烦恼:如何给自己的新公司“光年之外”招到技术大...
日期:03-02