您的位置:首页 > 互联网

媒体爆料:发现新一代大模型”没有那么大飞跃“,OpenAI已经改变策略

发布时间:2024-11-11 17:34:55  来源:互联网     背景:

专题:聚焦AI

OpenAI下一个旗舰模型“Orion”,其进步幅度远不如前两代旗舰模型,这直接挑战了人工智能领域一直奉行的“缩放定律”。业界正在将精力转向在初始训练之后改进模型。

随着ChatGPT和其他人工智能产品的用户数量不断攀升,支撑这些产品的核心技术——大型语言模型(LLM)的进步速度却似乎放缓了。

据科技媒体The Information报道,OpenAI开发的下一个旗舰模型“Orion”,目前已经完成20%的训练。尽管表现已接近现有的GPT-4,但进步幅度却远不如前两代旗舰模型之间的飞跃。

该媒体还援引OpenAI 的一名员工称,Orion在语言任务上表现更好,但在编码等任务上可能不会优于以前的模型。另一位知情人士表示,与最近发布的其他模型相比,OpenAI在其数据中心运行 Orion 的成本可能更高。

质量进展放缓,扩展法面临挑战

在过去几年中,LLM使用来自网站、书籍和其他来源的公开文本和其他数据进行预训练过程,这种方法虽然能在一定程度上缓解数据匮乏,但带来的质量提升有限。

OpenAI的员工表示,Orion部分接受了人工智能生成的数据训练,这些数据由其他OpenAI模型生成,包括GPT-4和最近发布的推理模型。然而,这种合成数据导致了一个新问题,即Orion最终可能会在某些方面与那些旧模型相似。

与此类似,其他一些AI公司也面临类似的问题。Meta创始人马克·扎克伯格和Databricks公司创始人Ion Stoica都指出,尽管AI技术在编码、复杂任务解决等方面继续取得进展,但在常识判断和通用任务能力上,性能提升已趋于缓慢。

Orion的进展放缓直接挑战了人工智能领域一直奉行的“缩放定律”,即在数据量和计算资源不断增加的前提下,模型性能将持续大幅度提升。

为了应对GPT改进放缓给基于训练的缩放定律带来的挑战,业界似乎正在将精力转向在初始训练之后改进模型,从而可能产生不同类型的缩放定律。由于高质量训练数据的减少以及计算成本的增加,OpenAI的研究人员不得不开始探讨是否有其他改进模型性能的方法。

例如,OpenAI正在将更多代码编写功能嵌入其模型中,并试图开发一种软件,可以接管个人计算机,通过执行点击、 光标移动等执行其他操作, 完成网络浏览器活动或应用程序的任务。

OpenAI还成立了一个专门团队,由之前负责预训练的Nick Ryder领导,负责探索如何优化有限的训练数据和调整扩展法的应用,以保持模型改进的稳定性。

团队通过训练模型解决大量数学和编码问题,让模型在后期强化过程中逐步提高对这些任务的解答能力。此外,人工评估员还会对模型在不同任务上的表现进行评分,以帮助模型在复杂问题上提供更准确的答案。

巨大计算成本带来的财务负担

神舟十三号航天员进驻中国空间站观后感

然而,随着模型复杂度的增加,训练和运行这些AI模型的成本也在急剧上升。例如,o1模型的推理成本是普通模型的六倍。

即便如此,扎克伯格、Sam Altman等人都曾表示,他们还没有达到传统扩展法的极限。

这也许就是为什么OpenAI等公司依然在投资数十亿美元建设数据中心,希望通过增加计算能力,从预训练模型中获得更多的性能提升。

但OpenAI研究员Noam Brown在TEDAI大会上警告,开发更为先进的模型可能将面临数百亿美元的高昂费用,成为财务上的巨大负担。

“毕竟,我们真的要训练花费数千亿美元或数万亿美元的模型吗?在某些时候,扩展范式会崩溃。”

或许在未来,OpenAI和其他AI公司都需要继续在训练数据和计算资源之间寻求平衡,探索如何在不增加巨大财务负担的前提下,进一步优化模型性能。


返回网站首页

本文评论
小红书发布十一出行消费数据 “周边游”热度大涨377%(十一旅游消费数据)
10月10日消息,日前,小红书发布《2020“十一”假期出行消费报告》(以下简称“报告”),内容显示,与今年五一假期的日均数据相比,小红书平台旅游景点相关笔记发布量增长105%,本地休闲...
日期:08-01
北大字节开辟图像生成新范式,超越Sora核心组件DiT,不再预测下一个token
声明:本文来自微信公众号“量子位”(ID:QbitAI),作者:关注前沿科技,授权转载发布。北大和字节联手搞了个大的:提出图像生成新范式,从预测下一个token变成预测下一级分辨率,效果超越...
日期:04-16
京东洗衣举办“工厂开发日” 邀请消费者探厂见证专业与透明流程
近日,京东洗衣成功举办了“洗衣工厂开放日”活动,邀请了多位社交媒体达人与消费者一同探访其洗衣工厂,共同见证衣物洗涤的专业与透明流程。这一创新举措不仅让消费者更加直观地...
日期:04-26
美国富国银行官网「多家客户称存款不见了 美国富国银行回应:技术故障」
好好的银行存款,突然就没有了?这是美国富国银行客户遭遇的惊魂一幕,不过后者表示这只是技术故障。据美国媒体报道,从3日开始,美国富国银行(WFC.N)大量客户通过社交媒体联系富国银...
日期:08-06
SU7同款Nappa真皮!小米NFC卡片钥匙包上线:99元
快科技6月25日消息,据媒体报道,小米汽车App商城最新上架了一款NFC卡片钥匙套,售价为99元,消费者还可以选择使用990积分进行抵扣。这款钥匙套采用与小米汽车SU7内饰同款的Nappa头...
日期:06-26
三大平台全覆盖!《完蛋!我被美女包围了!》今日上线主机:国行PS版49元
快科技8月8日消息,今日,《完蛋!我被美女包围了!》主机版正式上线,登陆PS5|PS4、Xbox Series X|S、Xbox one以及Switch平台。游戏港区售价59港币,台区售价300新台币,另外PS5|PS4国行...
日期:08-08
宜昌余海波「佛教环球联合会投放区块链+AI“佛教文化天竺国”虚拟弘法产品」
般若智慧 AI为信徒们布道这是一场关于科技与宗教的试验,由佛教环球联合会投的放区块链+AI“佛教文化天竺国”虚拟弘法产品在2024联合国卫塞节宣布推出,看起来更像宗教电子书的...
日期:06-27
软银股价应声大涨近 7% 消息称英特尔将成为Arm,IPO主要投资者_软银出售arm最新情况
6 月 13 日消息,消息人士向路透社透露称,英特尔正在与软银集团进行谈判,以期成为 Arm 首次公开募股(IPO)的主要投资者。此前报道,Arm 计划今年晚些时候在纳斯达克公开上市,其 IPO...
日期:09-24
谷歌浏览器如何同步账号「谷歌让步:Chrome浏览器与谷歌账号同步 你说了算」
  9月27日消息 谷歌在最新的Chrome 69浏览器中引入了一项改动,用户在浏览器上登录任何谷歌旗下的服务时,也将同时在浏览器登录自己的谷歌账号。此举受到了一些质疑。昨日谷...
日期:02-11
蔚来2022年累计交付新车122486辆 12月交付超1.5万辆创新高_蔚来2018年交付量
1月2日消息,蔚来日前公布2022年12月及全年交付量。蔚来12月交付新车15815辆,创月度交付新高,同比增长50.8%;2022年,蔚来累计交付新车122,486辆,同比增长34%。截至2022年12月31日,蔚...
日期:01-02
谷歌推出2千万美元生成式人工智能加速器计划_用于谷歌的加速器
划重点:苹果ipad 9.7寸rog最好的游戏本系列-...
日期:03-29
小米 14.9套餐「先人一步享优先发货 小米14系列开启全渠道预约」
来源:中关村在线SURFACE BOOK如何更新windows12芯片竞争力根据最新的消息,小米公司将在晚上19:00发布其新款手机——小米14系列。这次发布的速度前所未有,芯片发布后就能推出手...
日期:10-26
大对话:从底层认知开始,变成AI原住民
声明:本文来自于微信公众号 见实(ID:jianshishijie),作者:见实,授权转载发布。如今已经有非常多AI强应用领域的创业者们赚到新AI浪潮的钱了。这波浪潮来势汹汹,同样的,实干家们也...
日期:10-02
今天是世界表情符号日:打工人最喜欢用的emoji是笑哭_世界表情符号日是怎么决定的
7月17日是世界表情符号日”,有数据显示,我国每天的表情包发送量为6亿次左右。苹果12不送充电器是谣言吗如今的人们在网上聊天时,发表情包已然成为一种习惯,有时候一个表情包可以...
日期:07-18
电商品牌沉浮:谁有可能步聚美、当当、亚马逊后尘?
  近日,“亚马逊败走中国”被热烈讨论,自2004年高调进入中国,亚马逊中国的电商业务越做越小,到最后几乎已经没了存在感。   从一片荒芜到百花齐放,中国的电商舞台上演了激烈...
日期:07-25
网易严选宠物「网易严选宠粮独立产线落成」
最近,网易严选联合山东汉欧建立的首条宠物食品独立生产线及宠物营养研究与应用联合研发实验室正式启动。该生产线位于山东临沂,将主要生产冻干双拼猫粮等严选畅销产品,日产量达...
日期:04-04
算力网络英文「闻库:算力网络仍存在“网是网,算是算,安全为补充”的问题」
通信世界网消息(CWW)数字经济已成为全球抢占发展新机遇,塑造经济竞争新优势的焦点。算力作为数字经济时代新的生产力,其发展水平已经成为衡量国家经济社会发展的重要指标。有数...
日期:07-13
谷歌发布开源视觉语言模型PaliGemma 支持多视觉语言任务_google语音识别开源代码
5月17日 消息:谷歌推出了一款名为PaliGemma的开源视觉语言模型,该模型结合了图像处理和语言理解的能力,旨在支持多种视觉语言任务,如图像和短视频字幕生成、视觉问答、图像文本...
日期:05-17
专家呼吁给年轻人补贴:他们很辛苦 应缓解年轻人经济压力_国家对年轻人的支援
今日,申万宏源证券的首席经济学家赵伟,在公众场合发表了一席引人深思的言论,他强烈建议政府及社会各界应给予年轻人以实质性的补贴支持,直指当前社会活力感知下降的背后,是年轻一...
日期:08-02
国庆假期人人人人景点人人人人!专家呼唤:带薪休假真正落地落实
10月2日消息,国庆假期进入到了第二天,不少景点都是人满为患,你出去游玩了吗?今年中秋与国庆两个假期分离”,一定程度上改变了人们的出行决策。中秋假期提前分流了一部分探亲客流,...
日期:10-04