您的位置:首页 > 互联网

微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!

发布时间:2023-10-31 19:49:53  来源:互联网     背景:


新智元报道

编辑:编辑部

【新智元导读】微软最近一篇论文爆料,GPT-3.5的参数量只有20B,远远小于之前GPT-3公布175B。网友表示,ChatGPT能力似乎配得上这个体量?

GPT-3.5只有200亿参数?

今天,大模型圈都被微软论文中的一纸截图刷爆了,究竟是怎么回事?

就在前几天,微软发表了篇论文并挂在了arXiv上,该论文提出了一个参数量只有75M的小规模扩散模型——CodeFusion。

性能方面,7500万参数的CodeFusion在top-1准确率指标上,可以与最先进的350M-175B模型相媲美。


论文地址:https://arxiv.org/abs/2310.17680

这篇论文的工作很有意义,但引起大家格外注意的却是——

作者在对比ChatGPT(gpt-3.5-turbo)时,标称的参数量竟然只有20B!


在此之前,大家针对GPT-3.5参数量的猜测都是1750亿,这相当于是缩减了差不多十倍!


根据这篇论文的爆料,网友还去维基百科上更新了GPT-3.5的介绍,直接把参数大小改成了20B。

消息一出,直接登上知乎热搜,网友们都炸了。


有人表示,赶紧回头再把我之前模型蒸馏的博文拿出来复习复习 。


是乌龙还是事实?

网友的爆料贴一出,瞬间就引发了激烈的讨论。

目前,已经有超过68万人前来围观。


这位老哥表示,论文的几位作者也都在用推特,估计过不了多久就会亲自下场解释。


而对于这个神秘的20B,网友们也是众说纷纭。


有人猜测,这很可能是作者手误打错了。比如原本是120B,或者200B。


结合现实中的各项评测来看,确实有很多小模型能够取得和ChatGPT差不多的成绩,比如Mistral-7B。


也许,这也是侧面证实了GPT-3.5体量真的不大。


很多网友也认为20B的参数可能是准确的,纷纷发出感叹:

这也太难以想象了!Falcon-180B和Llama2-70B,竟然都无法击败这款20B的模型。


也有网友认为,gpt-3.5-turbo是精炼版的gpt-3.5。

而这次参数的泄露,正好从侧面印证了那些关于gpt-3.5-turbo表现不如旧版gpt-3.5的传言。


不过,根据OpenAI的官方文档,除了已经不再使用的text-davinci和code-davinci,GPT-3.5家族全员都是基于gpt-3.5-turbo构成的。



微软发布CodeFusion

而爆出GPT3.5只有20B参数的微软论文,是想介绍一个用于代码生成的扩散模型。

研究人员针对Bash、Python和Microsoft Excel条件格式(CF)规则的自然语言生成代码的任务来评估这个模型——CodeFusion。

实验表明,CodeFusion(只有75M参数)在top-1精度方面与最先进的LLM(350M-175B参数)相当,并且在top-3和top-5精度方面性能和参数比非常优秀。


模型架构

CODEFUSION用于代码生成任务,它的训练分为两个阶段,第一阶段是无监督预训练,第二阶段是有监督微调。


在第一阶段,CODEFUSION使用未标记的代码片段来训练降噪器和解码器。它还使用可训练的嵌入层L,将代码片段嵌入到连续空间中。

在第二阶段,CODEFUSION进行有监督的微调,使用来自文本-代码对数据。在这个阶段,编码器、降噪器和解码器都会得到调整,以更好地执行任务。

此外,CODEFUSION还借鉴了之前有关文本扩散的研究成果,将来自解码器的隐藏表示D融合到模型中。这是为了改进模型的性能。在训练过程中,在不同step中,模型引入一些噪声,然后计算损失函数,以确保生成的代码片段更符合预期的标准。

总之,CODEFUSION是一个执行代码生成工作的小模型,通过两个阶段的训练和噪声引入来不断提升其性能。这个模型的灵感来自于文本扩散的研究,并通过融合解码器的隐藏表示来改进损失函数,以更好地生成高质量的代码片段。

评估结果

下表总结了CODEFUSION模型与各个基线模型在top-1、top-3和top-5设置下的性能表现。

百度一亿红包入口

在top-1中,CODEFUSION的性能与自回归模型相媲美,甚至在某些情况下表现更出色,尤其是在Python任务中,只有GPT-3(175B)的性能稍微优于CODEFUSION(75M)。然而,在top-3和top-5方面,CODEFUSION明显优于所有基线模型。


表下表展示了CODEFUSION和自回归模型(包括T5、CodeT5、StarCoder、CodeGen、GPT-3)在各项基准任务上的平均多样性结果,考察了每个模型的前5代生成结果。

相对于自回归模型,CODEFUSION生成更加多样化的结果,表现更出色。


在消融实验中,作者停止了去噪过程,并生成了在时间步t∈[0, T]范围内的当前状态的代码片段。利用归一化字符串编辑距离来衡量每个时间步长(每100步为一个增量)所获得的结果。

这一方法有助于总结和展示CODEFUSION模型的逐步进展,如下图所示。

ipadpro 2020要升级ipados17吗


说了这么多,GPT-3.5的参数量到底是多少?GPT-4与GPT-3.5在技术和其他方面有着什么样的联系?

GPT-3.5是一个个小专家模型的集成还是一个通才模型?是通过更大模型的蒸馏还是更大数据训练?

这些问题的答案只能等到真正开源的时候才能揭晓了。

参考资料:

https://arxiv.org/abs/2310.17680

https://twitter.com/felix_red_panda/status/1718916631512949248


返回网站首页

本文评论
学生热衷淘宝体 老师称考试要慎用
  今年暑假,本市举行“我给老师写封信——中小学生书信大赛”。最近,某中学在初评时发现,有多封信采用的是时髦的“淘宝体”,读来既令人发噱,也让不少语文老师担忧此种文体在...
日期:07-22
2000元档最强!真我GT Neo5 SE白色版采用有机硅素皮工艺:旗舰设计下放「真我gt neo机身材质」
快科技5月19日消息,真我GT Neo5SE自从发布以来,凭借着非常强劲的性能,和极具竞争力的价格备受好评。根据官方消息,真我GT Neo5SE将推出全新配色圣白幻影”,这是一款全新设计的白...
日期:05-19
Facebook工程师_Facebook招聘工程师 计划打造桌面软件团队
(小贝)北京时间5月28日消息,据国外媒体报道,Facebook网站的招聘启事显示,Facebook计划打造一支桌面软件工程师团队,此举可能是为推出iPad应用做准备。Facebook尚未推出iPad应用,这...
日期:07-28
苹果在英国推出iPhone的轻触支付 支持iPhone XS以上机型
7月13日 消息:据macrumors消息,苹果公司宣布在英国推出了iPhone上的Tap to Pay(轻触支付)功能,让该国的独立卖家、小商户和大型零售商可以使用iPhone作为支付终端。这项功能于20...
日期:07-14
OpenAI与迪拜G42合作,瞄准扩张中东市场
划重点:华为手表watch gt3 pro 价格1. 谷歌ceo皮查伊年薪...
日期:10-19
天天被人偷技术!董明珠:格力没买过别人的技术 全靠自己研发_董明珠们有钱接盘格力电器吗?我们帮她算了一笔账
5月22日消息,在近日举行的第三届江苏发展大会上,珠海格力电器股份有限公司董事长、总裁董明珠表示,我们从200人的企业起家,从一年产量一千万的企业做到今天两千亿的规模,主要来源...
日期:05-22
设计师养什么宠物「95后设计师辞职当动物饲养员 希望可以治愈大家」
近日,浙江宁波25岁的小沈在从设计行业裸辞后转行成为了一名饲养员。小沈表示之前的工作让她感到精神内耗,之后一次偶然的机会去了当地的野生动物园,从而萌生了成为饲养员的想法...
日期:03-24
傅首尔推荐阿尔法蛋:有AI的礼物才最好
  《奇葩说》又上热搜了。   距离春节还有不到一周,这期的辩题很应景——“父母固执己见该反抗吗”?   一向金句频出、观点犀利的辩手傅首尔再次给出了惊艳的表现。...
日期:05-15
为了不被马斯克裁员 推特员工每周狂干84小时_马斯克今天在推特说什么
凤凰网科技讯 北京时间11月2日消息,近日,据CNBC报道,自马斯克上任以来,推特经理们要求一些员工实行工作12个小时的轮班制,每周工作7天,以应对迫在眉睫的裁员危机。国美电器进军家...
日期:11-07
搜狗AI主播_搜狗AI合成主播“雅妮”首次亮相
  8月9日,在北京亦创国际会展中心的第三届中国“网络文学+”大会开幕式暨高峰论坛上,。   在现场,让观众直接感受到了AI合成主播和真人主播,几乎可以达到真假难辨的程度,这...
日期:10-24
微信新规保障消费者权益 30元以下商品须包邮_微信上的315消费保有用吗
近日,微信官方发布新规定,自即日起至2023年6月20日,所有售价在30元及以下的商品必须包邮,适用范围包括港澳台和海外地区。此举旨在营造视频号带货的良好环境,规范商家行为并保护...
日期:06-16
成都东部新区与百度达成战略合作,深耕智慧城市、工业互联网等领域
  2月26日,2021年成都东部新区重大产业化项目集中签约仪式举行。签约仪式上,成都市东部新区与百度签署战略合作框架协议,双方将在智慧城市建设、新型城市治理、工业互联网产...
日期:07-16
占比30% 消息称网约车公司Lyft将裁员1200人_网约车负面新闻
IT之家 4 月 22 日消息,Lyft 新任首席执行官 David Risher 宣布,将于下周四启动新一轮裁员。根据《华尔街日报》报道,本次裁员影响 1200 人,占比超过 30%。Risher 表示提前发布...
日期:10-02
马斯克限制用户推特浏览量致大量用户外流 竞品Bluesky迎来创纪录流量
7月4日消息,社交媒体平台推特的竞争对手Bluesky表示,上周末埃隆·马斯克(Elon Musk)宣布推特限制浏览量之后,Bluesky的流量于周六迎来“历史新高”。上周末马斯克在推特上宣布,为...
日期:07-04
好未来二季度净利润1500万美元 公司股价跌超11%_好未来第三季度财报
10月23日消息,好未来公布其截至2020年8月31日的2021财年第二季度未经审计财务报告。二季度,好未来净收入11.033亿美元,同比增长20.8%;归属于好未来的净利润为1500万美元,上年同...
日期:08-07
诺基亚宣布将在迪拜开设“创新实验室”,推动AI技术在网络自动化领域应用
通信世界网消息(CWW)据外媒报道,诺基亚宣布将在迪拜设立一个开放创新实验室,旨在推动中东非地区的技术创新,并加速AI和ML(机器学习)等新技术在网络自动化和优化领域的应用。据悉,新...
日期:09-27
芒果超媒:芒果TV已与小鹏汽车等车企展开会员领域相关合作_芒果超媒成立时间
证券时报e公司讯,芒果超媒(300413)在互动平台表示,芒果TV已与小鹏汽车等车企展开会员领域相关合作,共同探索车载屏视频娱乐服务。广泛携手智能汽车平台是芒果TV会员权益服务的...
日期:08-19
老虎证券股权激励新业务再逆袭:小米、跟谁学、嘉楠耘智等60家公司背后的服务商
  要么飞奔,要么死去。   巫天华(老虎证券创始人兼CEO)看到《鞋狗》中的这句话时颇有感触。   他创办的老虎证券当时并不是最早的美股互联网券商,晚于第一理财、史考...
日期:07-14
街上的井盖「网友吐槽一条街三四十个井盖 官方回应:雨污分流、将铺上沥青」
7月1日消息,据媒体报道,近日在山东济宁,有网友拍摄视频吐槽称,短短的一条路上竟然有三四十个井盖。redmi k60系列发布时间从其拍摄的画面看,这些井盖确实密密麻麻,排列并不整齐,而...
日期:07-01
果壳CEO姬十三成立未来光锥前沿科技基金,将专注前沿科技投资
4月23日消息,2023年4月,未来光锥前沿科技基金正式完成一期人民币基金的首关,将专注于前沿科技驱动早期项目的股权投资。据介绍,未来光锥前沿科技基金由果壳发起,果壳CEO嵇晓华(姬...
日期:04-23