您的位置:首页 > 互联网

微软推出微型AI自动编码模型phi-1,击败 GPT-3.5_微软ai写代码

发布时间:2023-06-26 13:22:20  来源:互联网     背景:

6月26日 消息:微软的人工智能研究人员发布了一种新的、轻量级的代码生成模型 phi-1,并且其性能优于 ChatGPT 背后的大型语言模型 GPT-3.5。

据了解, 这个基于 Transformer 的模型仅拥有13亿个参数,相比之下,Codex拥有120亿个参数。

荣耀潮品专卖店

微软的研究人员仅用了四天时间就使用 Nvidia 的8个 A100芯片来训练 phi-1。该模型使用来自网络的60亿个token以及使用 GPT-3.5生成的另外10亿个token进行训练。

在性能方面,phi-1在HumanEval基准测试中获得了50.6% 的 pass@1准确率。尽管模型小得多,但微软模型击败了 Hugging Face 和 ServiceNow 的 StarCoder (33.6%)、OpenAI 的 GPT-3.5(47%) 和谷歌的 PaLM2-S (37.6% ) 。

在MBPP pass@1测试中,phi-1表现更好,取得了55.5% 的分数。上述许多模型尚未发布该基准测试的结果,但 WizardLM 的WizardCoder在本月早些时候进行的测试中得分为51.5%。WizardCoder 是一个150亿个参数模型,而 phi-1的参数模型为13亿个。

微软ai写代码

高质量数据带来差异

微软的研究人员认为,正是“高质量数据的力量”让 phi-1表现如此出色。为了说明这一点,研究人员将他们模型的论文命名为“教科书就是你所需要的”。

他们写道:“正如一本全面、精心制作的教科书可以为学生提供掌握新学科所需的知识一样,我们的工作展示了高质量数据在磨练语言模型在代码生成任务中的熟练程度方面的显着影响。” 。

“通过制作‘教科书质量’数据,我们能够训练出一个模型,尽管模型大小缩小了10倍,数据集大小缩小了100倍,但在编码基准(例如 HumanEval 和 MBPP)上,该模型超越了几乎所有开源模型。”

与其他可用的编码模型相比,Phi-1仅限于 Python 编码。他们表示,该模型的局限性还在于它缺乏大型模型的特定领域知识,例如使用特定 API 进行编程。

企业对员工健康的关怀

为了扩展他们的工作,微软的研究人员建议使用 GPT-4而不是 GPT-3.5来生成用于模型训练的合成数据。

研究人员还将寻求提高数据集的多样性和非重复性,尽管该团队表示,他们必须找到方法“在数据生成过程中注入随机性和创造力,同时仍然保持示例的质量和连贯性。”

京东云大会


返回网站首页

本文评论
触宝大数据游戏洞察|街机游戏魔性玩法获客,新用户蓝海值得关注
  前言   轻型游戏是新手玩家最易接触到的门类,凭借着自己的易上手、便于操作、填充碎片时间等特点让玩家养成游戏习惯,街机类游戏正是通过线条简单,满足解压需求和填充碎...
日期:09-28
原神总收入超40亿美元  8个月赚10亿美元「原神 全球收入」
1月4日 消息:据Sensor Tower数据显示,米哈游开放世界游戏《原神》全球总收入已超过40亿美元。值得注意的是,今年5月份,原神的营收已经达到了30亿美元,也就是说,原神8个月内赚了10...
日期:01-04
资深果粉分享:iPhone14 Pro的升级和槽点「iPhone11pro值得升ios14」
随着每年9月的“科技春晚”的落幕,今年的新款iPhone 也公诸于世。作为果粉的我,也第一时间入手了iPhone 14 Pro 银色版。使用了一段时间沉浸在新机的喜悦同时,来分享一些我对新...
日期:10-14
特斯拉现车优惠「特斯拉新年降价:购车最多可优惠1万元 还有自动辅助驾驶福利」
1月2日消息,特斯拉推出新年限时福利,1月1日至2月28日期间,完成交付的Model 3和Model Y的新车订单,可享受6000元限时交付激励方案;若通过特斯拉合作保险机构购买相应车险,还可享受4...
日期:01-02
中国物流资产:京东同意收购股份,交易总价 39.9 亿港元(京东物流参股公司)
  9 月 3 日消息 中国物流资产发布公告称,京东同意收购 9.16 亿股股份,购买价为每股 4.35 港元,总代价为 39.9 亿港元。   据中国物流资产官网显示,该公司是宇培国际、RRJ...
日期:11-05
消费贷“疯狂”抢客_消费金融获客
智能手表诞生以来,在这个流行沃尔玛的旗舰店叫什么泰国语越南语大众点评张涛痛哭amd线程撕裂者3995wx暴风魔镜vr 官网   本报记者 秦玉芳 广州报道   消费信贷持续内卷...
日期:08-07
喜报!百度获2020年度信创工委会“卓越贡献成员单位”荣誉称号
  近日,中国电子工业标准化技术协会信息技术应用创新工作委员会(简称“信创工委会”)首次对2020年做出突出贡献的成员单位进行表彰。百度凭借在AI关键技术创新、产业落地...
日期:07-16
微软Bing上线在线绘图功能:文字生成图片 仅支持英文「微软画图使用技巧」
3月21日消息,今日,微软Bing搜索引擎正式推出在线AI绘图功能,该功能由OpenAI的DALL-E驱动,用户可通过简单的文字描述生成图片,不过该功能目前仅支持英文输入。海南租法拉利多少钱...
日期:03-24
注销800万粉丝抖音号!又暴涨350万粉,辛吉飞还是很火?_抖音八十多万粉丝
声明:本文来自于微信公众号 运营公举小磊磊(ID:gongjulei),作者:运营学习平台,授权转载发布。还记得9月份“辛吉飞注销抖音账号”事件吗?《20天暴涨600万粉丝后!他竟然注销账号,...
日期:11-10
蓝凌软件入编《2021年企业数字化转型场景研究报告》
  12月14日,首届中央企业数字化转型峰会在深圳湾体育中心顺利开幕,峰会由大湾区中央企业数字化协同创新联盟、中央企业数字化发展研究院主办,有关中央企业、地方国有企业等...
日期:07-17
比特币价格短暂冲上20000美元:上涨仍面临压力_2个月暴涨近200%,比特币再登1万美元关口
  讯 北京时间9月28日早间消息,据报道,当地时间周二,比特币价格短暂站上20000美元,冲至一周多新高,但上涨仍然面临压力。由于美国股市渐渐进入熊市,比特币价格最终还是下跌。从C...
日期:09-29
科幻电影既视感!日本油电混动飞行摩托交付:最高速达100km/h
你是否幻想过《星球大战》里的飞行摩托车”走进现实?没想到在科幻片中看到的飞行摩托”,最近已经在日本完成买家交付,这款飞行摩托”不止外形极具科技感,还是油电混合动力,能定制...
日期:12-18
umail邮件服务器_U-Mail邮件系统七大功能助你全面应对安全威胁
  电子邮件由于其技术和协议原因,传输和存储过程均是明文,邮件用户很可能遭到邮件内容被截获甚至篡改、邮箱被炸毁等多种攻击。   邮件传输的过程可被很多技术手段拦截邮...
日期:07-16
快手推出“快看新车计划” 旨在扶持新车内容建设
10月8日消息,快手汽车近日启动“快看新车计划”,该计划是快手汽车针对新车内容建设推出的专项扶持计划,面向新车领域创作者提供一系列内容扶持、流量激励及创作者服务。SAP S/4...
日期:10-10
被《狂飙》带火了!山东强盛集团开通微博:董事长叫孙红雷
今日消息,山东强盛集团正式开通官方微博,这家公司因热播剧《狂飙》火爆全网。airpods pro华强北最新固件据媒体报道,热播剧《狂飙》中的反派人物高启强卖鱼起家,创办了强盛集团,...
日期:01-31
苏泊尔申请产品复检 苏宁全国下架相关炊具
  苏泊尔“质量门”事件昨日(10月18日)又传出新动向。据知情人士向《每日经济新闻》记者透露,由于对相关检测结果存有异议,苏泊尔已经就涉及此次“质量门”事件的部分产品...
日期:07-24
母亲节温暖加倍 百度地图“升级”母婴室呼吁公众关爱母婴出行
  守护母婴出行、让每一位妈妈都能得到更好的保障或许是对母亲节的“最佳献礼”。2019年母亲节,百度地图携手百度宝宝知道、华润·五彩城,共同“升级”线下母婴室,对硬件设...
日期:06-19
法拉第ff91售价「法拉第FF 91破美国著名赛道纪录!贾跃亭:开上瘾了 停不下来」
今年5月份,法拉第未来召开FF 91Faraday Future2.0发布会,首辆量产车FF 91终于进入交付阶段,创始人贾跃亭用了9年时间也终于圆了他的造车梦”。快科技6月11日消息,贾跃亭日前在微...
日期:06-11
牛年有“New”范儿,科大讯飞消费者产品助你开工火力全开_科大讯飞营销策略
  日月开新元,天地又一春。浓浓的年味儿还未褪去,不少人已经在牛年伊始卯足一股“牛劲”奔赴在追梦之旅上,期盼着打好开工“第一仗”、迎来新年“开门红”。   不过,工欲善...
日期:07-16
上半年游戏业绩透视:新游上线不足  研发成本难减_游久游戏财报
  转自:中国经营网  本报记者 许心怡 吴可仲 北京报道  进入2022年以来,中国游戏行业迎来转折:国内收入增长见顶,海外成为新的掘金市场……  《中国经营报》记者梳理发...
日期:09-26