您的位置:首页 > 互联网

智源研究院开源代码生成训练数据集与评测基准TACO_智源研究院是国企吗

发布时间:2023-12-25 15:03:58  来源:互联网     背景:

12月25日 消息:TACO 是一个专注于算法的代码生成数据集,旨在为代码生成模型提供更具挑战性的训练数据集和评测基准。与当前主流代码评测基准相比,TACO 在数据规模、数据质量和细粒度评测方案上具有明显优势。它包括更大规模的训练集和测试集,每个题目都具备多样化的解题答案,并提供了细粒度的标签,如任务主题、算法、编程技能和难度等级。实验结果表明,当前流行的代码生成模型在 TACO 评测中与 GPT-4存在显著差异,说明这一领域仍有巨大的提升空间。TACO 数据集不仅提供了一个挑战性的测试方法,还能作为研究和改进模型性能的训练数据。通过社区的共同努力,可以激发更多创新的解决方案,进一步推动代码生成领域的发展。具体特性如下:

库克说苹果是美国公司

智源人工智能研究所

  • 规模更大:TACO 包括训练集(25443道题目)和测试集(1000道题目),是当前规模最大的代码生成数据集。
  • 质量更高:TACO 数据集中的每个题目都尽可能匹配多样化的解题答案,答案规模高达155万条,确保训练时模型不易过拟合以及评测结果的有效性。
  • 提供细粒度标签:TACO数据集中每个题目均包含任务主题、算法、技能及难度等细粒度标签,为代码生成模型的训练与评测更精确的参考。

TACO 开源地址:

全球汽车产业深度调整,中国驶上新能源发展“超车道”

小米11几个色

  • 论文:https://arxiv.org/abs/2312.14852
  • 智源开放数据仓库:https://data.baai.ac.cn/details/BAAI-TACO
  • GitHub:https://github.com/FlagOpen/TACO
  • Hugging Face:https://huggingface.co/datasets/BAAI/TACO

新鲜AI产品点击了解:https://top.aibase.com/

智源研究院将直接向他们支付费用


返回网站首页

本文评论
一小时 12 元,我在北欧监狱里训练 AI_北欧国家的监狱
声明:本文来自于微信公众号 InfoQ(ID:infoqchina),作者 | MORGAN MEAKER 译者 | 张乐 审校 | 平川 策划 | 凌敏,授权转载发布。芬兰工资水平普遍较高,并且很少有人从事互联网行业。...
日期:10-03
运营商8月运营数据:5G套餐用户数累计达12.79亿_国内5g套餐用户累计破亿
通信世界网消息(CWW)9月20日,中国电信、中国移动、中国联通分别公布了2023年8月份运营数据。具体情况如下:中国电信:5G套餐用户突破3亿户2023年8月,中国电信移动用户数累计4.0365...
日期:09-22
热烈、民主、团结、奋进丨CAAI第八次全国会员代表大会圆满落幕
  10月27日,中国人工智能学会第八次全国会员代表大会在西安召开,来自全国各地的558位会员代表出席了大会。经过现场差额选举,由会员代表无记名投票产生了第八届理事会和第一...
日期:02-23
华硕Zenfone 10发布:6300元起_华硕zenfone 4 x00ld
华硕Zenfone 10已经正式发布了,对于这款手机,它有两个版本可供选择。8GB内存和128GB存储空间的版本售价为799欧元(约合人民币6300元),而16GB内存和512GB存储空间的版本售价为929...
日期:06-30
特斯拉一个月退车「特斯拉新车3天三次趴窝 买回来就开几小时要退/换车:官方回应」
据黄金眼1818报道称,龚先生反映,22号提了一辆特斯拉MODEL Y,才开几个小时,就跳出故障提示,紧接着趴窝了。同样的故障,在之后两天连续出现,他要求退车或换车。我们列出了汽车三包法...
日期:11-27
GVS 视声与睿住智能达成深度战略合作:强强联合共建智慧生活新生态
  8月12日,广州视声智能股份有限公司(下称“GVS视声”)与美的置业旗下广东睿住智能科技有限公司(下称“睿住智能”),在佛山顺德签订战略合作协议。   在签约仪式上,GVS...
日期:12-22
东风汽车牵头打造自主“中国芯”:3款国内空白车规级芯片首流片!
快科技7月24日消息,据东风汽车官方,由东风公司牵头成立的湖北省车规级芯片产业技术创新联合体成立一年以来,在关键核心技术掌控方面正逐步挂果”,已实现3款国内空白车规级芯片首...
日期:07-25
中关村相机
是指位于北京市海淀区中关村地区的一系列相机销售和维修机构。中关村是中国IT产业发展的代表性区域,其中包括了众多电子设备和数码产品销售商和维修机构,其中相机销售和维修占...
日期:05-29
阿里巴巴申请香港纽约双重主要上市,预计年底前完成_阿里巴巴同时在美国及香港上市
查看最新行情   讯 7月26日早间消息,阿里巴巴集团发布公告,称董事会已授权集团管理层向香港联合交易所提交申请,将新增香港为主要上市地。在香港联交所完...
日期:07-31
宠物殡葬行业一年赚多少钱「给宠物做殡葬,一年两个亿!」
声明:本文来自于微信公众号 十里村(ID:shilipxl),作者:村长住在十里村,授权转载发布。各位村民好,我是村长。在杭州有一家这样的公司,一年给10万只宠物做丧葬服务,年营收超过2亿元...
日期:09-30
微软:Win11 预览体验成员现可直接从 Xbox 手柄栏启动云游戏_windows11玩xbox
IT之家 9 月 1 日消息,微软现宣布,Windows 预览体验成员现在可以直接从Xbox 手柄栏(Xbox Controller Bar)启动云流媒体游戏,并放出了一段操作演示视频。Xbox Controller Bar允许...
日期:09-15
Apple Watch 将会迎来一个史诗级功能
2011 年 10 月 5 日,Steve Jobs 在加州的家中去世。而在一年前,Jobs 曾在苹果内部提出过「智能腕表」的想法,「它需要非常小巧、方便、美观,同时也需要具有强大的功能」。大概在...
日期:02-25
天眼查:王慧文已入股AI架构公司一流科技_王慧文 履历
iphone 14 pro 摄像头抖动4月17日消息,天眼查App显示,近日,北京一流科技有限公司发生工商变更,袁进辉卸任法定代表人,由王慧文接任。与此同时,原股东北京快手科技有限公司、武汉高...
日期:04-17
GSMA 发出警告:频谱短缺将导致 5G 总成本大幅上涨
  7 月 10 日消息 全球移动通信系统协会(GSMA)呼吁全球监管机构提高中频频谱的可用性,并警告称如果在没有额外分配的情况下要达成联合国联网速度目标,每个城市可能会多花费...
日期:10-23
巴菲特持股苹果比例「清仓台积电,巴菲特Q1增持苹果2042万股」
巴菲特旗下伯克希尔·哈撒韦公司公布的13F持仓文件显示,2023年Q1,伯克希尔·哈撒韦增持苹果2042.42万股,持仓市值占比由38.90%升至46.44%。同时,其清仓了此前已大幅减持的台积电...
日期:09-28
用模拟器玩Switch游戏的体验:越发出神入化了_模拟器玩ns游戏
快科技6月5日讯,也许是不愿错过《塞尔达传说:王国之泪》的热度,Switch模拟器Yuzu再度更新(Early Access 3631 build)。中秋节国庆节混合手的画新版优化了显存调用、消灭了《王国...
日期:06-06
lg gram 16屏幕「LG推出新款15.6英寸Gram Ulstraslim笔记本」
IT之家 1 月 4 日消息,LG Gram 系列笔记本再次突破了对最轻最薄笔记本的自我定义。LG 公司在 CES 2023 上展示 15.6 英寸 Gram Ulstraslim 笔记本,厚度仅为 10.99 毫米,重量仅...
日期:01-04
班主任到家家访应该和她说些啥「班主任家访意外救下一家四口 中国消防提醒:厨房用火不离人」
10月14日消息,如果这名班主任不去家访,也许就真的酿成了一桩悲剧。据报道,本月10日,苏州大学第二实验学校一名班主任发现班上一名学生未按时到校,给学生父母打电话均未接通,出于职...
日期:10-15
贝壳2020年营收「贝壳2022年Q4净收入为167亿元,净利润3.72亿_」
3月16日消息,贝壳(NYSE:BEKE;HKEX:2423)发布2022年第四季度和全年财务业绩。财报显示,2022年贝壳全年成交额(GTV)为2.61万亿元(人民币,下同),营业收入为607亿元,全年GAAP口径净亏...
日期:03-16
达闼机器人推出机器人大模型RobotGPT_达闼机器人 ipo
7月12日 消息:根据中国新闻网报道,达闼机器人在2023WAIC(世界人工智能大会)上宣布推出全新的机器人产品RobotGPT,该产品是行业内首个机器人多模态大模型。RobotGPT包括RobotGPT1...
日期:07-12