您的位置:首页 > 互联网

鸭嘴兽-70B登顶HuggingFace开源大模型排行榜

发布时间:2023-08-24 18:57:27  来源:互联网     背景:

要点:

  • 鸭嘴兽-70B使用优化过的数据集Open-Platypus训练,删除相似和重复问题。

  • 应用LoRA和PEFT对模型进行微调,重点优化非注意力模块。

  • 检查并解决测试数据泄漏和训练数据污染问题。

8月24日 消息:最近,来自波士顿大学的鸭嘴兽-70B模型登顶了HuggingFace的开源大模型排行榜,成为目前全球开源领域中表现最强的语言模型。鸭嘴兽的变强有以下三个关键原因:

首先,鸭嘴兽使用了一个经过优化的开源数据集Open-Platypus进行训练。该数据集由11个开源数据集组合而成,主要包含人工设计的问题,只有约10%的问题是由语言模型生成。同时,研究人员对数据集进行了处理,删除了相似和重复的问题,最大限度地减少了数据冗余。这有助于模型在更小的数据集上获取更强大的能力。

华为5g手机壳图片

image.png

其次,研究人员使用了低秩逼近(LoRA)和参数高效微调(PEFT)对鸭嘴兽模型进行了微调。与完全微调不同,LoRA只训练转换层中的可训练参数,从而大大降低了计算训练成本。PEFT则主要微调了非注意力模块,如门控单元和上下采样模块,这进一步提升了模型性能。相比仅优化注意力模块,这种方法取得了更好的效果。

image.png

论文地址:https://arxiv.org/pdf/2308.07317.pdf

最后,研究人员深入探索了开放式语言模型训练中存在的数据污染问题,并针对鸭嘴兽的数据集进行了严格过滤。他们开发了一套启发式方法,仔细检查训练集中与测试集相似的问题,删除或以任何方式将其标记为潜在的测试数据泄露,避免了测试数据非故意地进入训练集,保证了模型评估的公平性。

通过数据集优化、模型微调技巧以及数据质量控制,鸭嘴兽-70B得以在众多开源大模型中脱颖而出,登上榜首。这为语言模型的训练提供了宝贵经验,也使开源社区对自主研发强大AI模型更具信心。如果社会各界能坚持开放创新、合作共赢的理念,我们离强人工智能的到来就不会太远了。

英特尔最后的机会

edge保存密码目录

apple airpods2有必要升级pro吗


返回网站首页

本文评论
阿里云大规模降价 核心产品最高降幅达50%_阿里云大规模降价 核心产品最高降幅达500
4月26日 消息:今日,阿里云宣布史上最大规模降价,核心产品价格全线下调15%至50%,存储产品最高降幅达50%。智慧物流智能化阿里云表示,此次降价空间来自于规模效应和今年飞天操作系...
日期:04-26
AMD与北京云基地宣布工件云计算联合实验室(amd中国研发中心)
(娄池)5月19日消息,AMD日前与北京云基地今天签署合作备忘录,共同宣布将成立云计算联合实验室,在云计算技术及相关产品的研发、设计等领域开展合作,以促进北京云计算产业链的完善,...
日期:07-28
图灵奖得主姚期智:ChatGPT后,下一个重要目标是让智能机器人有视觉、听觉
7月6日消息,2023世界人工智能大会上,图灵奖得主、上海期智研究院院长姚期智,对人工智能基础理论的突破以及基础理论接下来的发展方向等问题谈到,现在我们有位年轻的高老师,一年...
日期:07-06
泰国曼谷飞印度航班上演“全武行” 乘客不听指示被群殴
近日,泰国微笑航空国际航班上,一名男子坚持在起飞时倾斜座椅,导致与其他乘客发生争吵打斗,警方已对涉事乘客提出控告。报道称,事件发生在当地时间12月27日午夜,泰国微笑航空从曼谷...
日期:01-02
万网云主机_万网“第四代”专享主机公测备受追捧  500名额三天申请一空
  “你好,我想问一下万网‘第四代’专享主机什么时候开始第二期公测活动”一位张先生打电话咨询中国万网客服人员。“这几天这样的电话、邮件非常多”中国万网副总裁宋瑛...
日期:07-29
IBM推出基于IBM Cloud的GPU解决方案,助力客户部署基础模型和AI工作负载
本文作者:Rohit Badlaney, IBM 云计算产业平台业务总经理英特尔奔腾处理器全系列在全球范围内,AI的采用正在稳步增长。最近,我们看到“性能密集型计算即服务”(Performance-inte...
日期:05-10
ios内置天气app「苹果 iOS 16 更新,天气 App 新功能盘点」
IT之家 8 月 31 日消息,苹果在 iOS 16 中对天气应用进行了一些改变,包括新的通知类型,并增加了一些信息,从湿度、温度到能见度全方位为你提供服务。此外,新版天气 App 中的许多新...
日期:09-04
OpenAI GPT-4仍是在微软AI超级计算机上训练 多年前就已开始合作
3月15日消息,据外媒报道,由OpenAI训练的人工智能聊天机器人ChatGPT,自去年11月30日推出至今已收获大量的用户,在1月份就已突破1亿大关,随着关注的增加和支持设备的增多,用户还在持...
日期:03-15
剖析金融新基建,解决“触点、场景、底层平台”成关键趋势之一
  神策数据在《金融新基建系列报告——银行业六大中期趋势展望》中,列举并阐述了新基建背景下的银行业六大趋势。其中趋势三为:优化客户旅程并提升旅程管理能力,是银行胜出...
日期:07-16
中国发射首颗为「全球首颗,来自武汉!发射时间确定」
极目新闻记者 晏雯茫茫太空中,明年将新增一颗卫星,这也将是全球首颗医学遥感卫星。8月16日,极目新闻记者从武汉大学人民医院新闻发布会上获悉,全球首颗健康研究领域的专用遥感卫...
日期:09-11
由“技术男”到温暖的百度  百度牵手春晚是一次角色大转变
  1月17日,中央广播电视总台与百度联合宣布,百度将作为央视2019年《春节联欢晚会》独家网络互动平台参与今年的春晚红包互动。虽然春晚与企业合作发红包不再是新鲜事,但百度...
日期:12-04
小米手机套子「小米手机皮套」
小米手机作为国内知名的手机品牌,在国内市场上占有一席之地。而对于喜欢小米手机的消费者来说,也是必不可少的配件。是为了保护手机而设计的,可以为手机提供一定程度的防护作用...
日期:05-28
理想杀疯了!3月交付破2万辆 成新势力新老大 李想:30-50万SUV市场占比已接近20%
理想汽车真的杀疯了。2023年4月1日,理想汽车公布了2023年3月交付数据。当月理想汽车共交付新车20,823辆,再次实现单月交付超20,000辆的成绩,同比增长88.7%。三星s10 升级one ui...
日期:04-01
法大大电子签,助力数字政府建设加速度!_法大大电子签名安全吗
2023 年 2 月,中共中央、国务院印发《数字中国建设整体布局规划》。其中提到:应当加速发展高效协同的数字政务,构建普惠便捷的数字社会,提升数字化服务水平,加快推进“一件事一次...
日期:06-06
YouTube计划推出流媒体视频在线商店服务(youtube免费下载)
8月15日消息,据报道,近日,Alphabet旗下YouTube正计划推出其流媒体视频在线商店服务。   知情人士称,YouTube已重新与娱乐公司就参与该平台进行谈判,这一平台在YouTube被称为“...
日期:08-17
马斯克74岁母亲来武汉游玩:频繁晒照 称中国悠久的历史令人着迷
近日,特斯拉创始人马斯克74岁的母亲梅耶马斯克在社交平台上发文,分享她的中国之行。在广州、厦门、成都等多地游玩后,她表示:我在中国很愉快,每个人都很友善”。三星z fold3折叠...
日期:04-01
2012外星人靠不住!危机来临捎个“口信”Hold住场
  近期,UFO事件频发,传的神乎其神。有网友就开玩笑称,“2012要来了,外星人来救我们啦,要是今晚我没发微博,那就说明我已经登上UFO了!”玩笑归玩笑,但无论2012是否存在,重大自然灾...
日期:07-22
传“百度•易”或是基于Android手机操作系统
 传闻称“百度•易”很可能是一款基于Android的操作系统。(TechWeb配图)   【TechWeb消息】9月2日消息,百度今日在“2011年百度世界大会”上宣布推出移动终端软件平台“...
日期:07-22
中国移动、华为携手福建农业大学共同成立5G智慧海洋实验室
通信世界网消息(CWW)海洋是高质量发展的战略要地,也是支撑福建打造外向型经济的重要载体。随着福建擂响智慧海洋发展的战鼓,福建移动正在以创新通信技术赋能智慧海洋的发展,5G宽...
日期:07-22
小米平板6啥时候出「小米平板6将推14英寸版!与MIX Fold 3同步推出」
快科技8月1日,今天,知名数码博主数码闲聊站爆料消息,称小米平板6将推出一款Max版本,预计与小米MIX Fold3同步推出。据介绍,小米平板6Max将是小米首款14英寸大屏的旗舰平板,平板搭...
日期:08-01