您的位置:首页 > 互联网

又一开源替代品!Guanaco性能达ChatGPT级别 在单个GPU上训练一天就能搞定

发布时间:2023-05-27 17:04:47  来源:互联网     背景:

5月26日 消息:有一种名为 QLoRA 的新方法可以在单个 GPU 上微调大型语言模型。目前已经有研究人员用它来训练 Guanaco,这是一个性能效果99% 接近ChatGPT的聊天机器人。

华盛顿大学的研究人员提出了微调大型语言模型的方法 QLoRA。该团队利用 QLoRA 发布了 Guanaco,这是一个基于Meta 的 LLaMA模型的聊天机器人系列。最大的 Guanaco 变体具有650亿个参数,在与GPT-4的基准测试中实现了ChatGPT ( GPT-3.5-turbo )99% 以上的性能。

微调大型语言模型是提高其性能和训练的最重要技术之一。然而,这个过程对于大型模型来说计算量非常大,例如 LLaMA65B ,在这种情况下需要超过780GB 的 GPU RAM。虽然开源社区使用各种量化方法将16位模型简化为4位模型,从而大大减少了推理所需的内存,但类似的方法还没有用于微调。

image.png

QLoRA 允许在单个 GPU 上微调650亿个参数 LLM

通过 QLoRA,该团队展示了一种方法,允许将 LLaMA 等模型量化为4位,并添加LORA模型,然后通过反向传播进行训练。通过这种方式,该方法可以实现4位模型的微调,并将650亿参数模型的内存需求从超过780GB 降低到不到48GB 的 GPU 内存,其结果与微调16位模型相同。

仙剑奇侠传4卡住了咋办

“这标志着LLM微调的可访问性发生了重大转变:现在是迄今为止在单个GPU上微调的最大公开可用模型,”该团队说。

为了测试 QLoRA 和不同微调数据集的影响,该团队在八个不同的数据集上训练了1,000多个模型。一个关键发现:数据的质量比任务的数量更重要。例如,在OpenAssistant 的9,000个人类样本上训练的模型比在 FLANv2的100万个样本上训练的模型更适合聊天机器人。因此,对于 Guanaco,该团队依赖于 OpenAssistant 数据。

开源模型 Guanaco 达到 ChatGPT 级别

该团队使用 QLoRA 训练了 Guanaco 系列模型,表现第二好的模型在基准测试中以330亿个参数实现了 ChatGPT 性能的97.8%,同时在不到12小时的时间内在单个普通的 GPU 上对其进行了训练。在专业 GPU 上,该团队仅用24小时就训练了具有650亿个参数的最大模型,并达到了ChatGPT 性能的99.3% 。

最小的 Guanaco 模型具有70亿个参数,仅需要5GB 的 GPU 内存,并且在 Vicuna 基准测试中比26GB 的羊驼模型高出20个百分点以上。

除了 QLoRA 和 Guanaco,该团队还发布了 OpenAssistant 基准测试,该基准测试在953个提示示例中让模型相互竞争。然后可以由人类或 GPT-4对结果进行评分。

Guanaco数学不好,QLoRA可用于移动微调

滴滴的创始人程维的成功之处

不过,该团队引用数学能力和4位推理目前非常慢。接下来,该团队希望提高推理能力,预计速度提升8至16倍。

由于微调是将大型语言模型转变为类似 ChatGPT 的聊天机器人的重要工具,该团队相信 QLoRA 方法将使微调更容易获得——尤其是对于资源较少的研究人员而言。他们认为,这对于自然语言处理领域尖端技术的可访问性来说是一个巨大的胜利。

论文指出:“QLORA 可以被视为一个平衡因素,有助于缩小大型企业与拥有消费类 GPU 的小型团队之间的资源差距。这也意味着,小企业可以通过像 Colab 这样的云服务进行微调大模型。

除了微调当今最大的语言模型外,该团队还看到了私有模型在移动硬件上的应用。“QLoRA 还将在您的手机上启用隐私保护微调。我们估计您每晚可以使用 iPhone12Plus 微调300万个单词。这意味着,很快我们将在手机上拥有专门针对每个应用程序的LLM。”第一作者 Tim Dettmers 在 Twitter 上说。

关于Guanaco-33B 更多信息和代码可到 GitHub 查看。

参考网址:

https://github.com/artidoro/qlora

相关产品可访问《有哪些类似chatgpt产品? 17 个ChatGPT/GPT4 开源替代品推荐(附网址)》一文了解。


返回网站首页

本文评论
梦幻发布,坚果智慧墙O1把梦想带进现实
  人们常说,电影世界的光与影总能带给我们无限的可能。而人们对影像生活的理解和认知,也伴随着生活方式的改变而逐渐进化。最开始,光影技术平常人难以触及,后来电影院的普及,...
日期:03-13
iPhone 14 Plus震动马达面积惊人,安卓几无一款能比,游戏手机实锤?「iphone震动马达对比」
10月9日消息 iFixit拆解发现,iPhone 14 Plus搭载一块罕见的正方形震动马达体,面积远大于同系列的其它三款手机。数码博主肥威提供的参考信息显示,iPhone 14/14 Pro马达面积约18...
日期:10-10
华为、小米、OPPO、vivo联手干了件大好事:手机快充终于通用了「小米 vivo oppo 华为」
手机快充近年来是国产手机技术领先三星、苹果的地方,而且旦用难回,100W以上的快充不到半小时就能充满电,治好了大家的续航焦虑症。rtx 4090发布哔哩哔哩财报时间不过国内的四大...
日期:09-30
索尼5000流明投影机「索尼发布新款高清激光投影机:7000流明 支持4K/60p输入」
10月12日,索尼发布两款紧凑型WUXGA 3LCD激光投影机VPL-P630HZ 和VPL-P530HZ,具有高亮度,灵活的安装性和优秀的操作性能,将于2022年11月上市。其中,VPL-P630HZ为6400流明(中心亮度...
日期:10-15
95后小伙携鸡仔摆出“牛气冲天”造型 在抖音向全国网友拜年
  你见过这样的拜年方式吗?在甘肃省陇南成县,@山村鸡司令 率领四千余只鸡仔,摆出“牛气冲天”文字,在抖音向全国网友拜年,为大家送上一份独特的牛年祝福。   抖音用户@山村...
日期:07-16
谷歌总部的安卓机器人雕像没了
  3 月 20 日消息,谷歌的安卓雕像曾经占据的谷歌总部的一角,现在那里已经变成了“一块泥地”。一些参观了谷歌 44 号楼的人声称,安卓标志性的机器人雕像已经神秘消失了。...
日期:07-18
阿根廷世界杯成功夺冠:EA《FIFA》系列已连续四届顺利“预言”冠军
今天凌晨,万众瞩目的卡塔尔世界杯决赛随着阿根廷队捧起大力神杯落幕,这是这支球队是个36年再次夺得世界杯冠军,梅西也成为了史上第一位两次获得世界杯金球奖的球员。而在决赛打...
日期:12-19
千万爆款视频获涨粉30万,B站音乐区终迎“狠活儿”UP主?「哔哩哔哩千万up」
声明:本文来自于微信公众号 TopKlout克劳锐(ID:TopKlout),作者:白羊,授权转载发布。B站的音乐区已经很久没有“狠活儿”了在2018年B站第一届百大up主名单中,音乐区是入榜up主数量...
日期:02-09
特斯拉“AI日”开幕:马斯克发布人形机器人 预计每台2万美元_特斯拉AI机器人
10月1日 消息:今天,特斯拉2022年AI日活动于加州帕罗奥图举行,特斯拉CEO马斯克出席了活动。在活动上,预告已久的人形机器人擎天柱Optimus原型机正式亮相。相较于经过美颜”的人...
日期:10-04
欧盟人工智能「欧洲成立人工智能研究中心来监督大型平台」
4月19日 消息:据techcrunch报道,欧洲算法透明度中心 (ECAT) 已经成立,以支持欧盟的数字服务法案 (DSA)。该部门将询问 Facebook、Instagram 和 TikTok 等主流数字服务的算法,以确...
日期:04-19
报告称有100多万建筑的纽约正下沉 每年下沉约一到两毫米_纽约下沉广场
一项新的地质研究表明,纽约市可能正在下沉。该研究表明,所有摩天大楼的重量导致城市部分地区每年在某些地区下沉约一到两毫米。任天堂switch上面的模拟器小米副董事长这听起来...
日期:05-19
【隔空投送】2023新品,加速科技ST2500E重磅来袭
探索不息创新不止随着5G通信、人工智能、虚拟现实、新能源以及先进封装技术的飞速发展,芯片线宽尺寸不断减小,芯片复杂度不断跃升,对测试机的要求愈加提高。提供多种测试程序并...
日期:05-23
2023一季度国内手机出货下滑11%:创十年新低!苹果卖成国内第一「下半年手机出货量」
快科技4月27日讯,据分析机构Canalys(科纳仕)发布的最新数据,今年一季度,中国智能手机出货同比下滑11%,降至6760万台,是2013年以来最低的一季。品牌方面,iphone14系列持续热销,苹果出...
日期:04-27
让聊天机器人完美回复--基于PaddlePaddle的语义匹配模型DAM
  引言   语义匹配是NLP的一项重要应用。无论是问答系统、对话系统还是智能客服,都可以认为是问题和回复之间的语义匹配问题。这些NLP的应用,通常以聊天机器人的形式呈现...
日期:12-21
一个勒索软件团伙正在发布被黑客获取的洛杉矶学童的数据
在一个网络犯罪团伙发布了在勒索软件攻击中获得的数据后,有关洛杉矶联合学区(LAUSD)学生的敏感信息于周六开始出现在网上。洛杉矶联合学区校长阿尔贝托-卡瓦略(Alberto M. Carva...
日期:10-04
取消调休制度「专家建议固定法定假期取消调休 网友:我举双脚赞成」
近日,“能不能接受五一放一天不调休”的话题引发舆论热议,有媒体进行投票调查,截至发稿前,58%的网民支持调休,13%不支持调休,参与投票者以90后为主。对于今年五一假期放五天连续假...
日期:04-18
海底捞让自带酒水不「海底捞回应禁止自带菜:可自带酒水饮品」
相信经常刷短视频的同学都看到过这么一个段子,在询问海底捞工作人员能否自带菜品,并得到对方允许的回答后,就从包里掏出各种牛羊肉卷、火锅丸子等等。任泽平做难而正确的事这群...
日期:02-25
防电信诈骗要戒贪不惧  保持一颗平常心_电信网络诈骗防范意识
近年来,犯罪分子利用手机短信、电话和网络等虚拟状态进行诈骗的犯罪活动日益猖獗,常见的电信诈骗形式近30种,令人防不胜防。 不少人在生活中遇到过电信诈骗,从中奖到涉嫌洗钱...
日期:07-28
主妇起诉离婚才知丈夫年薪300万 法院判女方分60%财产「老公月薪3000离婚」
近日,北京一中院家事专业审判庭团河法庭处理了一起涉及财产分割的离婚案。男方李岩在诉讼中声称名下仅剩10万元存款,其妻张钰对此毫不知情。然而,法院调查发现,李岩年收入高达30...
日期:03-08
香港恒生指数收涨0.03% 理想汽车收涨超4%_香港恒生指数总市值
  讯 9月27日上午消息,香港恒生指数收涨0.03%,结束日线四连跌;恒生科技指数涨0.55%。理想汽车收涨超4%,美团收涨4%。最好的120Hz直屏9月苹果airpods3发布吗tcl电视48寸智能电...
日期:09-28