您的位置:首页 > 互联网

LLaMA 2:最新开源 GPT 模型的功能和演示教程_gpl-2.0开源协议

发布时间:2023-07-20 15:14:47  来源:互联网     背景:

7月20日 消息:本文将为大家介绍最新发布的 GPT 模型 LLaMA 2 的新功能和更新内容。LLaMA 2 在原始模型基础上进行了改进,包括使用 40% 更大的数据集、经过强化学习和人类反馈调优的聊天变体以及可扩展到 700 亿参数的模型。文章还会为大家展示如何在 Paperspace Gradient 笔记本中运行 LLaMA 2 模型的演示。

华为荣耀4a价格

型号概览

让我们首先概述 LLaMA 2 中可用的新技术。我们将首先回顾原始的 LLaMA 架构,该架构在新版本中没有变化,然后检查更新的训练数据、新的聊天变体及其 RHLF 调整方法,以及与其他开源和闭源模型相比,完全扩展的 70B 参数模型的功能。

gpt2开源了吗

LLaMA 2 模型架构

LLaMA 和 LLaMA 2 模型是基于原始 Transformers 架构的生成式预训练 Transformer 模型。我们在最初的 LLaMA 文章中详细概述了 LLaMA 模型与之前的 GPT 架构迭代的区别,但总结如下:

  • LLaMA 模型具有类似于预归一化的 GPT-3 功能。这有效地提高了训练的稳定性。在实践中,他们使用 RMS Norm 归一化函数来归一化每个变压器子层的输入而不是输出。这重新调整了不变性属性和隐式学习率适应能力
  • LLaMA 使用 SwiGLU 激活函数而不是 ReLU 非线性激活函数,显着提高了训练性能
  • 借鉴 GPT-Neo-X 项目,LLaMA 在网络的每一层都具有旋转位置嵌入 (RoPE)。

正如 LLaMA 2 论文附录中所报告的,与原始模型的主要架构差异是增加了上下文长度和分组查询注意力 (GQA)。上下文窗口的大小增加了一倍,从 2048 个标记增加到 4096 个标记。更长的处理窗口使模型能够产生和处理更多的信息。值得注意的是,这有助于理解长文档、聊天历史和摘要任务。此外,他们还更新了注意力机制来处理上下文数据的规模。他们比较了原始的多头注意力基线、具有单个键值投影的多查询格式以及具有 8 个键值投影的分组查询注意力格式,以处理原始 MHA 格式的成本,其复杂性显着增加增加上下文窗口或批量大小。

gpt原理

总之,这些更新使 LLaMA 在各种不同任务中的表现明显优于许多竞争模型。从 LLaMA 2 项目页面提供的上图可以看出,与 Falcon 和 MPT 等专用和替代 GPT 模型相比,LLaMA 的性能非常好或几乎一样好。我们期待在未来几个月内进行研究,展示它与 GPT-4 和 Bard 等大型闭源模型的比较。

更新的训练集

LLaMA 2 具有更新和扩展的训练集。据称,该数据集比用于训练原始 LLaMA 模型的数据大 40%。即使对于最小的 LLaMA 2 模型,这也具有良好的意义。此外,这些数据经过明确筛选,不包括来自显然包含大量私人和个人信息的网站的数据。

他们总共训练了 2 万亿个代币的数据。他们发现这个数量在成本效益权衡方面效果最好,并对最真实的来源进行了上采样,以减少错误信息和幻觉的影响。

聊天变体

Chat 变体 LLaMA 2-Chat 是经过数月的对齐技术研究而创建的。通过监督微调、RHLF 和迭代微调的融合,与原始模型相比,Chat 变体在 LLaMA 模型的人类交互性方面向前迈出了实质性一步。

使用与原始 LLaMA 模型相同的数据和方法进行监督微调 。这是使用“有用”和“安全”响应注释来完成的,当模型意识到或不知道正确的响应时,它们会引导模型做出正确的响应类型。

LLaMA 2 使用的 RHLF 方法涉及收集大量人类偏好数据,以供研究人员使用注释器团队收集奖励方法。这些注释者将评估两个输出的质量,并对这两个输出进行相互比较的定性评估。这使得模型能够奖励首选的答案,并对其赋予更大的权重,并对收到的不良答案进行相反的操作。

最后,随着他们收集更多数据,他们通过使用改进的数据训练模型的连续版本,迭代改进了之前的 RHLF 结果。

有关这些模型的聊天变体的更多详细信息,请务必查看论文。

可扩展至 700 亿个参数

gpt原理

最大的 LLaMA 2 模型有 700 亿个参数。参数计数是指权重的数量,如 float32 变量中的权重数量,它被调整以对应于整个语料库中使用的文本变量的数量。因此,相应的参数计数与模型的能力和大小直接相关。新的 70B 模型比 LLaMA 1 发布的最大 65B 模型更大。从上表中我们可以看到,即使与 ChatGPT (GPT3.5) 等闭源模型相比,放大的 70B 模型也表现良好。它还有很长的路要走,以匹配 GPT-4,但来自开源社区的额外指令调整和 RHLF 项目可能会进一步缩小差距。

考虑到 ChatGPT 的训练规模为 1750 亿个参数,这使得 LLaMA 的成就更加令人印象深刻。

演示

现在让我们跳进渐变笔记本来看看如何在我们自己的项目中开始使用 LLaMA 2。运行此程序所需的只是一个 Gradient 帐户,这样我们就可以访问免费 GPU 产品。这样,如果需要,我们甚至可以扩展到在 A100 GPU 上使用 70B 模型。

我们将使用在基于 Gradio 的 Oogabooga 文本生成 Web UI 上运行的 GPTQ 版本来运行模型。该演示将展示如何设置笔记本、下载模型以及运行推理。

(点此可在免费 GPU 驱动的 Gradient Notebook 中打开此项目)

设置

idc全球pc市场份额

我们将从设置环境开始。我们已经启动了我们的笔记本,并以 WebUI 存储库作为根目录。首先,让我们打开llama.ipynb笔记本文件。这包含我们在 Web UI 中运行模型所需的一切。

我们首先使用提供的文件安装需求requirements.txt。我们还需要更新一些额外的软件包。运行下面的单元格将为我们完成设置:

!pipinstall-rrequirements.txt!pipinstall-Udatasetstransformerstokenizerspydanticauto_gptqgradio

现在它已经运行了,我们已经准备好运行 Web UI 了。接下来,让我们下载模型。

下载模型

Oogabooga 文本生成 Web UI 旨在使 GPT 模型的运行推理和训练变得极其简单,并且它特别适用于 HuggingFace 格式的模型。为了方便访问这些大文件,他们提供了一个模型下载脚本,可以轻松下载任何 HuggingFace 模型。

运行第二个代码单元中的代码以下载 LLaMA 2 的 7B 版本以运行 Web UI。我们将下载模型的GPTQ优化版本,这可以显着降低使用量化运行模型的成本。

!pythondownload-model.pyTheBloke/Llama-2-7B-GPTQ

几分钟后模型下载完成后,我们就可以开始了。

启动应用程序

我们现在准备加载应用程序!只需运行 Notebook 末尾的代码单元即可启动 Web UI。检查单元格的输出,找到公共 URL,然后打开 Web UI 以开始。这将以 8 位格式自动加载模型。

!pythonserver.py--share--modelTheBloke_Llama-2-7B-chat-GPTQ--load-in-8bit--bf16--auto-devices

可以通过任何可访问互联网的浏览器从任何地方访问此公共链接。

gpt-2模型

Web UI 文本生成选项卡

我们将看到的第一个选项卡是文本生成选项卡。我们可以在此处使用文本输入查询模型。在上面,我们可以看到 LLaMA 2 的聊天变体被询问一系列与 LLaMA 架构相关的问题的示例。

页面左下角有很多提示模板可供我们选择。这些有助于调整聊天模型给出的响应。然后我们可以输入我们喜欢的任何问题或说明。该模型将使用右侧的输出读取器将结果流式传输回给我们。

我们还想指出参数、模型和训练选项卡。在参数选项卡中,我们可以调整各种超参数以对模型进行推理。模型选项卡允许我们加载任何具有或不具有适当 LoRA(低阶适应)模型的模型。最后,训练选项卡让我们可以根据我们可能提供的任何数据训练新的 LoRA。这可用于在 Web UI 中重新创建 Alpaca 或 Vicuna 等项目。

结束语

LLaMA 2 是开源大型语言建模向前迈出的重要一步。从论文和他们研究团队提出的结果,以及我们自己使用模型后的定性猜想来看,LLaMA2 将继续推动LLM的扩散和发展越来越远。我们期待未来基于该项目并对其进行扩展的项目,就像 Alpaca 之前所做的那样。

nand固态硬盘价格预测


返回网站首页

本文评论
京东拟分拆两公司独立上市 昨日美股大涨7.82%「京东股份分配」
京东集团(Nasdaq:JD,09618.HK)于3月30日连发两则公告,宣布计划将京东产发和京东工业分别在香港联交所主板单独挂牌。公告指出,建议的拟分拆方案将以全球发售的形式出售京东产发、...
日期:03-31
荣耀90系列屏幕升级:首发3840Hz零风险调光护眼屏_荣耀9什么屏
快科技5月19日消息,荣耀90系列即将在5月19日下午14点30分正式发布,新机在设计与影像方面有了不小提升。ios 16数码博主WHYLAB”今日透露,荣耀90系列将会首发3840Hz零风险调光...
日期:05-19
一年研发费用超12亿,这家上市公司还是没做出爆款_2021年研发费用
声明:本文来自微信公众号“游戏新知”(ID:youxixinzhi),作者:鳗鱼,授权转载发布。2021年心动经营亏损额达到9.5亿元。在之后的股东信中,公司董事长黄一孟提到计划「在2023年实现盈...
日期:03-15
铁娘子王凤英入职小鹏汽车立下“大目标”:三年销量百万级
上月初,一则汽车圈儿的人事调动引起了广泛关注,没错,正是此前长城汽车的铁娘子”王凤英加盟小鹏汽车任职总裁,负责公司的产品规划、产品组合整理和销售业务,直接向何小鹏汇报。也...
日期:02-08
Adobe推出离谱收费:不掏钱特定颜色直接变黑「因为你的颜色设置是针对adobe」
作为国际通用的标准色卡的提供者,潘通色卡”几乎可以说是设计行业的色彩权威,也因此,对于从事设计相关行业的用户来说,潘通”都是难以绕过的一个词汇。但现在,如果不愿意每月付费...
日期:11-12
5G消息试商用阶段_5G 消息或于10 月中下旬试商用
  9 月 29 日上午消息,在今日的中国国际信息通信展览会 5G 消息高层论坛上,运营商相关人士表示,5G 消息或将于今年 10 月中下旬全国试商用。   2020 年 4 月,三大运营商联...
日期:06-17
博大数据CEO张永健:博大数据全方位升级,向行业赋能者转型「北京博大数文广告有限公司」
(原标题:博大数据CEO张永健:博大数据全方位升级,向行业赋能者转型) 2023年5月9日,“博无止境 大有可为”博大数据新品牌发布会在...
日期:06-23
蜘蛛侠将留在漫威电影宇宙「《蜘蛛侠:纵横宇宙》票房超预期」
由索尼影业出品的蜘蛛侠动画片第二部《纵横宇宙》周五在北美地区取得5180万美元首日票房,不仅口碑碾压一众真人超英片,甚至连票房都超越了漫威自家的《银河护卫队》首日录得48...
日期:06-04
疯狂小杨哥被狙击 职业打假人有多赚钱?有人月入10万 财务自由_疯狂小杨哥一年赚多少钱
这几天头部网红疯狂小杨哥因为直播带货的破壁机、绞肉机虚标功率等问题引发热议,盯上他的就是著名的职业打假人王海,他背后代表的也是一个神秘的行业职业打假。职业打假人打假...
日期:11-20
特斯拉q1价格「降价效果喜忧参半 特斯拉Q1交付量创纪录但不及预期」
凤凰网科技讯 北京时间4月3日消息,特斯拉公司周日公布了今年第一季度汽车交付量数据,由于日益激烈的竞争和黯淡的经济前景盖过了该公司通过降价来提振需求的努力,特斯拉第一季...
日期:04-03
云之家携手农牧龙头助力乡村振兴
  21世纪以来第18个指导“三农”工作的中央一号文件2月21日由新华社受权发布。这份文件题为《中共中央 国务院关于全面推进乡村振兴加快农业农村现代化的意见》,包括:总体...
日期:07-16
谷歌发表声明威胁将关闭瑞士街景服务是什么_谷歌发表声明威胁将关闭瑞士街景服务
  5月12日消息,据国外媒体报道,谷歌称,它正在对瑞士法院的一项裁决提出上诉。瑞士法院的裁决要求谷歌在发布街景服务的面孔和汽车牌照的图片之前保证匿名性。   谷歌称,它...
日期:07-27
怎么设置微信8.0状态_微信 8.0 状态设置小技巧
  这两天,微信 8.0 简直要被刷爆了,特别是它那几项新功能,被小伙伴们玩得一塌糊涂。这其中 “状态”就是新版中增加的一项内容,可以让我们像 QQ 一样,为微信设置状态文字。那...
日期:03-13
扎克伯格元宇宙视频「扎克伯格「自拍」被群嘲 这就是烧掉百亿美元的元宇宙?」
  来源:爱范儿  荒凉的蓝天绿地里,伫立着简陋的巴黎埃菲尔铁塔和西班牙圣家堂,扎克伯格的虚拟化身(avatar)肢体僵硬,面露若有似无的微笑。  这张拍摄于 VR 社交平台 Horizon...
日期:09-04
比特币由谁提供_比特币只属于有准备的人?不,也属于猪八戒网捡漏服务商
  如果不是最近比特币大火,我根本想不起来我还有比特币。   然而我也并没有暴富!   这事还得从三年前说起。   我有一个不大的科技公司,做一些网站和轻微开发的内...
日期:07-16
国家发改委:支持5G、AI等新技术融入民生设施,弥合数字鸿沟「加快5g商用步伐,加强人工智能」
  记者 周頔  9月26日,国家发展改革委就基础设施建设有关情况举行专题新闻发布会。会上有媒体提问:近期国务院常务会议几次研究稳投资工作,无论政策性开发性金融工具还是设...
日期:09-26
章泽天怀孕随刘强东明州逛超市「刘强东和章泽天孩子」
  #章泽天怀第二胎# #章泽天怀孕随刘强东明州逛超市# 日前,有网友晒出在美国明尼阿波利斯市偶遇刘强东与章泽天一起逛超市的照片。照片中,章泽天身穿条纹针织裙,孕肚明显,疑似...
日期:10-05
亚特兰大首个微软商店开张 吸引众多关注
北京时间5月30日,据国外媒体报道,日前亚特兰大首个微软商店正式开张,该商店吸引了众多目光。早在2009年,微软就建立了第一家零售商店,该商店开张的时间正好是Windows 7的全球发...
日期:07-28
移动互联平台_中国移动“互联网+”助力脱贫攻坚
  “我已经会写自己的名字,会认一些简单的汉字,而且还学会了普通话。我很喜欢‘语言扶贫APP’,它不仅方便而且还很实用,让我随时随地都能学习普通话和汉字。”云南省怒江傈僳...
日期:10-03
曾孵化国内首个破亿众筹项目:京东众筹今日正式暂停运营_开始众筹 倒闭
9月,京麦商家中心曾发布公告,表示将在10月暂停运营京东众筹业务。云视通视频会议系统今天,京东众筹业务正式暂停业务,已上线的项目还将继续进行众筹,且众筹成功后能够正常发货。...
日期:10-13