您的位置:首页 > 互联网

开源工具xTuring厉害了,三行代码就能创建自己的大语言模型

发布时间:2023-07-18 21:12:36  来源:互联网     背景:

7月18日 消息:xTuring 是一个开源工具,可以让用户只用三行代码就能创建自己的大语言模型 (LLMs)。

据了解,xTuring由 Stochastic 团队开发,旨在优化和加速人工智能大语言模型。Stochastic 拥有一支由聪明的机器学习工程师、博士后和哈佛大学研究生组成的团队,专注于优化和加速法学硕士的人工智能。

image.png

自动文本传输、聊天机器人、语言翻译和内容制作等应用程序是人们努力利用这些概念开发和创建新应用程序的领域。训练和微调这些模型可能既耗时又昂贵。无论是使用 LLaMA、GPT-J、GPT-2还是其他方法,xTuring 都可以轻松快速地进行模型优化。

公布2021年全球区块链50强榜单

xTuring 可以适应不同的硬件配置,通过内存高效的微调技术 LoRA,加快学习过程,降低硬件成本。据称,xTuring 使用 LoRA 等内存高效微调技术来加速学习过程,并将硬件支出减少多达90%。通过减少微调所需的内存量,LoRA 有助于更快速、更有效的模型训练。

与其他微调技术相比,xTuring 在 LLaMA7B 模型的微调能力上取得了出色的结果。LLaMA7B 模型被用作 xTuring 微调能力的基准,团队将 xTuring 与其他微调技术进行了比较。数据集由52K token组成,测试中使用了335GB CPU 内存和4xA100GPU。

大众探戈敞篷版上市时间

结果表明,使用 DeepSpeed + CPU 卸载对 LLaMA7B 模型进行每个 epoch21小时的训练消耗了33.5GB GPU 和190GB CPU。在使用 LoRA + DeepSpeed 或 LoRA + DeepSpeed + CPU 卸载进行微调时,GPU 上的内存使用量分别急剧下降至23.7GB 和21.9GB。CPU 使用的 RAM 量从14.9GB 下降到10.2GB。此外,使用 LoRA + DeepSpeed 或 LoRA + DeepSpeed + CPU 卸载时,训练时间从每个 epoch40分钟减少到20分钟。

操作方面,用户可以通过简单的鼠标点击来微调模型,并且 xTuring 的用户界面非常简单易用。该团队表示,xTuring 是调整大型语言模型的不错选择,因为它支持单个和多个 GPU 训练,使用内存高效的方法,并具有直观的界面。

藏品数字化

项目网址:https://github.com/stochasticai/xTuring

https://xturing.stochastic.ai/


返回网站首页

本文评论
三星500万像素手机_三星像素最高的手机
三星是韩国知名的电子科技公司,拥有众多优秀的手机产品。2010年,三星推出了500万像素手机,美图手机促使市场立马火爆。采用了三星最新的NCM 2技术,拥有500万像素的高清摄像头。...
日期:05-30
LG电子反诉索尼专利侵权 向ITC提出起诉(从英特尔败诉看中国芯片公司如何应对专利侵权诉讼)
  据国外媒体报道,LG电子周二宣布,它已于上周向美国国际贸易委员会(ITC)提出起诉,指控日本电子产品厂商索尼侵犯了其专利权,并请求国际贸易委员会发布禁止令以禁止索尼在美国销...
日期:07-26
“疫讯通”发布:统一推送联盟联合极光精准防疫
  近日,统一推送联盟联合极光(Aurora Mobile, NASDAQ: JG)等联盟企业共同开发了及时传递疫情信息的产品“疫讯通”。在产品开发过程中,极光充分运用大数据等新技术手段助力...
日期:06-13
元宇宙虚拟地产「元宇宙也有地产泡沫?炒房客这下血本无归了」
声明:本文来自微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌,授权转载发布。作为区块链的衍生品,元宇宙房产自然也与NFT和加密货币“同此凉热”。快看|微软超过苹果,成为全球...
日期:09-12
科大讯飞企业概述「科大讯飞申请“讯飞甄选”商标」
  36氪获悉,天眼查App显示,近日,科大讯飞股份有限公司申请注册多个“讯飞甄选”商标,国际分类为啤酒饮料、社会服务、科学仪器等,目前商标状态均为申请中。领克05和宝马x6...
日期:10-04
不要再问杀毒软件哪个好了!首选360安全卫士极速版!
提到弹窗广告,一部分人感觉深恶痛绝苦大仇深,恨不得再也不见;另一部分人却不以为然,觉得广告弹出来立刻关掉不就没事了,不会有什么影响。其实弹窗广告给电脑用户带来的并不是只是...
日期:05-19
口碑不佳 《小美人鱼》豆瓣开分5.5:黑人女主被赞唯一亮点「小美人鱼外国电影」
迪士尼最新大作《小美人鱼》此前海外口碑失利,MC站均分60分,烂番茄新鲜度50%,现在国内的豆瓣也开分了,只有5.5分。在目前的评分中,五星评价只有6.1%,不过一星评价也只有16.7%,两边...
日期:05-28
5000左右笔记本推荐_5000多的笔记本电脑推荐
在现在这个信息爆炸的时代,笔记本电脑已经成为了我们日常生活中必不可少的一部分。如果你正在寻找一款5,000元左右的笔记本电脑,今天就让我们来为你推荐几款性价比较高的产品...
日期:05-31
百度文心一言将开启第一批内测:今日起可申请 已有650家合作伙伴接入
在今天下午的发布会上,百度CEO李彦宏宣布文心一言正式发布,这是百度继文心一格之后的又一个生成式AI产品,也被称为中国版的ChatGPT。据介绍,百度将在所有业务中全面集成文心一言...
日期:03-16
罗永浩招AI科学家遭简历轰炸 中签率千分之一:清北复交学历挤破头
7月14日晚,罗永浩直播间里上架了一项特殊商品AI算法科学家,网友在直播间可直接上传简历。据了解,该职位坐标北京,来自于细红线公司,成立于2022年,是罗永浩的另一家创业公司,主要布...
日期:07-16
美团共享单车盈利模式_美团单车官宣涨价 共享经济无序竞争将画上句号
每经评论员 赵雯琪   又有一家共享单车品牌宣布涨价。按照美团单车最新公告,于8月10日23时起,7天、30天、90天三档骑行卡无折扣价分别调整为15元、35元、90元。虽然与市面上...
日期:08-10
诈骗模仿他人声音「防不胜防!骗子利用AI声音冒充亲人诈骗:老人成主要受害者」
4月1日,据央视网消息,最近美国和加拿大各地使用AI合成语音进行电信诈骗的案例多发,不少上当的都是老年人。苹果13降价幅度人工智能语音一直受到业界关注,如今该技术已经发展到需...
日期:04-02
ios15相机新功能怎么使用「曝iPhone 15 相机布局将要大变样,因潜望式变焦镜头模组过大!」
据外媒报道,苹果计划在明年推出iPhone 15 Pro Max,这款手机将采用一种新的后置摄像头布局,以容纳潜望式变焦镜头。这种镜头系统可以实现更高倍数的光学变焦,但也需要更多的内部...
日期:05-18
中国概念股几全线下滑 人人重挫15.53%(中概股多数下跌)
  北京时间8月5日消息,对全球经济的担心引发资本市场普遍抛售,美股周四大幅下滑,道琼斯工业平均指数创2009年2月以来单日跌幅。中国概念股几乎全线下滑,近10家公司跌幅超过10...
日期:07-22
Unipal有陪遭小米“介意”,这家成立两年的公司何足让巨头挂心?
  近日,有微博网友晒出,宠物智能家居公司Unipal有陪遭到小米通过天猫网针对商标权事宜投诉的信息。对此,Unipal有陪方表示:该投诉与Catta猫塔产品质量无关,消费者可安心...
日期:07-16
“智能城市 共享未来” 2020 世界人工智能大会 · 国际智能城市峰会隆重举办 !
  2020 年 7 月 10 日 , 由上海浦东智慧城市发展研究院、上海第一财经传媒有限公司、中国联合网络通信有限公司联合举办的 2020" 智能城市 共享未来 " 世界人工智能大会...
日期:07-14
中兴光纤「建好网到用好网,中兴通讯深化千兆经营和光网发展」
通信世界网消息(CWW)6月4日,在第31届中国国际信息通信展览会的“未来城市千兆光网发展论坛”上,中兴通讯副总裁,有线产品MKT总经理胡俊劼以“建好网到用好网,深化千兆经营和光网发...
日期:06-06
欧科云链徐明星以区块链技术创新构建数据资产的“防护墙”_徐明星-欧科云链
随着数字经济全球化步伐加快,数据已成为重要的生产要素和战略资源,不断增长的数据体量也引发了人们对数据安全的思考。《中华人民共和国数据安全法》的正式实施落地,加快了数据...
日期:08-01
iphone要更新14吗「iPhone14还没捂热,15系列三大升级曝光,值得再等一年」
从9月16日iPhone14首销到今天,不少用户都已经用上了机器,随之而来的是对灵动岛设计的吐槽,对手机发热量大的质疑等。而当很多人还没捂热iPhone14的时候,网上又传来了iPhone15系...
日期:09-29
微软启动《AI选集》项目 完整版将于6月26日出版_ai选品
6月1日 消息:微软今日宣布启动《AI选集》项目,此项目旨在鼓舞人心、探讨利用AI造福人类的多种方式并揭示潜在挑战。该项目收录了20篇由各领域杰出学者和专业人士撰写的文章。...
日期:06-02