您的位置:首页 > 互联网

几千元训完中文版LLaMA2!Colossal-LLaMA-2把大模型门槛打下来了!

发布时间:2023-09-25 16:25:35  来源:互联网     背景:

要点:

1、通过词表扩充、数据筛选和多阶段训练策略,在15小时内用几千元成本训练出中文版LLaMA2。

2、中文版LLaMA2在多项中文任务上的表现明显提升,达到同规模模型的先进水平。

3、构建流程、代码和权重均开源,可迁移应用到其他语言和领域,实现低成本大模型训练。

9月25日 消息:以前,从头预训练大模型被认为需要高达5000万美元的投资,这让很多开发者和中小企业望而却步。而Colossal-LLaMA-2的出现降低了大模型的门槛。

现在,仅需15小时和几千块钱的投入,就能够完成中文LLaMA2大模型的训练,数据规模达到85亿 tokens。这一方案的综合性能达到了开源社区同规模的SOTA模型水平,且完全开源,包括训练流程、代码以及权重。最重要的是,没有商业限制,可以将其应用于各种领域,实现低成本构建从头预训练的大模型。

全球智能手机Q1出货量连续下滑

那么,如何利用Colossal-AI系统和框架,在短时间内用很低的成本构建出表现优异的中文版本LLaMA2模型呢?

首先,通过扩充原英文词表,新增中文词汇,并利用原模型权重智能初始化,实现英文知识迁移。然后,利用严格的数据筛选流程构建高质量增量训练语料。

在训练策略上,设计了多阶段渐进式训练流程,以及均衡的数据分桶策略。最后,构建了完整的评估体系ColossalEval来全面评测模型效果。

在此流程的启发下,仅用15小时和几千元成本,就训出了中文版LLaMA2。该模型在各类中文任务上的表现已达到甚至超过同规模模型的先进水平。

所有训练代码和预训练权重均开源,可以直接应用到其他语言和领域,实现大模型低成本快速构建。背后是Colossal-AI提供的高效并行和异构内存支持等系统优化。该方案业已应用到多个行业领域,构建垂类大模型并取得良好效果。

华为cpu麒麟是国产的吗


返回网站首页

本文评论
联通高质量发展战略「中国联通:奋力走好新时代高质量发展“赶考”之路」
通信世界网消息(CWW)8月9日,中国联通公布2023年中期业绩。2023年上半年营业收入达到人民币1918.33亿元,同比提升8.8%;净利润达到人民币123.91亿元,同比增长13.1%,连续7年实现双位数...
日期:08-15
特斯拉电池厂火灾「特斯拉德国柏林工厂突发火灾,什么原因?」
德国当地时间9月26日凌晨3时许,特斯拉柏林超级工厂突发火灾。事故发生后,特斯拉自己的12名消防员先进行了抢险,但意识到已经无法控制火势后便通知了消防部门。孩子偷偷上网怎么...
日期:10-03
我很高兴终于摆脱了那个沉闷的办公室_你的办公室该换新了!“开会焦虑”从此成为过去
  生活在紧张高压的节奏下,穿梭在繁华地段的写字楼间,他们是外表光鲜亮丽的都市白领,却也是内心疲惫不堪的“当代社畜”。如果说每天挤地铁、开会、做方案让他们的肉体历尽...
日期:07-14
百度地图上线“自动驾驶级”导航功能,你或许不会再错过绿灯_百度地图导航模式
记者/伍洋宇   8月12日,百度地图联合Apollo在北京市高级别自动驾驶示范区发布全新版本,首先在亦庄上线车道级导航、车位级导航,以及绿灯畅行导航等智能化功能,这些功能也将在...
日期:08-12
阿里巴巴张勇回复「阿里巴巴张勇谈人工智能:会让旧行业消失,但新行业也会出现」
6月21日 消息:日前,张勇出席了2023阿里巴巴罗汉堂数字经济年会现场并与三位诺贝尔奖得主展开对话。在谈及人工智能带来的挑战时,张勇表示,“人工智能的发展可以类比移动互联网,...
日期:06-21
节目中音乐版权费一般怎么算_直播间使用音乐要付版权费,试行付酬标准公布
随着直播行业的蓬勃发展,互联网直播中使用音乐相关版权问题一直被社会关注。直播间使用音乐版权怎么付费?付多少费?一直缺乏具体的行业标准和参考依据。昨天(25日),中国音像著作权...
日期:07-31
淘宝网“天天特价”打造中小卖家扶持平台(淘宝天天特价首页入口)
10月14日,淘宝推出“天天特价”打造中小卖家扶持平台,每日百万流量、每天千件以上单品销售、会聚千万最活跃的淘宝买家,帮助中小卖家的快速成长。 Taobao.com(淘宝网)秉承着一贯...
日期:07-24
爆料:微软Windows 10版本2004 RTM正式版已完成(微软官方原版win10)
  1月2日消息 此前微软已经发布了2019 Windows 10更新十一月版系统更新,微软一直在开发Windows 10版本2004(也称为20H1)。根据一份新报告,微软已经在2019年12月份完成了Win...
日期:12-06
国产旗舰安卓掌机!AYANEO Pocket S官宣:首批搭载第二代骁龙G3x
快科技8月24日消息,近两年,AYANEO掌机做得有声有色,成为国产掌机的优秀代表。在日前举行的2023德国科隆游戏展上,AYANEO宣布了下一代旗舰安卓掌机AYANEO Pocket S,不仅是AYANEO首...
日期:08-24
迎接K70 Redmi K60降价:16 512G到手2299元 性价比暴增_红米k60什么时候上市
快科技9月23日消息,Redmi K70系列将在今年年底登场,随着K70系列发布时间的临近,K60旗舰价格也降至历史新低。京东百亿补贴频道显示,Redmi K60 16GB 512GB幽芒配色到手价是2299元...
日期:09-24
天玑9000+性价王者 iQOO Neo7现身跑分网站:开机就是Android 13「opporeno6天玑900安兔兔跑分」
今日消息,iQOO Neo7现身Geekbench跑分网站。该机搭载联发科天玑9000+旗舰处理器,单核成绩是1231,多核成绩是4251,配备12GB内存,预装Android 13操作系统。作为iQOO Neo系列新成员,N...
日期:10-12
gateway笔记本「gateway笔记本中文名」
Gateway笔记本电脑是一款经典的电脑品牌,以其价格亲民和性能稳定而受到广泛的欢迎。Gateway公司成立于1985年,最初主要以生产笔记本电脑和台式电脑为主。在2007年,Gateway公司...
日期:05-31
锐龙2500u核显「AMD 四款首发锐龙 7000 详细参数公布:均搭载 2CU 核显」
IT之家 8 月 30 日消息,AMD 官网现已公布 R5 7600X 到 R9 7950X 四款首发处理器的详细参数,确认搭载 2CU 核显,让用户在没有独立显卡的情况下也能开机运行。R9 7950X16C32T,4.5-...
日期:09-06
莫玮接替刘利华任工信部办公厅主任
  5月3日消息,日前,工信部宣布关于莫玮等3名同志职务任免的通知。免去莫玮规划司司长职务,改任办公厅主任;同时免去刘利华的办公厅主任职务。(日尧)莫玮简历莫玮,壮族,1956年6月...
日期:07-27
同花顺称92%股民亏损信息有误 深夜道歉_同花顺中总盈亏
2月3日 消息:昨晚,同花顺在官方微博发文道歉称,其早前发布“2022年逾92%的股民亏损”的相关微博信息有误,现已删除,特向读者郑重致歉!linkedin上市了吗从网友晒出同花顺的微博截...
日期:02-03
高德地图启动“暖春计划” 上线一键报平安等服务「高德地图报平安功能」
1月12日 消息:今日,高德地图正式启动“暖春计划”,上线数字领航员小高老师安全导航语音、长途助手、一键报平安等服务,并联合全国各地670多家交警、交通管理机构,在高德地图开通...
日期:01-12
三休假期「“请三休八”拼假模式火了!拼出8天长假 还带火了环线旅游」
6月17日消息,端午节假期即将来临,在众多请假攻略中,请19日、20日、21日三天,加上双休和端午,一共休8天的拼假模式大火,8天的长假还带火了环线旅游!西安、成都作为西北、川西环线游...
日期:06-17
除了电商平台还有哪些平台「除了低价,电商没有别的招」
除了低价,电商没有别的招 电商的低价战争仍在持续。近期,京东宣布下调自营商品包邮门槛的消息传递出火药味。此前在京东购买自营商品,订单金额满99元才能包邮,如今门槛已经降到...
日期:09-11
一个月涨粉67万,淄博鸭头小哥开始带货了_鸭头连锁店怎么样
声明:本文来自于微信公众号 电商在线(ID:dianshangmj),作者:王崭,授权转载发布。“我们已经不是为了赚钱,而是为了淄博的荣誉而战。”今年3月,大学生组团“进淄赶烤”火遍了整个网...
日期:05-23
润联科技携手飞书 持续发力在线协同办公
  日前,字节跳动(中国)旗下办公套件飞书(以下简称:飞书)和华润集团全资子公司深圳润联智慧科技有限公司(以下简称:润联科技)宣布达成合作,双方将在在线协同办公领域展开深入...
日期:05-06