您的位置:首页 > 互联网

百川开源最强中英文百亿参数模型!超越LLaMA,中国开源大模型开启商用新纪元

发布时间:2023-07-11 19:38:47  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】霸榜的Baichuan-7B发布后才短短26天,百川又发布了Baichuan-13B,百亿参数已可媲美千亿,自此,中国开源大模型开始赶超美国开源领域,正式进入商用新纪元。

2023年7月11日,百川智能正式发布参数量130亿的通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat及其INT4/INT8两个量化版本。

未来,大模型生态开源闭源并存已经是不争的事实,如同iOS与安卓。

目前,以GPT-4为代表的超大参数量闭源模型和100亿-200亿参数量开源模型,是大模型生态链中两个最佳实践。

GPT-4固然能力强大,但闭源会要求企业访问公网以及难以定制化适配,使用场景受限。而开源能够使企业轻松地借助专有数据进行微调和私有化部署,进而促进百行千业的良性发展生态。

Baichuan-13B中英文大模型集高性能、完全开源、免费可商用等诸多优势于一身,是目前所有33B以下尺寸开源模型中效果最好的可商用大语言模型。

图片

内容创作

图片

语言理解

图片

多轮回答

在国外已建立起闭源及开源大模型完整生态的背景下,弥补了国内高品质开源商业模型的不足,对助力中国大模型产业发展和技术进步都具有重要意义。

这是百川智能发布的第二款通用大语言模型,而在前不久的6月15日,百川智能就已经推出了首款70亿参数量的中英文语言模型Baichuan-7B,并一举拿下多个世界权威Benchmark榜单同量级测试榜首。

开源地址

Hugging Face

图片

预训练模型:https://huggingface.co/baichuan-inc/Baichuan-13B-Base

对话模型:https://huggingface.co/baichuan-inc/Baichuan-13B-Chat

Github

图片

Baichuan-13B:https://github.com/baichuan-inc/Baichuan-13B

Model Scope

图片

预训练模型:https://modelscope.cn/models/baichuan-inc/Baichuan-13B-Base/

对话模型:https://modelscope.cn/models/baichuan-inc/Baichuan-13B-Chat/

最强中英文百亿参数量开源模型

预训练模型「底座」因其灵活的可定制性,适合具有一定开发能力的开发者和企业,而普通用户则更关注具有对话功能的对齐模型。

因此百川智能在发布预训练模型Baichuan-13B-Base的同时还发布了其对话模型Baichuan-13B-Chat,Baichuan-13B-Chat部署简单、开箱即用,极大降低了开发者的体验成本。

相比此前发布的Baichuan-7B,Baichuan-13B在1.4万亿token数据集上训练,超过LLaMA-13B40%,是当前开源13B尺寸下训练数据量最大的模型。

神州优车集团官网

在语言模型中,上下文窗口长度对于理解和生成与特定上下文相关的文本至关重要。

Baichuan-13B上下文窗口长度为4096,不同于Baichuan-7B的RoPE编码方式,Baichuan-13B使用了ALiBi位置编码技术,能够处理长上下文窗口,甚至可以推断超出训练期间读取数据的上下文长度,从而能够更好的捕捉文本中上下文的相关性,做出更准确的预测或生成。

图片

作为一款中英文双语大模型,Baichuan-13B采用了相对平衡的中英文语料配比和多语言对齐语料,从而在中英两种语言上表现均很优异。

在同等参数量的开源模型中堪称实力担当,能更好满足商业化场景需求。

图片

主流百亿参数开源模型benchmark成绩

中文领域,在权威评测C-EVAL中,Baichuan-13B性能一骑绝尘,在自然科学、医学、艺术、数学等领域大幅领先LLaMA-13B、Vicuna-13B等同尺寸的大语言模型,在社会科学、人文科学等领域甚至超越了ChatGPT。

图片

英文领域,其表现同样优秀,在英文最权威的榜单MMLU上,Baichuan-13B超过了所有同尺寸开源模型,并且在各个维度都具有显著优势。

图片

必须要说的是,有些模型为了能在评测中取得更好的成绩,会在基座模型和对话模型上引入较多针对benchmark的优化。

此举虽然可以在榜单上获取更高的分数,但是没有本质地提升模型的基础能力,并且在下游任务中易产生回复长度短、质量低的问题,造成高分低能的现象。

百川智能的Baichuan-13B-Base和Baichuan-13B-Chat未针对任何benchmark测试进行专项优化,保证了模型的纯净度,具有更高的效能和可定制性。

亟待建立中国的开源大模型生态

众所周知,大模型的训练成本极高,在海量算力的成本压力下,OpenAI和谷歌都选择了闭源来保证自家大模型的优势地位。

但是从计算机科学与人工智能的发展历程来看,开源始终对软件技术乃至IT技术发展有着巨大的推动作用。

大模型时代,Meta率先走上了开源的道路,LLaMA基座开源之后,也因其出色的性能,迅速吸引了大量开发者。

他们在其基础上开发了各种ChatGPT开源替代品,并且以极低的训练成本屡次达到匹敌GPT-3.5的性能,极大激发了开源模型的创新活力。

未来大模型生态闭源与开源并存,已是行业共识。

凭借闭源路线的GPT、PaLM2以及开源路线的LLaMA,美国在大模型领域已经构建起了完整的生态。

员工离职后威胁公司暴露公司机密

尽管中文世界不乏优秀的开发者、出色的创新能力和广泛的应用场景,但由于缺少高性能和高定制性的开源基座模型,在大语言模型领域的相关研究和应用上仍存在较大的挑战。

中国急需优质开源可商用大模型补齐相关领域的空白,与开发者和企业共同推动中国人工智能应用的创新生态发展。

开启中文开源大模型商业化时代

作为同级最好的开源可商用中英文预训练语言模型,Baichuan-13B-Base不仅对学术研究完全开放,所有开发者均可通过邮件向百川智能申请授权,在获得官方商用许可后即可免费商用。

xperia5ii对比小米11

并且,为了尽可能降低模型的使用门槛,百川智能同时开源了Baichuan-13B-Chat的INT8和INT4两个量化版本,在近乎无损的情况下可以很方便的将模型部署在如3090等消费级显卡上。

本次百川智能发布的Baichuan-13B中英文大语言模型,凭借百亿参数量已经展现出可以媲美千亿模型的能力,大大降低企业部署和调试的使用成本,让中国开源大模型商业化进入真正可用阶段。

Baichuan-13B的开源,实现了国内开源大模型对美国大模型开源领域的追赶,改变了此前国内在相关领域一直落后的局面。

同时,其开源模型的代码完全公开,所有人都可以随时查看,算法透明,不仅有利于研究人员深入探索和研究模型原理,并且有利于建立和深化公众对大模型的信任,可以说Baichuan-13B不仅是百川大模型之路上的又一里程碑,也是中国大模型快速迭代的重要标志。

百川智能创始人王小川表示,「Baichuan-13B是百川智能为科技强国送上的一份礼物,我们期待国内大模型行业以及垂直领域能够在此基础上开发出更多优秀产品及行业应用,让技术在真实、丰富的应用场景中快速迭代创新,我们愿与众多企业、开发者一道为国内开源社区的生态繁荣贡献自己的力量。」

新智元专访

- 很多人说,中英文语料的差异,会导致大模型极大的差距,你怎么看?

中英文差异导致模型巨大的差异,在行业中的确对此有普遍的想法,但是并没有相关的证据。这反应了一部人的悲观情绪,我们更需要乐观主义精神和坚定的态度。

说中文模型不行只是一个行业猜测,在我们的7B和13B中,并没有看到这样的结果。

从百川7B开始,证明了使用中英文数据进行训练,本身并不会降低模型的能力,并且对英文能力也有提升。

- ChatGPT已经靠Code Interpreter完成惊人升级,百川大模型是否上线类似功能的计划呢?

Code Interpreter是ChatGPT的重大升级,这是OpenAI未来很重要的一个方向,我们对这个事情是高度关注的。

- 百川智能为何要做开源可商用的大模型,现在达到了怎样的一个水平?

业内人士都认为,在国内大多数领先企业都有能力做到3.5的水平,但是有两个关键点——

1. 怎么从3.5做到4,这是一个超级难题。

2. 如何做出超级应用,大家的共识是通过开源模式百花齐放,我们做的开放,就是对生态本身的填补。

另外,我们也会在迈向4和超级应用这个方向做出自己的探索。

- 业内很多人认为,大模型之战的下一个战场就在应用落地上,百川大模型与清华等高校的合作,具体用例在何处?

清华使用我们的模型之后,在法律上是有长足进步的,在科研上也会有他们的探索。

- 百川大模型是否与人类价值观进行了对齐,对齐后的性能是否会下降?

毋庸置疑,百川模型会和人类价值观进行对齐,而且对齐是多个层面的,不仅在微调阶段,还在之前的预训练阶段。

如果只在微调这个阶段性对齐的话,那模型会有明显的对齐税。因此是需要有统一的这样的一个预训练到微调阶段,甚至到最后强化学习阶段的共同对齐。

总而言之,人类价值观对齐是我们必须做好的。我们认为需要多个环节都做好,并且保持一致性,这样就能降低对齐税。


返回网站首页

本文评论
百度洗心革“面”首页开放大战升级
  新一季互联网大战开打,各大公司抢占开放平台之先机,争夺互联网入口之战继续升级。   日前,百度2011世界大会在北京举行。百度C E O李彦宏正式向外界发布了全新的百度首...
日期:07-22
生日蛋糕网店使用“流浪地球”标识 遭中影索赔15万
上海某蛋糕烘培用品网店因使用流浪地球”标识,遭中国电影股份有限公司(以下简称中影公司”)以侵犯注册商标专用权和不正当竞争等理由告上法庭,索赔15万元。答辩期间,被告公司对该...
日期:01-29
微软采取措施解决Windows漏洞 未影响Win7(windows系统漏洞需要修复吗)
  1月6日消息,微软宣布已经发布了缓解性措施和临时修补文件来解决Windows上出现的漏洞问题,并声称该漏洞对Windows 7操作系统和Windows Server 2008 R2服务器操作系统没有...
日期:07-25
重磅!Microsoft、SAP和Adobe宣布开放数据计划
9月25日消息,今天,在Microsoft Ignite开发者大会上,Microsoft、SAP和Adobe这3家世界级的软件巨头......
日期:09-25
2021年投影仪推荐排行榜:当贝F1智能投影仪极米NEW Z8X等分别在榜_极米投影仪哪个型号最好 2020
  之前有已经写过2021年推荐排行榜,2000元档位家用投影仪怎么选大实话,感兴趣的各位网友可以翻下小编文章。今天讲讲投影仪大实话Pro升级版,说说3000元档位2021年家用投...
日期:01-11
黑鲨再度携手李宁:“中國選手”定制款腾讯黑鲨游戏手机3 Pro迎首销
  5月14日上午10点,黑鲨与李宁共同推出的首款5G游戏手机——腾讯黑鲨游戏手机 3 Pro“中國選手”定制版,此次“中國選手”定制版为12GB+256GB版本,售价为5099元,定制手机采用...
日期:04-21
小米8周年纪念版「小米8周年纪念版评测」
是小米科技于2018年6月28日推出的一款特别版手机,以庆祝小米的成立第八周年。以下是该手机的相关信息。硬件参数iphone12pro保值吗的硬件参数比普通版略有提升。它采用了骁龙...
日期:05-28
观潮论坛:中外专家汇聚BCS共商数字世界竞合之路
  数字技术缔造了数字世界,让全球连接更加紧密,但也带来空前激烈的全球科技竞争,数字世界已成大国博弈的主领域。面对技术垄断、国家数据主权、关键基础设施安全、勒索攻击...
日期:08-09
5月份谷歌Chrome浏览器市场份额升至12.5%(chrome浏览器2018)
北京时间6月1日消息,据国外媒体报道,据市场研究机构Net Applications今日发布的统计数据表明,谷歌Chrome的市场份额已由4月份的11.9%升至5月份的12.5%,但微软最新浏览器的市场...
日期:07-28
铁路部门启动“双11”电商网购高峰期快运服务 提供当日达服务_铁路“双十一”电商黄金周运输服务启动
11月1日 消息:今天,中国铁路公众号宣布启动“双11”电商网购高峰期快运服务。铁路部门将为“双11”电商网购高峰提供安全高效、方便快捷的铁路快运服务。三星曲面屏技术关于...
日期:11-14
存储资源整合!满足业务数据存储需求一套EDS就够了
  时光回溯到十几年前,如果想听歌,你需要MP3;如果你想看电影,你需要MP4;如果你想打游戏,你需要一台游戏设备;如果你要打电话,你需要一台手机……而现如今智能手机飞速发展,一台...
日期:12-20
自由软件基金会呼吁抵制Win8认证电脑
  微软宣布Windows 8认证电脑必须采用“Secure Boot(安全启动)”,自由软件基金会(FSF)就此发表声明,称限制性的安全启动将会让电脑只能运行微软的操作系统,限制用户安装自由...
日期:07-24
家用投影仪推荐一下哪款比较好,大眼橙X7D Pro怎么样?_大眼橙x7d投影仪缺点
最近两年,家用投影仪已经成为了众多家庭青睐的家电产品,许多对投影仪感兴趣的朋友,都会找到一些使用过投影仪的玩家推荐一下哪款比较好。目前来看,轻薄投影仪是许多潮流家庭的首...
日期:04-13
菜鸟:北京90%菜鸟驿站开通“按需送货”_菜鸟驿站直送
8月24日消息,菜鸟驿站北京城市负责人林至透露,在北京所有菜鸟驿站中,90%菜鸟驿站已开通天猫淘宝包裹送货上门服务。他提到,“为了满足北京消费者对于快递履约质量、效率的高要求...
日期:08-25
今日起!私家车10年只检两次 老车正式告别“一年两检”_超过二十年的私家车,一年检车几次
  10月1日起,国内机动车检车新政策正式开始实施。  新措施规定,调整优化检验周期,进一步优化调整非营运小微型载客汽车(9座及9座以下,面包车除外)、摩托车检验周期。  对非...
日期:10-03
再次推出发布!iPhone SE4:或2025年来袭
不可否认,如今的手机产品之间存在的差距并不大,尤其是硬件参数方面,更是很难看出真正的区别,具体的差距还是放到了技术层面上。仅仅是操作系统就可以看出来,如今各大厂商的优化程...
日期:06-22
罗永浩都说好的顺造吸尘器 618促销正式启动(顺造吸尘器z1)
  打扫卫生,是家庭生活的日常。女人搞卫生时心思细腻,甚至达到“强迫症”的程度,房间的边边角角都不能残留任何垃圾杂物;男人搞卫生相对比较“粗线条”,有时只求速度却忽...
日期:07-14
虚拟更衣室火了!Revery.ai 用计算机视觉来增强购物体验
  网络购物丰富了人们的生活体验,但对于贴身衣物来说,依靠单一的尺码和裁剪,很难让人们购买到合适的衣物,因此技术人员开始利用 AI 技术来弥补这一缺陷。   据 TechCrunch...
日期:12-04
谷歌CFO表示将资源集中优胜业务 减少对失败业务的投入
  北京时间1月21日早间消息,谷歌CFO帕特里克·皮谢特(Patrick Pichette)今天在财报电话会议上表示,该公司去年年初曾担心业务范围过于宽泛,因此决定将更多资源集中在“优胜”...
日期:07-25
华为小艺输入法开始内测(华为小艺输入法官方下载)
  原标题::高效语音识别       华为的输入法终于来了!不是EMUI/HarmonyOS系统自带的弱鸡版,而是全新设计的,命名为华为小艺输入法。   目前,华为小艺输入法已经开始内测...
日期:07-17