您的位置:首页 > 互联网

孟子333「孟子3-13B大模型正式开源」

发布时间:2024-04-01 15:29:03  来源:互联网     背景:

4月1日 消息:澜舟科技近日宣布,其研发的孟子3-13B大模型正式开源,并向学术研究领域全面开放,同时支持免费商用。这一轻量化大模型在多项基准测试中展现了优异的性能,特别是在参数量20B以内的模型中,其中英文语言能力尤为突出,数学和编程能力也位于行业前列。

孟子3-13B大模型基于Llama架构,经过高达3T Tokens的数据集训练,该数据集包括网页、百科、社交、媒体、新闻以及高质量的开源数据集。模型在万亿tokens上进行了多语言语料的继续训练,使其中文能力得到显著提升,同时也具备了强大的多语言处理能力。

flyme6哪个版本好

项目地址:https://github.com/Langboat/Mengzi3

孟子13.19

华为p60啥时候出

为了便于用户快速部署和使用,澜舟科技提供了简单的两步操作。首先,用户需要进行环境配置,通过pip命令安装必要的依赖。随后,用户可以通过提供的代码快速开始使用模型,进行基础的交互推理。此外,澜舟科技还提供了样例代码和模型微调的相关文件和代码,以便用户根据自己的需求进行定制和优化。

澜舟科技的选择背后有着明确的商业考量。公司专注于服务ToB场景,并在实践中发现,ToB场景中使用频率最高的大模型参数量集中在10B-100B之间。从投资回报率角度出发,这一参数规模范围的模型既能满足场景需求,又具有高性价比。因此,澜舟科技致力于在这一参数规模范围内打造优质的行业大模型。

孟子3-13B大模型的开源,是澜舟科技在大模型领域的又一重要里程碑。去年3月,澜舟科技发布了孟子GPT V1(MChat),今年1月,孟子大模型GPT V2对公众开放。现在,感兴趣的用户可以通过GitHub、HuggingFace、ModelScope和Wisemodel等平台体验和使用孟子3-13B大模型。

随着孟子3-13B大模型的开源,澜舟科技进一步巩固了其在AI大模型行业的领先地位,并为学术研究和商业应用提供了强大的支持。这一举措无疑将推动大模型技术的发展和应用,为AI产业的进步贡献力量。


返回网站首页

本文评论
谷歌nlp「谷歌 PaLM 2训练所用文本数据量是初代的近5倍」
5月17日消息,谷歌上周在2023年I/O开发者大会上推出最新大型语言模型PaLM 2。公司内部文件显示,自2022年起训练新模型所使用的文本数据量几乎是前一代的5倍。据悉,谷歌最新发布...
日期:05-17
华为手写笔af63「星闪技术加持!华为发布第三代手写笔HUAWEI M-Pencil」
今日下午,华为秋季全场景新品发布会在深圳举行,华为13.2英寸MatePad Pro期间平板率先亮相,与其一同亮相的还有HUAWEI M-Pencil(第三代),华为第三代手写笔和华为MatePad Pro 13.2英...
日期:09-26
米虫app是干嘛的「“米虫元宇宙”正在加速改变年轻人的生活」
在米虫元宇宙的大环境下,很多事情都变得不同了。比如,我们现在可以在虚拟世界中建立自己的房子、经营自己的生意、与他人进行交流和合作,甚至可以在虚拟世界中赚取真实的货币。...
日期:08-26
抖音电商好物秒杀第一个活动专区「2022年抖音双11好物节活动招商规则公布 十余种玩法助力商家」
9月28日 消息:昨日,抖音双11好物节招商大会面向全体商家、达人正式召开,并公布了详细的招商规则。本次活动提供了十余种重磅玩法助力商家实现平台生意新突破。其中,「跨店每满...
日期:10-02
60件工具一套配齐!米家wiha家用工具箱众筹1699元 超1.7万人支持_分享米家设备
本月初,小米发布了米家wiha家用工具箱,并在小米商城开启众筹,内含60件维修工具,原价1999元,众筹价1699元。明天上午10点,这款产品将结束众筹。截止15日晚22时,米家wiha家用工具箱获...
日期:11-16
闪存降价太狠 SSD利润暴跌:都不如HDD机械盘有钱赚_ssd价格暴涨
今年NAND闪存遇到了大熊市,价格跌的厉害,SSD硬盘的价格也直线滑落,我们昨天推荐了多款2TB及以上的SSD,价格可以做到799元了。对消费者来说,现在SSD价格很爽,然而对厂商来说,现在的...
日期:11-02
并将把大部分业务转移到欧洲 Evernote已裁掉大部分美国员工_evernote干嘛用的
笔记应用公司 Evernote 昨天宣布解雇了大部分位于美国和智利的员工。现在,意大利母公司 Bending Spoons 将大部分 Evernote 的业务转移到欧洲。该公司表示,此举旨在提高运营效...
日期:09-21
速度提高200倍!DeepMind推新的微调扩散模型方法DRaFT
文章概要:- DRaFT通过反向传播整个采样链条来实现基于梯度的奖励微调。- 提出DRaFT-K和DRaFT-LV两种变体,通过截断梯度和多样本平均降低方差,提高效率。- 在Stable Diffusion1...
日期:10-09
软银“大瘦身”:愿景基金裁员幅度或达30%,高于外界普遍预期_软银愿景基金领投,Keep完成3.6亿美元F轮融资
  记者/李京亚  在软银单季经历毁灭性亏损之后,负责投资的愿景基金部门裁员幅度可能高于外界想象。  北京时间9月29日晚间,彭博社援引知情人士消息报道,软银集团预计将对...
日期:10-03
中国量子计算公司 已经用量子来玩股票基金了「哪些基金投了量子科技」
近日,本源量子联合新华指数团队合作开发出量子启发式算法,该算法可以在经典计算机上运行,能够有效降低投资成本,加快决策效率,提升投资收益。比苹果更环保,索尼手机数据线也不送...
日期:11-11
高通与现代汽车集团协作打造定制化车载信息娱乐系统_高通车载芯片 有几个
通信世界网消息(CWW)2023年8月2日,高通技术公司今日宣布与现代汽车集团(HMG)在个性化定制车型(Purpose-built vehicles,PBV)上开展技术合作。个性化定制车型是现代汽车集团的未来出...
日期:08-04
白头发会越拔越多吗?白头发会拔一根长十根吗?听听专家怎么说
出品|科技作者|周锦童 图源:文心一言AI生成我们经常会听到这样的说法:“白头发不能拔,拔一根长十根”。久而久之,我们不免会产生好奇:头发为什么会随着年龄的增长逐渐变白?白头发...
日期:11-18
三星手机维修点「成都三星手机维修点」
随着智能手机的普及,手机维修服务也变得越来越重要。三星作为全球著名的手机品牌之一,其维修服务得到了广泛的关注和追捧。本文将从的基本信息、服务项目以及注意事项等方面进...
日期:05-31
利用IBM Watson Code Assistant重塑IT自动化
作者:Keri Olson,IBM数据和 AI 产品管理总监在当今的数字世界,企业与 IT 领导都在积极转向用自动化来改善运营效率、提高员工生产力,最终提升企业绩效。在 IBM,我们认为企业需要...
日期:05-17
移动云要这么干 力争年营收突破1500亿
【】4月26日消息,在2023移动云大会上,移动云宣布全面开启新征程:未来三年,移动云将全力建设由“移动云技术内核3.0”驱动的算力网络,实现算网一体,通过打造智算中心、算力交易平台...
日期:10-01
高德地图呈现3D阿里动物园 网友:对路痴挺友好「高德有3D地图吗」
9月28日 消息:近日,高德地图正式宣布研发完成导航引擎“视界”,在该引擎驱动下,高德地图v12包含了沉浸导航、3D视界、数字领航员等核心功能。据介绍,3D视界是利用City-Model技术...
日期:10-02
标准普尔500指数相当于国内是什么「标准普尔500指数AI相关公司达到了110家的历史新高」
8月3日 消息:人工智能(AI)是2023年的热门话题。根据FactSet的数据,第一季度在财报电话会议中提到AI的标普500公司数量达到了创纪录的110家,相比之下,一年前只有61家。虽然同行芯...
日期:08-03
天玑8100神U加持!荣耀平板V8 Pro配置曝光:2.5K 144Hz屏、最高12GB内存_荣耀V40搭载天玑1000+处理器
近日,数码博主@数码闲聊站爆料,荣耀平板V8Pro将搭载12.1英寸屏幕,分辨率为2560*1600,支持144Hz高刷。同时,这款平板将搭载天玑8100处理器,这颗芯片在性能和能效比都十分出众,采用台...
日期:12-25
谷歌向印度BharatGPT投资400万美元 支持130多种语言_googleceo印度
# 划重点1. 曝特斯拉Semi卡车即将量产氢动力自行车我国有生产了吗...
日期:11-27
华为 IRB 签发正式决议:好望“机器视觉”升级成为“行业感知”
IT之家 1 月 3 日消息,从华为获悉,华为 IRB(the Investment Review Board,投资评审委员会)2022 年 12 月 30 日签发正式决议,好望“机器视觉”升级为“行业感知”。决议指出,为更好...
日期:01-03