您的位置:首页 > 互联网

元象开源650亿参数高性能大模型,无条件免费商用__元象教育

发布时间:2023-11-06 19:36:08  来源:互联网     背景:

11月6日消息,元象XVERSE公司宣布,开源650亿参数高性能通用大模型XVERSE-65B,无条件免费商用。

元象XVERSE创始人姚星表示:“面对研发时间紧、算力持续短缺等挑战,团队依靠丰富经验,三个月内研发出多款高性能7B、13B模型,并最早为社区献上一个‘大有可为’的65B模型,为研究、商业及生态创造三重价值。”


元象教育

据介绍,XVERSE-65B底座模型在2.6万亿Tokens的高质量数据上从头训练,上下文窗口扩展至16K,支持中、英、俄、法等40多种语言。

元象坚持“高性能”定位,提升了65B三方面能力: 一、理解、生成、推理和记忆等基础能力,到模型的多样性、创造性和精度表现,从优异到强大;二、扩展了工具调用、代码解释、反思修正等能力,为构建智能体(AI Agent)奠定技术基础,提高模型实用性;三、显著缓解7B、13B中常见且可能很严重的幻觉问题,减少大模型“胡说八道”,提高准确性和专业度。

据悉,元象大模型系列均为全链条自研,涵盖多项关键技术与研发创新:

元象文化传播有限公司

保时捷macan电动什么时候上市

元象集团

复杂分布式系统设计:借鉴团队研发腾讯围棋AI“绝艺”、王者荣耀AI“绝悟”等大系统上的丰富经验,自研高效算子、显存优化、并行调度策略、数据-计算-通信重叠、平台与框架协同等关键技术,打造高效稳定的训练系统, 千卡集群峰值算力利用率达58.5%。

苹果iphone自研芯片

全面提升性能:65B训练中采用FlashAttention2加速计算, 3D并行基础上采用虚拟流水线(virtual pipeline)技术,降低较长流水线产生过高气泡率,提升计算推理效率; 上下文窗口长度从8K逐步提升到16K,使其不仅能出色完成复杂任务,包括长文理解、长文生成和超长对话,还拓展了工具调用、代码解释及反思修正能力,能更好构建智能体(AI Agent)。

提升训练稳定性:因计算量庞大,通信拥塞、芯片过热或计算节点故障成为65B训练常态,初期出现过一周最高八次故障的情况。通过集群基础设施运营、资源调度、训练框架和调度平台协同等持续优化,元象打造出高稳定、低中断、强容错的训练系统,将每周有效训练率提升至98.6%。

此外,在接近1.6万亿Tokens的模型训练中期,损失函数产生了NaN值,可能导致训练中断。通常情况下,业界一般会在分析后删除与之相关的数据区间。而团队根据经验判定这是模型自然演化,选择不删除数据,直接跳过相关参数更新,最终 NaN值 问题解决。后期对参数值、激活值、梯度值等中间状态的进一步分析表明,该问题可能 与模型最后一层transformer block激活值的最大值变化有关,并会随最大值的逐渐降低而自行解决。

小米新款旗舰曝光

为确保业界能对元象大模型性能有全面、客观、长期认知,研究人员参考了一系列权威学术测评,制定了涵盖问答、理解、知识、推理、数学、代码等六个维度的11项主流权威测评标准,将持续使用并迭代。

XVERSE-65B在与国外标杆对比测评中,部分指标超越、综合性能媲美GPT3.5;全面超越开源标杆 Llama2-70B和Falcon-180B ;与GPT4仍有差距。

据介绍,元象大模型可在Github、Hugging Face、魔搭ModelScope等多平台搜索“XVERSE”下载,简单登记后即可无条件免费商用,能满足中小企业、科研机构和个人开发者绝大部分的应用与迭代需求。

元象同时提供模型训练、推理、部署、精调等全方位技术服务,赋能文娱、金融、医疗等各行各业,帮助在智能客服、创意写作、精准推荐等多场景打造行业领先的用户体验。2023年10月, 腾讯音乐宣布与元象大模型建立战略合作 ,共同推出lyraXVERSE加速大模型、全面升级其音乐助手“AI小琴”,未来还将持续探索AI与3D前沿技术。(一橙)


返回网站首页

本文评论
5G带来10倍体验提升-华为获“最佳移动网络基础设施奖”_华为5g基站产品
在MWC2023巴塞罗那期间,华为MetaAAU系列产品荣获GSMA全球移动大奖(GLOMO奖)“最佳移动网络基础设施奖”,旨在表彰华为长期围绕Massive-MIMO极强性能、极致能效、极简部署等方向...
日期:09-19
B站小红书,盈利靠电商?_小红书人多还是b站人多
声明:本文来自微信公众号“伯虎财经”(ID:bohuFN),作者:陈平安,授权转载发布。今年上半年,快手交出了上市以来的第一份盈利财报。很长时间里,这家把“技术理想主义”写入算法、用户...
日期:09-13
京东双11开门红,飞利浦手机好物别说你不在意
  “情不知如何而起,竟一往情深,恰如我们:十年前,因为相信,所以看见;十年后,就在眼前,看见一切。”这是2018年某电商平台双11豪取2135亿成交额的感慨,如此惊人的数据让人为之感动...
日期:10-23
同档位无敌!一加12屏幕创纪录:亮度高于3000尼特_一加屏幕亮度调最低还是光
快科技10月26日消息,一加科技李杰暗示,一加12这块东方屏亮度远超3000尼特,将会打破行业纪录。亮度一直是OLED屏幕的短板,要想带来最极致的OLED屏幕,就必须打破亮度的瓶颈,一加在东...
日期:10-27
涉嫌非法运输危险病原体 美国调查马斯克脑机接口公司
凤凰网科技讯 北京时间2月10日消息,美国运输部周四表示,正在调查埃隆马斯克(Elon Musk)的脑机接口公司Neuralink,原因是该公司可能非法运输了危险病原体。oppo k10 pro发布旗舰...
日期:02-13
淘特上线两款智能新品“微店铺”和“心动搜索”__淘特官方直营店
11月16日消息,淘特宣布上线两款智能产品:淘特“微店铺”和“心动搜索”。据介绍,淘特“微店铺”和“心动搜索”基于淘特搜索逻辑研发出的体验新功能,通过商业创新和交互创新,提升...
日期:11-28
这价格杀疯了_机械革命RTX4060笔记本首发5999元
前不久,机械革命推出了蛟龙16K系列笔记本,搭载了AMD锐龙R7-7735H处理器,配备RTX 3050显卡,售价4999元。现在,目前,蛟龙16K系列机型的RTX 4050和RTX 4060版本也来了,售价5499元和599...
日期:09-20
挖矿害了显卡市场 贴吧「大规模显卡挖矿彻底凉凉,网友开香槟坐等价格崩盘」
梦晨 发自 凹非寺量子位 | 公众号 QbitAI世界上除了币圈,第二关注以太坊合并的是谁?没错,就是游戏玩家。随着倒计时结束,全网算力瞬间归零,显卡大规模挖矿成为历史。另一边网友们...
日期:09-20
百度智能云称将于9月5日发布大模型技术产品「百度智能云app官方下载」
7月26日 消息:百度宣布,将在9月5日举办2023百度云智峰会。与客户、伙伴一起,将各行各业与大模型进行深度融合,把握重构机遇实现智能化跃迁。sk海力士利润百度智能云透露,届时将...
日期:07-26
电瓶车突发自燃,联通小伙飞奔救火_电瓶车自燃酿成事故怎么理赔
电瓶车突发自燃,联通小伙飞奔救火 通信产业网|2023-07-07 16:53:03作者:詹景涛 王欢来源:通信产业网“大火无情人有情,抢险救危显真情。”时隔20天的锦旗,道出一个故事。全体商户...
日期:07-07
讯飞智能学习机告诉你:鼓励和方法对孩子多重要
  俗话说:“五岁成习,六十亦然”,好的学习习惯一定要从小培养,对于孩子来说,处于这个年纪,好奇心本就重,也缺乏耐心和毅力,如果没有家长在一旁督促,单靠孩子自己很难养成一个好习...
日期:07-16
保时捷开卖中国菜刀:标价1700元 可以拍蒜_德国菜刀拍蒜
前段时间,张小泉菜刀拍蒜断裂一事,引起网友热议。而今,造汽车的保时捷,也来凑热闹了。哪个品牌的扫地机器人性价比高近日,保时捷设计在官网上架一款连刀柄部分都是不锈钢的一体式...
日期:10-28
迪士尼相关app「迪士尼宣布将推出整合Disney+与Hulu的全新App」
5 月 11 日消息,迪士尼今日发布了最新财报。该公司二季度营收 218.2 亿美元(备注:当前约 1509.94 亿元人民币);调整后每股收益 0.93 美元。二季度,迪士尼主题乐园、体验及消费品业...
日期:09-29
哈啰app连续包月「哈啰假日狂欢节期间APP日活突破1500万 增速超40%」
10 月 9 日消息,哈啰公布首届假日狂欢节战报。战报显示,哈啰假日狂欢节从 9 月 23 日持续至 10 月 7 日,持续两周的大促活动吸引了超过 1000 万用户参与,平台累计发放福利覆盖用...
日期:10-17
一些社会学和经济学者认为从生产力和产业结构_经济学家:成熟制程或面临产能过剩,稀土等原材料供应成关键
  法国外贸银行亚太地区首席经济学家、欧洲智库布鲁盖尔高级研究员 Alicia Garcia-Herrero 最新文章指出,全球芯片短缺可能很快就会变成供应过剩的危机,而只有投资先进半导...
日期:07-17
wps党政机关专用版安卓版_WPS Office 2019 Linux 专业版推出 “公文模式”,面向党政机关用户
  7月8日消息 7月7日,金山办公在位于珠海的产品研发中心举行了以“民族办公软件的创新之路”为主题的媒体沟通活动。金山办公在 WPS Office 2019 for Linux 专业版中推出...
日期:07-14
我国发布首份汽车标准必要专利研究报告,面向智能网联汽车知识产权问题
7 月 24 日消息,据央视新闻今日报道,在 7 月 23 日举行的 2023 中国汽车创新大会上,中汽研、北京大学联合发布了《汽车标准必要专利蓝皮书》,为我国首份该领域的系统性研究报告...
日期:07-24
受产能影响,特斯拉更新了Model Y和Model 3的交付时间_特斯拉中国Model Y后轮驱动版交付时间缩短为4至8周
讯 8月18日上午消息,据特斯拉中国官网显示,特斯拉Model Y 后轮驱动版预计交付时间已缩短为4-8周,此前预计交付时间为8-12周。 奥迪是西装暴徒,奔驰是什么...
日期:08-20
手机有望成为生成式AI硬件入口-OpenAI已开始招聘安卓、苹果iOS工程师
4 月 17 日消息,OpenAI 近期发布招聘信息,宣布招聘移动终端工程经理、安卓软件工程师和 iOS 软件工程师等岗位,全面开启手机软件生态研发工作。这意味着手机或成为生成式 AI 的...
日期:10-02
苹果 iPhone 14 Pro叹号打孔屏可提醒 App摄像头和麦克风调用状态
IT之家 9 月 1 日消息,彭博社古尔曼援引消息人士的话称,苹果iPhone 14 Pro 机型中的“叹号”形打孔可设置成一整个“药丸”形状,并将中间部分作为隐私指示器,在 App 使用麦克风...
日期:09-05