您的位置:首页 > 互联网

通义千问登顶OpenCompass开源基模评测榜

发布时间:2023-12-13 00:40:38  来源:互联网     背景:

12月12日,中国权威的大模型评测平台OpenCompass日前更新了榜单,阿里云通义千问登上开源基座大模型榜首,并在中文数据集评测中包揽前二。


图说:通义千问72B登顶OpenCompass基座大模型榜

英特尔 财报

OpenCompass是上海人工智能实验室开源的大模型评测平台,涵盖学科、语言、知识、理解、推理等五大评测维度,支持50余个数据集的评测,Qwen、LLaMA2等开源模型及GPT-4、ChatGPT等主流模型均参与评测,可全面评估大模型能力,是业界公认最权威的中文能力评测榜单之一。

通义千问72B开源模型(Qwen-72B),以67.1的综合得分夺得OpenCompass基座大模型榜单冠军,并在学科能力、理解能力两大维度评测中超越标杆GPT-4,创下开源大模型的新纪录。而在OpenCompass中文数据集评测中,通义千问72B基座大模型和对话大模型(Qwen-72B-Chat)包揽前二,与其他模型拉开差距。

苹果手环2019出货量


图说:通义千问72B基座大模型及对话大模型包揽中文数据集测试前二

据了解,自12月1日开源,通义千问72B即在10个权威基准评测中创下开源模型最优成绩,几天前力压Llama2登顶全球最具权威性的HuggingFace排行榜,此次又登上OpenCompass榜首,通义千问72B已成为国内外公认的性能最强的开源大模型,完全可满足企业级、科研级应用对大模型性能的高要求。

截至目前,阿里云已开源通义千问18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解Qwen-VL、音频理解Qwen-Audio的 2款多模态大模型,开源模型系列总下载量超150万,并涌现出150余款新模型和新应用。

战神5诸神黄昏会2022年几月发布

为打造“AI时代最开放的大模型”,通义千问将持续投入开源,并为中小企业及全球开发者提供更便利的大模型服务:开发者可在阿里云魔搭社区直接体验系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用;阿里云人工智能平台PAI还针对通义千问全系列模型进行深度适配,推出轻量级微调、全参数微调、分布式训练、离线推理验证、在线服务部署等服务。

雷峰网

小狗吸尘器构造


返回网站首页

本文评论
影像越级!真我11定档5月10日「真我系列最新」
真我手机正式官宣了真我11系列的新品,其Slogan为“越级影像旗舰”,预计于5月10日16点正式亮相。据此前的消息透露,真我11系列将共推出三款机型:真我11、真我11 Pro和真我11 Pro...
日期:04-26
快手2019营收_快手2022年第二季度营收217亿元 调整后净亏损13.1亿元
查看最新行情   讯 8月23日下午消息,快手今日发布2022年第二季度及全年财报。财报显示,该公司第二季度营收217亿元,同比增长13.4%。净亏损31.8亿元,预估...
日期:08-24
三星j708i「三星j708」
三星J708手机是三星公司在2008年推出的一款智能手机,这款手机的设计风格简洁大方,外观造型时尚,非常受年轻用户的青睐。在性能方面,三星J708手机配置了1.3GHz的处理器,运行起来非...
日期:05-29
字节参战!火山引擎明确不做大模型 但已服务国内七成大模型厂商
“火山引擎自己是不做大模型的,我们首先服务好国内做大模型的厂商,等他们把大模型做好之后,我们再一起合作开展对外的服务。”火山引擎总裁谭待向TechWeb等表示。随着ChatGPT的...
日期:04-19
中国区块链产业园区发展图谱研究_中国区块链产业园区发展图谱
锌链接整理了全国各地区块链产业园区的发展实况,从园区的规模、入驻企业、补贴政策,以及地方产业基金、产业政策共5个维度,希望为正在考虑发展选址问题的企业,提供参考...工信部...
日期:08-07
惠普电脑发布时间_惠普web OS电脑亮相 上市时间与售价未定
  在苹果iPad2即将在3月2日发布的消息传出之际,全球最大的电脑制造商惠普 也在这一领域发力,其首款平板电脑 产品HP TouchPad昨日在中国首次亮相,惠普希望借助从Plam高价收...
日期:07-26
元象开源650亿参数高性能大模型,无条件免费商用_元象集团
11月6日消息,元象XVERSE公司宣布,开源650亿参数高性能通用大模型XVERSE-65B,无条件免费商用。元象XVERSE创始人姚星表示:“面对研发时间紧、算力持续短缺等挑战,团队依靠丰富经验...
日期:11-06
北斗“小红车”亮相银川街头:能识别用户逆向骑行 是否戴头盔、带人
3月10日消息,500辆人民出行”共享电单车近日亮相银川街头,被市民亲切称为小红车”,小红车”能够充分运用北斗智慧进行智能骑行。拼少少平台据了解,小红车”基于北斗等技术,可以精...
日期:03-10
抖音极速版砍价页面「抖音极速版商城修改9块9特价频道、超值秒杀频道的价格要求」
11月17日 消息:昨日晚间,抖音电商发布了关于修订《抖音极速版商城9块9特价频道招商规则》《抖音极速版商城超值秒杀频道招商规则》的公示通知。规则公示期2022年11月16日-202...
日期:11-18
2022年依旧解决不好!iPhone 14 Pro被网友吐槽信号差「iPhone 12 pro信号不好」
苹果手机的信号问题多年来一直是网络的热点话题,甚至到了2022年,苹果依旧没有将这个致命问题很好的解决掉,并将“祖传手艺”延续到了iPhone14系列身上。今天,一则#iPhone14Pro被...
日期:09-29
中国研究人员推出强大开源视觉语言基础模型CogVLM_开源视觉库有哪些
要点:1. CogVLM是一款由中国研究人员介绍的强大开源视觉语言基础模型,通过深度整合语言和视觉信息,提升了跨模态任务的性能。2. CogVLM采用了新颖的训练方法,通过可训练的视觉...
日期:11-13
电商高度内卷,百度AI破局?「百度ai架构」
声明:本文来自于微信公众号财经故事荟(ID:cjgshui),作者:万天南,授权转载发布。2023年,AIGC正当风口。在国外,OpenAI的来势汹汹,让谷歌等一众硅谷大厂,也心生惧意。而在国内,百度成为了...
日期:05-29
Brave 搜索引擎新增 AI 功能 Summarizer:提供更简洁准确的搜索结果「bring搜索引擎」
3月3日消息:Brave浏览器宣布,其专属搜索引擎Brave Search将增加最新的人工智能功能:Summarizer。雷士照明618活动图片来自BraveiPhone 14 MaxSummarizer会在Brave搜索结果页面...
日期:03-03
华为mate pro 6「「Pro神奇功能被曝光 「不用码_华为Mate60」」」
来源:中关村在线冬季身上越挠越痒近日,华为Mate60 Pro手机正式上市,用户们纷纷在社交媒体上晒出这款手机的创新功能。其中,最引人注目的是“不用码”的快捷支付功能。 在一段视...
日期:09-12
特斯拉上半年营收「市值一夜蒸发超2800亿!特斯拉第三季度营收1711亿:总产量超43万辆」
快科技10月19日消息,北京时间今日凌晨,特斯拉公布今年第三季度财报,数据显示,第三季度特斯拉营收234亿美元(约合1711亿元人民币),为年内最低增速,同比增长9%,环比下降6%,低于分析师预...
日期:10-19
华为Mate 40 Pro官翻开售:麒麟9000仅4299元「mate40pro官价」
华为Mate 40 Pro在发布之后就面临一机难求的局面,搭载的麒麟9000处理器也被不少用户追捧,近日华为官网开售Mate 40 Pro官翻版,128GB版本的售价为4299元。Mate40Pro采用了极具辨...
日期:05-27
碳酸锂价格跌破50万元大关 专家称还将腰斩 比亚迪等有望降价_碳酸锂提价最新消息
1月9日,电池级碳酸锂价格跌破50万元/吨大关,创4个月新低,较11月上旬的最高点跌去了约22.83%。amd什么时候支持ddr5业内人士认为,未来碳酸锂供需格局或仍处于紧平衡状态,碳酸锂价...
日期:01-10
谁在为潮流综艺买单?_谁在为潮流综艺买单啊
声明:本文来自于微信公众号深响(ID:deep-echo),作者:祖杨,授权转载发布。从街舞到说唱,潮流文化综艺仍然是金主的宠儿。走过五季的《这!就是街舞》吸金力仍然强劲——刚收官的《街舞...
日期:11-10
净利增长停滞 金山办公遇转型阵痛_金山办公大跌
  来源:北京商报每日优鲜的机会和威胁  2019年11月上市至今,金山办公共发布了3份上半年财报,根据2022年8月23日发布的2022年上半年财报,扣非净利润2.01亿元,不仅低于前两年,还...
日期:09-10
新流量密码:佛媛之后,“道士”下山_佛媛是谁
声明:本文来自微信公众号“深响”(ID:deep-echo),作者:周霖,授权转载发布。雍和宫的香火燃得很旺。暑假叠加毕业季,来自五湖四海的年轻香客们在这里求事业、求财富,顺便再请一串寓...
日期:07-18