您的位置:首页 > 互联网

百度模块是什么「百度内部专家研讨纪要流出,国内大模型厂商QPS实力PK」

发布时间:2023-04-24 10:23:08  来源:互联网     背景:

日前,百度组织内部专家研讨大模型的会议纪要流出。纪要内容针对国内各家大模型的发展现状,剖析了各家算力、算法、QPS等储备情况和能力水平,并研讨预测国内大模型发展趋势和未来空间。

2022年第一季度手机出货量

纪要主要内容涉及如下:

中兴努比亚z20

百度gmv

一、大模型厂商整体情况

目前国内各大公司大模型水平,文心一言最早启动邀测,综合实力各家最强;阿里其次,与文心一言差距1-1.5年

1.1百度文心大模型

国内大模型与Chatgpt(GPT-3.5)存在一定的差距,文心一言与之在差距3个月以内,包括邀测后即今。

各方面来看,文心一言综合实力最强。

百度在这轮大语言模型的“杀手锏”还是端到端联合优化,文心大模型+飞桨PaddlePaddle深度学习平台,打出组合拳。让百度抢占了先发优势,后面二者联合的效果还会更突出。

飞桨在文心一言开启邀测后,一个月内迭代了4次,最近一次带来的推理提升达到123%(QPS)。模型推理效率提升10倍,模型推理性能提升50%,模型算力利用率提升1倍。

1.2阿里通义大模型

阿里在前2年已经发布了类似的模型,如M6大模型。尽管在当时宣称模型很好,但实际上与GPT比还是有不小差距。ChatGPT发布之后,当前阿里巴巴达摩院顶层领导聚集了百余人团队做M6和PLUG的升级工作。目前距离GPT-3/GPT-3.5大约还有一年半的距离。

阿里没有自主的深度学习框架,不能端到端优化。或者说没有完整框架,只能做训练或推理。这也是比较明显的一短板。

1.3华为盘古大模型

华为盘古大模型已经是业界比较知名的预训练大模型,实力较强。但是只在华为云上提供服务,并且基于自己的升腾服务器部署(升腾910的性能约等于A100的70%)。

这一轮大语言模型的风口,华为处理低调。一来是华为盘古大模型侧重ToB端,其视觉大模型较为成熟,NLP大模型技术能力也不错,应用外界少有合作。华为和百度一样,都在抢发行业大模型,并且耕的很深。

华为AI框架Mindspore,仅开源3年。框架的易用性、实用性、便捷度都不太高,和盘古大模型内部架构协同目前不太明确,框架对模型的助力这么来看很有限。

二、各家算力情况

大模型的一个重要的基础设施是算力,主要是显卡和计算卡。目前,国内国产的算力卡包括百度的昆仑芯片、华为的升腾910、寒武纪MLU370、壁仞的显卡等。

百度年初已下单3000台8卡的A800服务器,2.4万张卡。今年全年可能需求A-H800共5万张。再加上之前的储备,百度可能有十几万张卡,问题不大。再加上百度的自研芯片昆仑芯可以做推理,其实之前就已经在搜索场景中对文心大模型推理,后面昆仑芯3也即将流片。

阿里云上有上万块的A100,整体至少10万个。阿里集团的显卡数量是阿里云的5倍量级。达摩院、天猫、淘宝的算力资源都是集团内资源使用。阿里今年采购预计云上就1万张左右,其中6000张是H800。此外阿里云也会用到平头哥这种自研的,每年大概3000张去采购。

理想ceo

百度模块是什么

360最近也向NV下单上千个A800卡。(因禁售令导致A100受限的国内定制版本,性能比A100低)

三、算法能力

3.1百度文心大模型/文心一言

知识增强和产业级是文心大模型的核心特色,百度的NLP是国内NLP王牌,绝对优势。

NLP崛起的大语言模型这一波也是百度迎来了机会点。

大模型的理念就不是要一直“堆量”,百度知识增强的技术路径也验证了可行性。阿里通义千问也在跟进强调知识增强。

此外,文心一言的技术独特点还有对话增强、检索增强,也都百度很明显的优势。

3.2阿里通义大模型/通义千问

通义千问在理解人类指令、多轮交互、多模态知识理解等方面能力比较突出。也是一个多语言的产品体系。M6大模型基于阿里云、达摩院打造的硬件优势,可将大模型所需算力压缩到极致;另外其底层技术优势还有利于构建AI的统一底层。

3.3华为盘古大模型

华为云团队打造的盘古大模型,2020年立项,2021年4正式发布。盘古大模型深耕行业的特点比较明显,基础大模型包括NLP、视觉、多模态等,也是基于Transformer的架构。

华为的优势则在于其训练出业界首个2000亿参数以中文为核心的预训练生成语言模型。华为还在联合业界,比如自动化所等推出大模型,科学计算大模型也是其特色之一。目前发布了盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项较为重磅的行业大模型。

华为基于Mindspore框架的分布式架构进行训练和推理,也是对外重点。不过优势似乎没有十分凸显。

四、大模型未来发展趋势和建议

苹果耳机airpodspro蓝牙解码

4.1多模态是一大趋势,需挖掘多模态数据,加快布局;

4.2全栈自主的生态链非常重要,尤其是软件上,要在飞桨这样的AI框架上沉淀开发生态;

4.3数据上,中文数据的数量质量跟英文的有不小差距,要对数据进行高质量标注和清洗;

4.4大模型各行业的落地可能在加速,比想象中要快,中国产业链丰富,这是极大的机会


返回网站首页

本文评论
iOS16.1 Beta2正式推送:修复两项重要问题,果粉反馈也出炉了「更新ios14.2时出错」
众所周知,iOS系统一直都是以出色的流畅度为主打方向,但没有想到,自从进入iOS16之后,市场中的争议声一直都没有停止,带来了很多问题,导致用户体验非常差。要知道,卡顿、发热量大、功...
日期:10-02
首份直播业绩出炉,东方甄选半年利润是遥望全年的2倍多?
声明:本文来自于微信公众号 新播场(ID:New_bc),作者:场妹,授权转载发布。刚刚跟央视春晚“传绯闻”的两大直播电商机构,又有了新动态。1月30日晚,遥望科技发布2022年度业绩预告,透...
日期:02-02
女子过年练车坠河:一家3人不幸遇难 还是大学生「女子练车撞死」
据华商报大风新闻消息,1月26日,大年初五,江苏泰州靖江市发生一起悲剧,一女子练车时不慎将车开入河中,导致一家三人不幸遇难。iphone 13 usb-c华为新款5g手机据悉,这名女子现年20多...
日期:01-28
小红书“小众旅游”孤掌难鸣
来源:北京商报   为了搭建起电商交易闭环,小红书可谓不遗余力。在平台着力打造露营消费后,近日,部分露营商家向北京商报记者表示,较之旅游类成熟平台,小红书的引流能力仍不太明...
日期:08-16
小红书登记小红圈PC端软件著作权「小红书用什么注册」
1 月 17 日讯:天眼查App显示,近日,小红书关联公司行吟信息科技(上海)有限公司的“小红书内部社区PC端软件”及“小红圈运营管理后台软件”著作权获得登记批准,两个软件简称分别为...
日期:01-17
上半年游戏业绩透视:新游上线不足  研发成本难减「游久游戏财报」
  转自:中国经营网  本报记者 许心怡 吴可仲 北京报道  进入2022年以来,中国游戏行业迎来转折:国内收入增长见顶,海外成为新的掘金市场……  《中国经营报》记者梳理发...
日期:10-02
顺丰丰修召开2019品牌升级媒体沟通会 服务赋能让一切皆有可能
  5月24日消息 顺丰旗下售后供应链服务品牌顺丰丰修在北京召开以“售后赋能 智能物联”为主题的顺丰丰修2019品牌升级沟通会。 顺丰丰修召开2019品牌升级媒体沟通会  ...
日期:11-12
每日优鲜放弃主营业务,2亿元融资款未到账(每日优鲜的融资经历有哪些,对企业发展有何影响)
荣耀笔记本 magicbook 14每日优鲜上海大木桥前置仓门店,目前已经关店摄影/刘以秦youtube购买与租借2020分析厨电行业索尼FE 12-24mm F2.8 GM   文/刘以秦 辛晓彤   编辑/...
日期:07-31
2020年10月5日诺贝尔奖获得者「2022年诺贝尔奖将从10月3日起陆续揭晓」
  记者/郝晓丽苹果手机玻璃制造商  据诺贝尔奖官网消息,2022年诺贝尔奖将于10月3日至10日陆续颁布。诺贝尔基金会还决定邀请2022年诺贝尔奖获得者与2020年、2021年的获奖...
日期:10-03
epic装机模拟器dlc「DIY玩家必玩!《装机模拟器2》Epic商城开启预购:首发90元」
《装机模拟器》是各位云装机玩家最好用的工具之一,还能满足大家用上高端硬件的心理。现在,全新升级的《装机模拟器2》来了,带来了职业模式、定制功能等等,可以使用40个以上的硬...
日期:10-09
playstation销量「分析师称PlayStation 5美国进口量在上个月大幅增加 上月同比增长400%」
一位分析师声称,在过去几个月里,PlayStation 5的美国进口量大大增加。著名的MST金融分析师大卫-吉布森在Twitter上说,进口数据似乎表明,索尼互动在过去几个月里一直在增加其在美...
日期:10-12
网易严选市场占比「网易Q3营收244亿元 严选销售额同比增长109%」
11 月 18 日消息,网易日前发布 2022 年第三季度财报。财报显示,三季度,网易净收入 244 亿元,研发投入规模为 40 亿元,研发投入强度达16%,连续三季度加码。其中,创新及其他业务Q3 净...
日期:11-23
谷歌和亚马逊等科技巨头增长乏力,分拆能最大限度释放价值?「谷歌和亚马逊如何做产品」
  讯 北京时间2月13日晚间消息,据报道,由于大型科技公司正面临增长乏力的局面,以及不利的经济前景可能阻碍他们重新获得市场主导地位,加强反垄断审查似乎是他们最不需要的。但...
日期:02-15
Faker超越Uzi成为《LOL》世界赛击杀王:351总击杀「uzi在成为全球总决赛中击杀数达300」
今早,在《英雄联盟》S12小组赛中,韩国的T1和EDG双双出线,率先晋级八强。T1的明星中单选手Faker还达成了世界赛击杀王成就,在世界赛拿下了351的总击杀,终于超过了离开舞台两年的Uz...
日期:10-16
《和平精英》吸金能力惊人_和平精英氪金最多的人是谁
  腾讯《和平精英》手游于5月8日登陆安卓和iOS平台进行公测,加入了内购功能,推出后迅速登上了iOS游戏免费榜和畅销榜的榜首,据Sensor Tower统计,玩家72小时之内在《和平精英...
日期:10-19
成为网课老师有多难?高考之后,作业帮层层加码“修炼”好老师
  高考刚刚结束、中考又要临近,作为学校教育的有益补充,在线教育备受关注。对于广大备考或其他考试的学生和家长而言,课程质量和师资是其关注的重点。   优秀的老师是课程...
日期:01-05
工信部将适时开展智能网联汽车准入试点「工信部关于加强智能网联汽车」
IT之家 9 月 4 日消息,据央视新闻,工业和信息化部装备工业一司副司长郭守刚在中国汽车产业发展国际论坛上表示,下一步我国将发布汽车产业绿色低碳发展路线图;加快制定《道路机动...
日期:09-15
拉卡拉一季度业绩「拉卡拉前三季度营收43.55亿元 同比减少11.8%」
10月31日 消息:日前,拉卡拉发布了2022年第三季度报告,报告显示该公司前三季度营业收入为43.55亿元,同比减少11.83%。财报显示,归属于上市公司股东的净利润为4.14亿元,同比减少51....
日期:11-14
iPhone 13 Pro Max 512GB_消息称苹果iPhone 14 Pro/Pro Max手机256GB存储起步
IT之家 8 月 11 日消息,今天早些时候,分析师郭明錤声称苹果 iPhone 14 Pro 机型将比 iPhone 13 Pro 机型更贵。郭明錤没有透露确切的售价,但他表示所有四款 iPhone 14 机型平均...
日期:08-20
破壁机虚标功率引热议 王海回应打假疯狂小杨哥:无恩怨 对消费者太傲慢
近日,网红疯狂小杨哥”因带货的某品牌破壁机和绞肉机,被职业打假人王海举报虚标功率,事件不断发酵引起网友热议。涉事品牌官方对此回应,称该公司的食品加工器(多功能料理机) 轻...
日期:11-17