日前,百度组织内部专家研讨大模型的会议纪要流出。纪要内容针对国内各家大模型的发展现状,剖析了各家算力、算法、QPS等储备情况和能力水平,并研讨预测国内大模型发展趋势和未来空间。
2022年第一季度手机出货量
纪要主要内容涉及如下:
中兴努比亚z20
一、大模型厂商整体情况
目前国内各大公司大模型水平,文心一言最早启动邀测,综合实力各家最强;阿里其次,与文心一言差距1-1.5年
1.1百度文心大模型
国内大模型与Chatgpt(GPT-3.5)存在一定的差距,文心一言与之在差距3个月以内,包括邀测后即今。
各方面来看,文心一言综合实力最强。
百度在这轮大语言模型的“杀手锏”还是端到端联合优化,文心大模型+飞桨PaddlePaddle深度学习平台,打出组合拳。让百度抢占了先发优势,后面二者联合的效果还会更突出。
飞桨在文心一言开启邀测后,一个月内迭代了4次,最近一次带来的推理提升达到123%(QPS)。模型推理效率提升10倍,模型推理性能提升50%,模型算力利用率提升1倍。
1.2阿里通义大模型
阿里在前2年已经发布了类似的模型,如M6大模型。尽管在当时宣称模型很好,但实际上与GPT比还是有不小差距。ChatGPT发布之后,当前阿里巴巴达摩院顶层领导聚集了百余人团队做M6和PLUG的升级工作。目前距离GPT-3/GPT-3.5大约还有一年半的距离。
阿里没有自主的深度学习框架,不能端到端优化。或者说没有完整框架,只能做训练或推理。这也是比较明显的一短板。
1.3华为盘古大模型
华为盘古大模型已经是业界比较知名的预训练大模型,实力较强。但是只在华为云上提供服务,并且基于自己的升腾服务器部署(升腾910的性能约等于A100的70%)。
这一轮大语言模型的风口,华为处理低调。一来是华为盘古大模型侧重ToB端,其视觉大模型较为成熟,NLP大模型技术能力也不错,应用外界少有合作。华为和百度一样,都在抢发行业大模型,并且耕的很深。
华为AI框架Mindspore,仅开源3年。框架的易用性、实用性、便捷度都不太高,和盘古大模型内部架构协同目前不太明确,框架对模型的助力这么来看很有限。
二、各家算力情况
大模型的一个重要的基础设施是算力,主要是显卡和计算卡。目前,国内国产的算力卡包括百度的昆仑芯片、华为的升腾910、寒武纪MLU370、壁仞的显卡等。
百度年初已下单3000台8卡的A800服务器,2.4万张卡。今年全年可能需求A-H800共5万张。再加上之前的储备,百度可能有十几万张卡,问题不大。再加上百度的自研芯片昆仑芯可以做推理,其实之前就已经在搜索场景中对文心大模型推理,后面昆仑芯3也即将流片。
阿里云上有上万块的A100,整体至少10万个。阿里集团的显卡数量是阿里云的5倍量级。达摩院、天猫、淘宝的算力资源都是集团内资源使用。阿里今年采购预计云上就1万张左右,其中6000张是H800。此外阿里云也会用到平头哥这种自研的,每年大概3000张去采购。
理想ceo
360最近也向NV下单上千个A800卡。(因禁售令导致A100受限的国内定制版本,性能比A100低)
三、算法能力
3.1百度文心大模型/文心一言
知识增强和产业级是文心大模型的核心特色,百度的NLP是国内NLP王牌,绝对优势。
NLP崛起的大语言模型这一波也是百度迎来了机会点。
大模型的理念就不是要一直“堆量”,百度知识增强的技术路径也验证了可行性。阿里通义千问也在跟进强调知识增强。
此外,文心一言的技术独特点还有对话增强、检索增强,也都百度很明显的优势。
3.2阿里通义大模型/通义千问
通义千问在理解人类指令、多轮交互、多模态知识理解等方面能力比较突出。也是一个多语言的产品体系。M6大模型基于阿里云、达摩院打造的硬件优势,可将大模型所需算力压缩到极致;另外其底层技术优势还有利于构建AI的统一底层。
3.3华为盘古大模型
华为云团队打造的盘古大模型,2020年立项,2021年4正式发布。盘古大模型深耕行业的特点比较明显,基础大模型包括NLP、视觉、多模态等,也是基于Transformer的架构。
华为的优势则在于其训练出业界首个2000亿参数以中文为核心的预训练生成语言模型。华为还在联合业界,比如自动化所等推出大模型,科学计算大模型也是其特色之一。目前发布了盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项较为重磅的行业大模型。
华为基于Mindspore框架的分布式架构进行训练和推理,也是对外重点。不过优势似乎没有十分凸显。
四、大模型未来发展趋势和建议
苹果耳机airpodspro蓝牙解码
4.1多模态是一大趋势,需挖掘多模态数据,加快布局;
4.2全栈自主的生态链非常重要,尤其是软件上,要在飞桨这样的AI框架上沉淀开发生态;
4.3数据上,中文数据的数量质量跟英文的有不小差距,要对数据进行高质量标注和清洗;
4.4大模型各行业的落地可能在加速,比想象中要快,中国产业链丰富,这是极大的机会