您的位置:首页 > 互联网

文心3.5到4.0:版本前进0.5背后 推理成本或暴增10倍不止_文心ait

发布时间:2023-10-15 14:10:45  来源:互联网     背景:

十月一节后第一天就有消息人士透露,百度正在加紧训练文心大模型4.0,或将在10月17日举行的百度世界大会上发布。

此前5月,文心大模型3.5版本已经发布,不到半年,4.0上线在即,而且放在了百度世界大会这样的重头戏上,外界期待值直接拉满。

据悉,从文心3.5到4.0,版本数字前进0.5”背后,推理成本、模型参数量都会迎来暴增,推理成本综合下来高5倍打底,甚至8倍、10倍都有可能,而模型参数量更是超过万亿,也正是万亿的参数量解释了文心大模型4.0推理成本增高的背后原因。

任天堂游戏新闻

先解释下什么是推理成本?其实就是用户单次使用耗费的算力成本,这里算力不仅包括硬件投入,也折算了运维成本。正所谓有输入”才有输出”,推理成本即模型思考”并输出”一次所需的成本。

这个推理成本主要受三个因素影响:

1、模型的网络结构和参数规模,大模型神经网络结构越复杂成本越高,参数规模越大,需要的计算量越大,计算成本就越高。

这就好比人大脑中的神经元网络,神经元网络越复杂,需要学习和思考的东西就越多,也就需要更高的成本。

从爆出来的消息看,文心4.0基于飞桨平台在万卡集群训练出来,4.0参数规模将大于市面上所有已经公开发布参数规模的大语言模型,也有可能突破万亿级别。

根据之前行业媒体的测算,如果要在10天内训练1000亿参数规模、1PB训练数据集,大约需要10830个英伟达A100 GPU。

按照每个A100 GPU的成本约为10000美元,那么10830个GPU的总成本约为:10830*$10000=$108300000

为什么说通用大模型是大厂的游戏,原因就在这里,光门槛就超10亿美元。

2、模型的推理部署,如单机还是并行推理、量化、部署方式等。

优化成本”本身也是要付出代价的。这就好比我们用不同的方式来解决问题。如果一个方法需要更多的时间和精力,那么思考”成本就会更高。

文心ait

如果一个模型在推理时需要大量的计算和存储资源,就像一个大人需要花费更多的时间和精力来解决问题一样,那么推理成本就会很高。

而如果采用一些技术手段,比如将推理任务并行处理或者使用量化技术来减少计算和存储需求,就相当于小孩子用更简单的方式来解决问题,可以节省推理成本。当然,这些技术手段本身也是成本。

3、芯片和集群,包括芯片型号、规模以及集群架构等。

芯片买来就能直接用吗?完全不可能!后面还需要一系列的重成本

这就好比不同的大脑的配置。如果一个芯片或集群的效率更高、速度更快,那么就可以更快地完成推理任务,从而降低推理成本。如果一个芯片或集群的性能不好、速度很慢,这就像一个学习不好的孩子需要花费更多的时间和精力来思考问题一样,推理成本就会很高。

单个芯片可以比喻成一块能发电的砖,如何通过合理配置,最终达到参数规模、推理部署方式以及使用的芯片和集群的性能最大化?这听着都不是一个简单的问题。

随着大语言模型的不断升级迭代,参数量突破万亿、模型能力越来越强、用户使用量激增,推理成本都会成倍增加。

文心大模型4.0增加的更是极致体验

其实自5月发布文心3.5,百度一直通过各种技术优化推理成本,据悉,目前3.5版本推理成本较5月刚发布时,已经下降到原来的几十分之一。

而即将发布的文心大模型4.0版本的推理成本也远低于今年5月的3.5版本,这也是百度积极探索技术手段优化推理性能、降低推理成本的结果。而文心大模型4.0作为单一模型,将是国内首个万卡集群训练的稠密参数大语言模型。

万卡集群背后,如何更好的发挥性能呢?

对于百度来讲,恰好因为过去十年如一日的技术投入,正式因为文心与飞桨的联合优化,才能高效地基于万卡集群训练起这么万亿规模的模型。

10月17日,文心大模型4.0将正式发布,并开启邀请测试。这是迄今为止最强大的文心大模型,它实现了基础模型的全面升级,理解、生成、逻辑和记忆四大能力相辅相成,全面进步。可以说文心大模型的全面升级将为用户带来更极致的产品体验。

通用大模型走向付费是大势所趋

根据海外最新研究《The Economics of Large Language Models》,可以有这样来估计:

每个token(1000 token约等于750个单词)的训练成本通常约为6N,而推理成本约为2N,其中N 是LLM(大语言模型)的参数数量,也就是说推理成本大约相当于训练成本的三分之一。但随着模型上线部署后使用量的增加,推理成本可能远超训练成本。

有媒体估算过,使用云计算服务(以AWS为例)调用ChatGPT的能力,每处理一个输入长度为50字、输出长度为1000字的问题,大约需要消耗0.00014611美元的云计算资源。即用1美元可以向ChatGPT提问约6843个问题。

英伟达rtx 3060显卡

此外,据华尔街日报早前爆料:微软用户量高达150万的AI编程工具GitHub Copilot,平均每个月在每个用户身上都要倒贴20美元,最高能达80美元。也就是说,微软自做出Copilot以来,光是一个月在它上面亏损就高达3000万美元,一年下来亏损直接过亿。要知道,Copilot也不是能白嫖的,会员每月还得交10美元使用费”

而就拿OpenAI来看,它也早已走上了大模型付费之路。对于C端用户,提供订阅模式的ChatGPT Plus,每月收费20美元(合人民币140元),可访问基于GPT-4的完全不同的服务,速度更快,访问更可靠。就算访问 ChatGPT,也可以优先使用新功能和改进。

马斯克在推特上推的币

而对于企业用户,就在今年8月28日,OpenAI官宣推出专注于为大企业服务的ChatGPT Enterprise”。企业版ChatGPT直接对接GPT-4,提供无限制访问、高级数据分析功能、定制服务等服务,并支持处理更长文本输入的长上下文窗口。

并且企业版在保证企业的数据隐私和安全的背景下,还为企业提供全方位的生成式AI功能。此外,除了目前适合大型企业的版本外,OpenAI还将很快推出适用于小微企业、团队的ChatGPT Business产品,服务于所有规模和类型的组织。

台积电同级别芯片加工企业

可以看出大模型收费国外已经开始探索不同路径,而确保模型的可持续发展也正需要资金来支持持续的研发、改进和维护。这就需要一定的收费机制来不断优化和迭代模型,提高模型的准确性和效率,结合用户需求和反馈,不断改进和优化模型,提高用户体验。

高昂成本倒逼下,通用大模型走向付费是大势所趋。


返回网站首页

本文评论
DNS的最佳体验——OneDNS(dns最好用)
  年关将至,疫情再度卷土重来,线上学习和远程办公也将再次成为阶段性常态。一个好用的DNS是安全上网的必要保障,笔者一直想找一个靠谱好用的DNS,日常上网的各种弹窗广告、垃...
日期:07-10
新东方智慧学堂怎么样「智慧教育是什么?新东方智慧教育的行业解决方案」
随着智能化技术的不断发展,智慧教育已成为未来教育的发展方并在国家的大力支持下实现跨越式发展,如今已从硬软件技术的迭代升级进入理念创新、技术创新、教学法创新相融合的智...
日期:05-09
华为mate50最新官方消息「3999元起  华为Mate50E今日开启预售」
中关村在线消息:10月8日上午10:08,主打“创新本色,领势而上”的华为Mate50E即将正式开启预约,10月14日正式开售。华为官方也随手机一同为用户提供了碎屏服务宝、延长服务宝两项...
日期:10-15
6988元起 大疆Air 3旗舰无人机发布:4800万像素双主摄、双4K视频「大疆air无人机怎么样」
快科技7月25日消息,今日晚间,大疆正式发布大疆Air 3准旗舰无人机,售价6988元起。大疆Air 3搭载4800万像素双主摄,其中广角镜头等效焦距24mm,f/1.7光圈,中长焦镜头等效焦距70mm,f/2....
日期:07-26
讯飞版ChatGPT突然开始内测!我们连夜一手实测
声明:本文来自于微信公众号 量子位 (ID:QbitAI),明敏 萧箫 发自 凹非寺 ,授权转载发布。airpods pro会升级吗科大讯飞版ChatGPT产品,提前交卷了!就在昨夜,讯飞骤然向开发者提供了...
日期:04-25
苹果 iOS 17 系统安装率低迷,发布 18 天后约为 23%_苹果11系统
IT之家 10 月 7 日消息,苹果公司在 9 月 18 日向公众发布了 iOS 17 正式版系统。对于许多人来说,这是他们期待了几个月的时刻。但还有一些人可能不知道 iOS 17 已经可以下载升...
日期:10-07
三八节如何专业买新?天猫小黑盒带你体验潮流趋势生活
  在热爱尝试新鲜事物的年轻消费群当道的今天,新品正在成为消费升级的主要驱动力。而品牌上新需要流量,如何迅速引爆市场,面向消费群体植入产品心智,成为新品营销的关键...
日期:07-16
马斯克狂喜!曝推特曾向一名举报人支付700万美元「马斯克推特转发」
【CNMO新闻】马斯克和推特之间持续好几个月的收购案还没结束。9月9日消息,有知情人士透露,推特今年6月份曾向举报人皮特·扎特科(Peiter Zatko)支付约700万美元,后者曾担任推特的...
日期:09-13
xbox国服xgp_Xbox 总监:XGP 将于 4 月 14 日登陆日本,阵容超 400 款游戏
  4月8日消息 据Windows Central报道,日前Xbox总监菲尔·斯宾塞在家中办公室录制了一段公告视频,宣布Xbox Game Pass将于4月14日登陆日本。   视频中,斯宾塞首先展示了自...
日期:12-06
Intel 13代酷睿国行价格公布!有的涨400、有的降100_10代酷睿什么时候降价
Intel今天正式发布了Raptor Lake 13代酷睿处理器、Z790主板芯片组,国行价格也已公开。13代酷睿首发还是六款K、KF系列无锁频版本,具体价格如下——- i5-13600KF:2499元- i5-13600...
日期:09-29
王祖贤生日不忘为武汉送祝福 百度贴吧网友传递抗击疫情正能量
  1月31日,女神王祖贤迎来了她53岁的生日,并在百度贴吧王祖贤吧中晒出了自己的最新动态。粉丝们也发现,平时明艳靓丽的女神在照片中带上了口罩,双手合十做祈祷状,还撰写了长文...
日期:02-21
三防笔记本_dell三防笔记本
现代生活中,笔记本电脑已经成为了人们非常重要的工具。无论在工作中、学习中还是在休闲娱乐中,笔记本电脑都扮演了重要的角色。而在一些特殊的场景下,需要使用“”。如何选择和...
日期:06-03
马斯克或计划最早本周末起在全公司范围裁员 50%「马斯克的员工」
10月31日消息:据《纽约时报》报道,在全面接管推特公司后,马斯克已经计划在推特进行裁员,最快于本周六开始。消息人士透露称,一些经理已被要求拟定好裁员名单。中国法制报广告部...
日期:11-10
外形炫酷,全球首架电动垂直载人飞碟在深圳起飞「电动载人飞行器」
IT之家 6 月 5 日消息,6 月 3 日,深圳市南山区低空经济投资推介会暨行业发展论坛在深圳人才公园求贤阁举行。在此次活动中,一架由深圳幽浮飞碟科技有限公司研发的电动垂直载人...
日期:06-06
智算信息科技有限公司「腾讯云、信通院联合发布《智算赋能算网新应用白皮书》」
随着新一轮科技革命和产业变革深入推进,以及元宇宙、大模型等新兴应用场景的发展,全球对智能计算的需求激增,智算服务正在成为数字经济发展的新引擎,推动算网应用在产业智慧化的...
日期:09-26
Pro Max最受欢迎!郭明錤:iPhone 14 Pro系列下半年出货量将达65%_iphone13promax出货量
9月21日消息,日前,天风国际分析师郭明錤发布苹果、iPhone 14与供应链的近期趋势预测。酷派涉足穿戴设备领域:本月推出首款智能手表是什么郭明錤表示,在产线转换后,iPhone 14 Pro...
日期:09-22
Intel显卡被曝降频:闪电搞定_intel核显闪屏
日前有玩家和媒体发现,Intel Arc A770 16GB限量版显卡存在降频问题,显存实际频率并非标称的17.5GHz,而是16GHz。具体原因不详,不确认是软件识别错误,还是真的缩水了。netflix排行...
日期:11-04
趵突泉鲤鱼「趵突泉的锦鲤胖成“猪鲤”  网友:看来游泳减肥不太管用」
2月5日,一位游客在趵突泉水下拍摄到了一幕迷人的画面:水面下,五彩斑斓的锦鲤成群结队,网友们看完感叹,锦鲤怎么胖成了“猪鲤”。趵突泉的“猪”怎么瘦得跟鱼一样!还有网友表示,看...
日期:02-09
山东一地上空出现超大圆环彩虹 网友:第一次见 美到爆
8月28日傍晚,山东泰安市泰山脚下,出现一道巨大无比的彩虹犹如仙境中的奇观,横跨泰安市上空,将整座城市染上了绚丽多彩的色彩。据悉,彩虹出现的时间正好是傍晚时分,当天的天气晴朗,...
日期:09-01
《阿凡达2》成2022进口片首日票房冠军!时隔69天单日再破亿 豆瓣8.4分
《阿凡达2:水之道》今天已经在内地正式公映,不少粉丝都第一时间走进电影院观看。猫眼专业版数据显示,《阿凡达2:水之道》首日票房超9523.2万,超《侏罗纪世界3》首日票房成绩,成202...
日期:12-16