您的位置:首页 > 互联网

算力平台「寻找"算力王":智算中心需要怎样的AI服务器(附典型比较)」

发布时间:2024-11-14 09:34:32  来源:互联网     背景:

寻找"算力王":智算中心需要怎样的AI服务器(附典型比较) 通信产业网|2024-11-12 09:30:15作者:胡媛来源:通信产业网

【通信产业网讯】(记者 胡媛)近两年,AI大模型给产业带来了巨大的影响,以GPU为核心的智算逐步成为算力的主要发展方向。据工信部规划,中国智能算力的占比将在2025年达到35%,年复合增长率在30%以上,这意味着智算中心将引领数据中心建设的潮流。

服务器是提供数据存储、运算等服务的高性能计算机,包含处理器、内存、硬盘和其他功能及基础硬件。2024年以来,中国智算中心建设如火如荼,也在不断推动着服务器厂商持续推出加速计算服务器新品。

运营商智算“加速跑”

AI算力基础需求高增,国内供给显著改善。今年以来,运营商开展了大规模的智算中心建设,并开展了几次重要的算力服务器集采。

从资本开支来看,运营商加大算力相关资本开支。公开信息显示,2024年,中国移动算力领域预计投入475亿元,同比增长21.5%,占资本开支比重提升5.8个百分点至27.5%。中国电信产业数字化计划资本开支370亿元,同比增长4.1%,在云/算力计划投资180亿元。中国联通在算网数智投资方面将坚持适度超前、加快布局,但是未披露具体数额。可以看出,中国移动暂时拔得头筹,中国电信和中国联通紧随其后。

此外,财报显示,到2024年底,中国电信智算算力规模将大幅领先,中国移动次之。中国电信计划2024年智算算力提升10EFLOPS,超过21EFLOPS。中国移动2024年智算算力累计超过17EFLOPS。

从运营商积极布局智算中心来看,据不完全统计,目前,国内建成和在建的智算中心项目超500个,运营商为满足市场需求,正加快建设智算中心项目超80个,争夺政企市场。

中国移动优化全国性智算中心和边缘智算节点布局,全网智算规模达到17EFLOPS(FP16),年内将投产3个近两万卡超大规模单体智算中心和12个区域智算中心。中国电信适度超前建设智算基础设施,持续加大智算能力建设,规划并建设全国“2+3+7+X”公共智算云池,在京津冀、长三角地区建设两大万卡智算集群,西部地区打造大规模绿色智算池。中国联通布局热点集约、跨区辐射、边缘覆盖的多级算力体系,构建了“1+ N+X”全国分梯次智算资源,IDC规模超40万架,云池覆盖230多个城市。

从运营商招标项目来看,2024年4月,中国移动发布2024年至2025年新型智算中心采购招标公告,此次采购包含AI服务器7994台,成为有史以来国内最大规模的AI服务器集采。加上此前中国移动2023年至2024年新型智算中心(试验网)集采项目,12个标包对应AI训练服务器采购量总计达到2454台,中国移动这两次AI服务器集采规模合计超万台。

除了中国移动之外,其他两大运营商此前也开启了AI服务器大规模采购。中国联通在今年3月启动2024年人工智能服务器集采,其中,人工智能服务器采购总规模为2503台。中国电信在去年10月也采购了4175台AI服务器。以算力基础设施来说,在大模型产品迭代发展中,算力需求持续增长,带动AI服务器的需求居高不下。

AI服务器市场竞争激烈

Htc one s

在智算中心的建设中,服务器的选择至关重要,它直接关系到算力的强弱、任务的执行效率以及资源的利用率。一般来讲,智算中心的服务器主要包括训练服务器、推理服务器或训推一体服务器等三大类。

星联汽车科技

训练服务器主要利用大量数据对AI模型进行训练,通过调整模型参数使模型更好地拟合数据,学习数据中的特征和规律。这通常需要高性能的硬件支持,如高性能GPU或TPU(张量处理单元),以及大容量内存和高速存储设备。此类服务器的特点是适用于模型开发和训练阶段,需要强大的计算能力和长时间的稳定运行。  

推理服务器主要功能是对输入数据进行快速推理计算,生成预测结果。这通常用于实时应用场景,如自动驾驶、实时语音识别等。这类服务器特点是要求低延迟、高可靠性,通常采用低功耗的GPU或专用的推理芯片,如NVIDIA的TensorRT系列芯片,在保证推理速度的同时降低能耗和成本。

训推一体服务器是既能进行模型训练又能进行推理计算的服务器。它的特点是资源利用率高,可以根据实际需求灵活分配计算和存储资源。但设计和维护成本也相对较高,需要解决CPU和GPU之间的算力融合问题,以及不同任务之间的资源调度问题。

针对智算中心存在的算力融合、算力孤岛、算力低效、硬件投资与更新、网络与管理等问题,在智算中心的建设中,服务器的选择应根据实际需求进行权衡。训练服务器适用于模型开发和训练阶段,推理服务器适用于实时应用场景,而训推一体服务器则可以在两者之间实现灵活切换和资源共享。

与此同时,智算服务器与传统通用服务器最大的区别,在于算力芯片的不同。智算服务器为了保证操作系统运行,也配置了CPU。但是,为了更好地完成AI计算任务,配置了更多的GPU、NPU(神经网络处理单元)、TPU等计算芯片(4块或8块),以这些芯片输出的算力为主。

除了芯片不同之外,为了充分发挥性能以及保障稳定运行,AI服务器在架构、存储、散热、拓扑等方面也进行了强化设计。例如,智算服务器的DRAM容量通常是普通服务器的8倍,NAND容量是普通服务器的3倍,甚至它的PCB电路板层数也明显多于传统服务器。

大模型发展带来了对超大规模算力、高性能存储、超大规模算力调度及管理、绿色节能等技术能力的需求。算力中心当前阶段,规模属于万卡集群、体量大,服务器采购要多型号、多厂家,配套液冷需要专业液冷供应商提供,来解决其解耦交付痛点。

算力服务器是什么东西

超聚变推出FusionPoD for AI整机柜液冷服务器,从双生态、多样性算力、绿色低碳方面全方位重构智算底座,为智算集群需求打造高密、坚实、开放平台。中兴通讯推出的新互联AI服务器突破单节点算力瓶颈,旨在应对AI大模型训练中的通信带宽和时延挑战,并在算力提升和扩展性方面展现了领先的技术创新。新华三新发布的H3C UniServer G7系列依托面向AI的可进化架构、内生AI的操作系统和管理中枢,以及拥抱AGI的多元算力体系,为用户提供了灵活、高效、绿色的算力支持。浪潮元脑服务器NF5898G8,在AI算力方面具有强大的兼容性和卓越的性能,进一步加速算力融合创新。联想新一代Neptune海神液冷服务器,允许AI和HPC客户在不需要专门的数据中心空调的情况下运行100千瓦以上的服务器机架,98%的热量将转移到水循环中。信维全新推出的AI训推服务器H8650G5I提供不同的散热SKU,包括空气冷却和液体冷却解决方案。

对于服务器厂商而言,当其身量已不再局限于提供单一硬件产品时,而是提供综合性解决方案,这些解决方案可能包括服务器、存储、网络、安全等方面。未来,智算服务器将采用更高效的能源使用方式,实现绿色计算,并加强数据和模型的保护措施,以确保数据的安全性和隐私性。

责任编辑:胡媛


返回网站首页

本文评论
乘联会:特斯拉中国3月交付近8.9万辆,汽车行业加速告别燃油车时代
风口财经记者 王贝贝不久前,中国石油宣布,把新能源提升到与油气同等的战略高度,以期转型成为可提供充电、换电等绿色低碳服务的综合性国际能源公司。网友对此评价:连石油公司都...
日期:04-05
滴滴高德等南京 23 家网约车平台签署倡议书:承诺抽成不超 30%_2021南京网约车
感谢IT之家网友 風見暉一 的线索投递!IT之家 8 月 9 日消息,据中国网约车分会 8 月 7 日消息,针对当前行业服务质量参差不齐,平台低价竞争损伤驾驶员权益等问题,滴滴、高德、T3、...
日期:08-10
联想cis「联想全球首度展示AI PC:个人电脑迎来全新的朝阳」
通信世界网消息(CWW)10月24日,联想集团在举行的Tech World上公布了其迄今为止最全面的人工智能产品技术,以及“AI for All”的愿景。今年的活动是联想举办的第9届活动,重点关注联...
日期:10-28
新视角! 研究发现:大语言模型通过阅读文档学会使用工具
本文概要:1. 研究发现,语言模型通过阅读文档成功学会使用工具,甚至能够发明新的方法。keep创始人王宁创业之路2. 使用文档训练的模型在零样本性能上与仅使用演示训练的模型相...
日期:08-07
唯品会第二季度营收245亿元 Non-GAAP净利润16亿元_唯品会盈利模式分析
讯 北京时间8月19日下午消息,唯品会(NYSE:VIPS)今日发布了截至6月30日的2022年第二季度财报。财报显示,唯品会第二季度总净营收为245亿元(约合37亿美元),而去年同期为296亿元。归属...
日期:08-20
华为云智慧停车「华为创新!全国首个5.5G智慧停车场上线:自动召泊车 节省30分钟」
快科技3月20日消息,上海移动联合华为在浦东新区前滩太古里完成全国首个智慧泊车停车场网络建设。通过多点位新型数字化室分基站全面覆盖,华为为超过7万平米的地下空间提供5.5G...
日期:03-20
2023世界物联网500强排行榜入围企业公示_世界物联网企业排名
2023世界物联网500强排行榜入围企业公示 通信产业网|2023-06-08 14:36:47作者:通文来源:通信产业网【通信产业网讯】2023世界物联网500强排行榜已进入评选阶段,根据评选细则,现...
日期:06-08
极光(JG.US):2022年新资讯行业年度盘点报告(极光大数据美国上市)
  极光(Aurora Mobile, NASDAQ:JG)发布《2020年新资讯行业年度盘点报告》,从新资讯行业市场概览、新资讯行业发展趋势、新资讯行业用户洞察等角度深入分析新资讯行业的方...
日期:07-10
老板曾承诺将自己转正-网友考研上岸后被公司以能力不足辞退
4月26日消息,浙江丽水一网友发文称自己考研上岸后被公司辞退。他说,自己去年研究生初试后应聘了一家公司,试用期三个月且不交五险一金。快递投诉最狠的方式12315之前老板曾承诺...
日期:10-01
AMD威武 媲美PS5!特斯拉Model S/X能玩几千款游戏了_特斯拉上面玩ps5
虽然比预期得晚一些,但它终于来了!马斯克宣布,Model X、Model S升级之后已经打通Steam平台,上边的几千款游戏都可以在车里直接玩了,无论是《武士3》还是《艾尔登法环》,都不在话下...
日期:12-16
马斯克将出席英国首相 Rishi Sunak 主持的人工智能安全峰会_马斯克谈人工智能
10 月 31 日消息:据《卫报》消息确认,马斯克将出席本周在布莱切利公园举行的 Rishi Sunak 主持的 AI 安全峰会,两人将于周四在这位亿万富翁的社交媒体网站 X 上进行现场对话。...
日期:10-31
看完微信群里的黑料 PDF,我成了网络私刑的帮凶。_黑料正能量群
早年间,在网络上的各个群聊里,会通过 PDF 流传各种学术报告或者资料。这些来自一线的内容,让你对这个世界有了更深的了解。lg集团与三星集团也有些不怀好意的人,在网上散发 36...
日期:12-05
谷歌的薪酬体系「谷歌员工对削减成本不满:CEO 称“不要把乐趣等同于金钱”」
  北京时间 9 月 23 日晚间消息,据报道,在谷歌本周的“全员大会”上,员工们对公司近期的一系列削减成本措施表示不满,而 CEO 桑达尔・皮查伊(Sundar Pichai)回应称,不要总是把乐...
日期:09-26
微信文件传输助手是人吗「微信文件传输助手是真人?官方回应 假的,已禁止类似微信名」
近日,微信文件传输助手被指是真人的传言引起了人们的关注。有网友在社交平台上发文表示,微信文件传输助手居然是活人,这让平时将其视为备忘录或网盘的用户感到担忧。之前许多人...
日期:06-27
中国移动发布低空智联网“1115”技术创新成果
通信世界网消息(CWW)6月26日,在2024年上海世界移动通信大会期间,中国移动以“智联低空,领航未来”为主题,举办低空智联网创新成果发布会,重磅发布低空智联网“1115”技术创新成果。...
日期:06-27
NAS新品突然下架!绿联发布致歉信:存在部分bug需要时间修复_绿联nas评测
快科技6月4日消息,在618之前,绿联集中发布了9款NAS产品,包括DXP480T Plus、DXP2800系列、DXP4800系列、DXP6800系列等。相比于绿联此前推出的几款NAS,新款升级了全新的全新操作...
日期:06-04
续航可达续航720km!极越01长续航版将于6月1日上市_广州极越电子有限公司怎么样?
快科技5月30日消息,极越汽车官方宣布,极越01长续航版将于6月1日上市。小米手机马上要发布什么新款据悉,这款新车在设计上与其他版本保持一致,但搭载了单电机,最大功率200千瓦,最大...
日期:05-30
天玑9300星速引擎强力加持,玩手游帧率更高,续航更长_天玑900频段
近期,联发科发布了最 新的天玑 9300 旗舰芯片,引起数码圈和手游圈的广泛关注。天玑 9300 的全大核CPU架构设计,带来性能、能效的全面升级,同时这次还在游戏技术和游戏生态方面带...
日期:11-10
抖音电商变天了「抖音的天平,从电商倒向本地生活」
声明:本文来自于微信公众号 新莓daybreak(ID:new-daybreak),作者:黄小芳,授权转载发布。整个2022年,抖音对本地生活的布局都在加速和加量。在梁汝波反复强调降本增效的基调下,本地...
日期:01-06
马斯克必须向三名被解雇的推特高管支付逾2亿美元「马斯克与推特ceo」
DoNews10 月 28 日消息(郭睿琦)据界面新闻报道,在Twitter与马斯克麾下X Holdings的合并中,Twitter首席执行官Parag Agrawal、首席财务官Ned Segal和法务政策主管Vijaya Gadde获...
日期:10-29