您的位置:首页 > 互联网

算力智库官网「寻找"算力王":智算中心需要怎样的AI服务器(附典型比较)」

发布时间:2024-12-22 13:58:42  来源:互联网     背景:

寻找"算力王":智算中心需要怎样的AI服务器(附典型比较) 通信产业网|2024-11-12 09:30:15作者:胡媛来源:通信产业网

【通信产业网讯】(记者 胡媛)近两年,AI大模型给产业带来了巨大的影响,以GPU为核心的智算逐步成为算力的主要发展方向。据工信部规划,中国智能算力的占比将在2025年达到35%,年复合增长率在30%以上,这意味着智算中心将引领数据中心建设的潮流。

服务器是提供数据存储、运算等服务的高性能计算机,包含处理器、内存、硬盘和其他功能及基础硬件。2024年以来,中国智算中心建设如火如荼,也在不断推动着服务器厂商持续推出加速计算服务器新品。

运营商智算“加速跑”

AI算力基础需求高增,国内供给显著改善。今年以来,运营商开展了大规模的智算中心建设,并开展了几次重要的算力服务器集采。

从资本开支来看,运营商加大算力相关资本开支。公开信息显示,2024年,中国移动算力领域预计投入475亿元,同比增长21.5%,占资本开支比重提升5.8个百分点至27.5%。中国电信产业数字化计划资本开支370亿元,同比增长4.1%,在云/算力计划投资180亿元。中国联通在算网数智投资方面将坚持适度超前、加快布局,但是未披露具体数额。可以看出,中国移动暂时拔得头筹,中国电信和中国联通紧随其后。

此外,财报显示,到2024年底,中国电信智算算力规模将大幅领先,中国移动次之。中国电信计划2024年智算算力提升10EFLOPS,超过21EFLOPS。中国移动2024年智算算力累计超过17EFLOPS。

从运营商积极布局智算中心来看,据不完全统计,目前,国内建成和在建的智算中心项目超500个,运营商为满足市场需求,正加快建设智算中心项目超80个,争夺政企市场。

中国移动优化全国性智算中心和边缘智算节点布局,全网智算规模达到17EFLOPS(FP16),年内将投产3个近两万卡超大规模单体智算中心和12个区域智算中心。中国电信适度超前建设智算基础设施,持续加大智算能力建设,规划并建设全国“2+3+7+X”公共智算云池,在京津冀、长三角地区建设两大万卡智算集群,西部地区打造大规模绿色智算池。中国联通布局热点集约、跨区辐射、边缘覆盖的多级算力体系,构建了“1+ N+X”全国分梯次智算资源,IDC规模超40万架,云池覆盖230多个城市。

从运营商招标项目来看,2024年4月,中国移动发布2024年至2025年新型智算中心采购招标公告,此次采购包含AI服务器7994台,成为有史以来国内最大规模的AI服务器集采。加上此前中国移动2023年至2024年新型智算中心(试验网)集采项目,12个标包对应AI训练服务器采购量总计达到2454台,中国移动这两次AI服务器集采规模合计超万台。

一加10外观

除了中国移动之外,其他两大运营商此前也开启了AI服务器大规模采购。中国联通在今年3月启动2024年人工智能服务器集采,其中,人工智能服务器采购总规模为2503台。中国电信在去年10月也采购了4175台AI服务器。以算力基础设施来说,在大模型产品迭代发展中,算力需求持续增长,带动AI服务器的需求居高不下。

AI服务器市场竞争激烈

在智算中心的建设中,服务器的选择至关重要,它直接关系到算力的强弱、任务的执行效率以及资源的利用率。一般来讲,智算中心的服务器主要包括训练服务器、推理服务器或训推一体服务器等三大类。

训练服务器主要利用大量数据对AI模型进行训练,通过调整模型参数使模型更好地拟合数据,学习数据中的特征和规律。这通常需要高性能的硬件支持,如高性能GPU或TPU(张量处理单元),以及大容量内存和高速存储设备。此类服务器的特点是适用于模型开发和训练阶段,需要强大的计算能力和长时间的稳定运行。  

推理服务器主要功能是对输入数据进行快速推理计算,生成预测结果。这通常用于实时应用场景,如自动驾驶、实时语音识别等。这类服务器特点是要求低延迟、高可靠性,通常采用低功耗的GPU或专用的推理芯片,如NVIDIA的TensorRT系列芯片,在保证推理速度的同时降低能耗和成本。

训推一体服务器是既能进行模型训练又能进行推理计算的服务器。它的特点是资源利用率高,可以根据实际需求灵活分配计算和存储资源。但设计和维护成本也相对较高,需要解决CPU和GPU之间的算力融合问题,以及不同任务之间的资源调度问题。

针对智算中心存在的算力融合、算力孤岛、算力低效、硬件投资与更新、网络与管理等问题,在智算中心的建设中,服务器的选择应根据实际需求进行权衡。训练服务器适用于模型开发和训练阶段,推理服务器适用于实时应用场景,而训推一体服务器则可以在两者之间实现灵活切换和资源共享。

与此同时,智算服务器与传统通用服务器最大的区别,在于算力芯片的不同。智算服务器为了保证操作系统运行,也配置了CPU。但是,为了更好地完成AI计算任务,配置了更多的GPU、NPU(神经网络处理单元)、TPU等计算芯片(4块或8块),以这些芯片输出的算力为主。

智算平台

除了芯片不同之外,为了充分发挥性能以及保障稳定运行,AI服务器在架构、存储、散热、拓扑等方面也进行了强化设计。例如,智算服务器的DRAM容量通常是普通服务器的8倍,NAND容量是普通服务器的3倍,甚至它的PCB电路板层数也明显多于传统服务器。

大模型发展带来了对超大规模算力、高性能存储、超大规模算力调度及管理、绿色节能等技术能力的需求。算力中心当前阶段,规模属于万卡集群、体量大,服务器采购要多型号、多厂家,配套液冷需要专业液冷供应商提供,来解决其解耦交付痛点。

超聚变推出FusionPoD for AI整机柜液冷服务器,从双生态、多样性算力、绿色低碳方面全方位重构智算底座,为智算集群需求打造高密、坚实、开放平台。中兴通讯推出的新互联AI服务器突破单节点算力瓶颈,旨在应对AI大模型训练中的通信带宽和时延挑战,并在算力提升和扩展性方面展现了领先的技术创新。新华三新发布的H3C UniServer G7系列依托面向AI的可进化架构、内生AI的操作系统和管理中枢,以及拥抱AGI的多元算力体系,为用户提供了灵活、高效、绿色的算力支持。浪潮元脑服务器NF5898G8,在AI算力方面具有强大的兼容性和卓越的性能,进一步加速算力融合创新。联想新一代Neptune海神液冷服务器,允许AI和HPC客户在不需要专门的数据中心空调的情况下运行100千瓦以上的服务器机架,98%的热量将转移到水循环中。信维全新推出的AI训推服务器H8650G5I提供不同的散热SKU,包括空气冷却和液体冷却解决方案。

对于服务器厂商而言,当其身量已不再局限于提供单一硬件产品时,而是提供综合性解决方案,这些解决方案可能包括服务器、存储、网络、安全等方面。未来,智算服务器将采用更高效的能源使用方式,实现绿色计算,并加强数据和模型的保护措施,以确保数据的安全性和隐私性。

算力智库

责任编辑:胡媛


返回网站首页

本文评论
台积电7nm功耗「功耗直降30% 台积电2nm工艺曝光」
中关村在线消息:近日,根据国内媒体报道的消息,近日,台积电公布了2022年Q3季度业绩,同时也透露了最新的工艺进展,其表示3nm工艺的需求已经超过了预期,明年会满载量产,而2nm工艺也进度...
日期:10-21
深圳市移卡科技等30家上市公司入选恒生中国元宇宙指数_移卡科技股票市值
近日,恒生指数公司推出恒生中国元宇宙指数,该指数选股范畴包括于沪深港上市的股票,行业包括电子零件、消费电子产品、广播、影视娱乐、资讯科技业等,主题包括增强现实和虚拟现实...
日期:08-01
LV老板超马斯克重夺全球首富 净资产达2076亿美元_lv老板世界首富被超过了
1月28日 消息:近日,福布斯排行榜的最新数据显示,世界最大的奢侈品公司LVMH董事长兼CEO阿尔诺再次超越特斯拉CEO埃隆·马斯克,成为全球首富。这一消息引发了广泛关注,也再次展现...
日期:01-28
苹果10月将推重新设计的Mac Mini和iPad Mini_苹果10月份
9月9日 消息:据彭博社报道,苹果公司计划在10月份举行另一场发布会,推出搭载M4芯片的Mac系列和新款iPad,这意味着即将到来的iPhone16发布会并非苹果今年的收官之作。古尔曼透露,...
日期:09-09
百亿补贴秒杀「百亿补贴“买贵双倍赔”、“9块9包邮” 刘强东“低价”摆擂618」
(原标题:百亿补贴“买贵双倍赔”、“9块9包邮” 刘强东“低价”摆擂618) 每经记者 王郁彪 每经编辑 刘雪梅“不惧比价,欢迎来找...
日期:05-22
联想 14.5 英寸超大屏平板 Tab Extreme 发布
IT之家 1 月 6 日消息,联想在 CES 2023 上带来了一款重磅安卓平板电脑 —— 联想Tab Extreme,搭载联发科天玑 9000 旗舰处理器,配备14.5 英寸超大屏。epic送装机模拟器联想 Tab...
日期:01-06
全国高温榜前十门槛40.4℃ 北方热化了!网友:想去南方避暑_北方多地高温
近日,全国多地遭遇极端高温。据统计,今天(20日)全国高温榜前十门槛为40.4℃,其中天津大港以41.3℃位居第一(10-15时)。从榜单来看,全国高温榜前十的观测站,有两个来自天津,四个来自河...
日期:06-24
调查显示超过 80% 的员工不相信人工智能可以取代他们
5月19日消息:有一天人工智能(AI)会让你的工作变得不再需要吗?日前一项由 ID Crypt Global 进行的近 1200 名英国办公室工人的调查发现,81% 的受访者不相信会出现这种情况。调查...
日期:05-19
消息称亚马逊计划裁员1.7万人,比原方案多7千「亚马逊销售计划被降级」
1月5日消息,据知情人士透露,亚马逊计划裁员1.7万人,这个数字高于该公司最初裁员计划7000多人,也将是大型科技公司裁员浪潮中迄今披露的最大规模裁员。早在2022年11月,亚马逊就曾...
日期:01-05
荣耀_荣耀magic5
(原标题:荣耀|攻防演练「双NO.1」云科安信幕后神器大揭晓) 模拟真实攻击和防御情境的攻防演练,正在成为评估或组织信息安全防御...
日期:08-21
Twitter将上线离谱新规:非会员甚至无法参与投票_twitter会员能干嘛
去年,马斯克在收购Twitter后,推出了Twitter Blue订阅服务作为平台新的盈利方向。今天,马斯克在自己的账号上发布内容,称从4月15日起,只有经过认证的账号的内容才有资格出现在为您...
日期:03-28
多地发生地震,地球进入“震动模式”了吗?_地震发生在地球的
据媒体公开报道,新年第一天,日本本州西岸近海发生7.6级地震,随后又发生数百次低级别地震。同日,我国四川绵阳也发生了2.9级地震;1月2日,美国纽约罕见发生1.7级地震;1月4日,我国广西...
日期:01-10
卢伟冰宣布小米全球首发!高通第三代骁龙8s移动平台发布_骁龙8系列小米手机
快科技3月18日消息,高通宣布推出第三代骁龙8s移动平台,为更多Android旗舰智能手机带来骁龙8系平台上最广受欢迎的特性,实现非凡的顶级移动体验。在发布会上,小米集团卢伟冰宣布,...
日期:03-18
扎克伯格、比尔盖茨等四位富豪因 AI 暴赚 1 万亿元_比尔盖茨与扎克伯格
6月21日 消息:根据彭博统计的数据显示,2023年彭博富豪榜TOP10大部分来自于科技领域。由于AI技术的不断发展,美股在2023年年内出现了一波反弹,这使得科技领域的富豪们的总财富合...
日期:06-21
iQOO Neo7 SE首曝:天玑8200加持_iqoo 天玑1200
上个月,iQOO推出了iQOO Neo7,该机搭载联发科天玑9000+旗舰处理器,是同价位唯一一款天玑9000+直屏旗舰。这款新品开售1分钟销售额突破2亿元,成为双11的爆款机型。按照iQOO的产品...
日期:11-07
快手打击违规健康科普内容 共处置相关视频超26万个_快手发视频危险行为
10 月 9 日消息,日前,快手发布关于打击违规健康科普内容的处罚公告(第八期),公告称为营造积极、健康、正能量的社区环境,向用户传递科学严谨、真实可信的健康科普内容,快手平台持续...
日期:10-09
转转检测报告可靠吗「被指开阴阳检测报告 转转:立正挨打 开通7天无理由退货服务」
11月29日 消息:11月28日,网红猴大腕发布视频称在转转二手手机店购买的手机被出具阴阳检测报告。根据视频记录,猴大腕先在一家转转店花费3112元购买了一部手机,然后在另一家转转...
日期:11-29
沃尔沃汽车2022年中国大陆总销量16.2万辆,纯电车型同比上涨201%_宝沃汽车2020年全年销量
1月5日,沃尔沃汽车召开2022年度业绩沟通会。据统计,沃尔沃汽车2022年12月中国大陆销量为16,900辆,同比增长15.6%;全年总销量达16.2万辆,全年销量同比上涨201%。其中,沃尔沃XC60全...
日期:01-05
17年的玩具我24年开了眼界 网友:通电那一刻发现自己就是土鳖
近日,抖音用户@程方文在旧货市场意外发现了一个七年前生产的闪电麦昆玩具车,并以888元的实惠价格将其购得。最初,许多网友对于这个价格表示怀疑,认为尽管玩具车外观精致,但888元...
日期:10-09
Meta AI意外成功,助小扎爬出元宇宙大坑!却被曝对FAIR毫不知情
新智元报道编辑:润 alan【新智元导读】2021年劈柴恭喜小扎FAIR在取得的突破时,小扎并不知道到底发生了什么,但快速的学习能力让他重新把Meta从泥潭中拉了出来。无心插柳的FAIR...
日期:01-20