通信世界网消息(CWW)谋全局而不是谋一域,对于智算产业发展而言尤为重要。
“当前,大模型发展不断深化,其在细分行业落地过程中,面临的算效、适配、应用等问题也日益复杂,愈发需要系统性AI计算方案提供全方位、全周期支持。”宁畅总裁秦晓宁指出。3月29日,宁畅发布“全局智算”战略,并揭幕了包括“AI算力栈”在内的一系列战略性新品与系统解决方案,以期有效解决大模型产业落地的全周期问题。
秦晓宁指出,对于宁畅而言,除了做好基础架构和设施以及定制化产品之外,更多的是要搭上AI的大车,思考未来的AI底层架构是什么样的,底层应该怎么满足要求,全液冷、全配套的产业链的硬件是基础,除此之外还要思考如何与产业更好地结合,提升算力效率,从而更好地节约成本提高效率。在现有有限的硬件资源的算力情况下如果想支撑业务发展,无论是大模型还是微调的需求,宁畅都可以给出一套综合的解决方案。无论是在软件、硬件还是应用层面,都进行了广泛的测试。
宁畅具有液冷基础,在发力全局智算方面更有优势。自2019年底至今,宁畅在IDC服务器销售额方面排名前四,AI服务器销售额位居第二,液冷服务器在IDC报告中排名第一,在2020年4月公司开始开发X660服务器,当时中国市场对AI服务器的需求并不旺盛,但公司坚定地投入到这一领域。到了2023年,公司终于享受到AI服务器市场的红利,销量显著增长。
【58同城】地板打蜡
“有些客户仍在犹豫,考虑进行更多测试。他们能够使用的测试设备仅限于几台服务器,并非大型集群节点。我们现在可以提供实际的测试,并且是免费的。我们自己已经测试了大量数据,这些数据也可以作为客户的参考。”秦晓宁讲道。
宁畅的目标是在大模型发展的当前阶段,为行业和客户提供全面的解决方案和具体的推荐。这也是宁畅多年来一直坚持的原则。宁畅率先提出这些技术,引领行业发展,并在未来一年、两年、甚至三年后验证当时的判断是否正确。
努比亚z50系列价格
液冷技术也是这几年数据中心领域比较关注的。随着人工智能应用的增加,数据中心向高密化发展,传统的风冷散热方式已无法满足高性能计算集群的散热需求。液冷系统可以有效降低PUE值,适配高密度、高算力的智算场景。
宁畅CTO赵雷先生在宏观层面分析了液冷技术在数据中心的应用情况。但是当前液冷的渗透率大约为5%至8%,还不是特别理想,主要原因有两个。
一是目前芯片的功耗尚未达到必须依赖液冷技术才能解决的水平。例如,现有服务器的GPU风冷系统支持的最高功耗为700瓦,即使功耗增加至700至800瓦,目前的技术仍能应对。然而,预计在未来一到两年内,单GPU的功耗将超过1000瓦,届时不使用液冷技术将无法有效散热。因此,赵雷先生预计到2026年,液冷技术的渗透率可能会增加至30%,届时所有新量产的GPU系统的单机功耗都将达到20千瓦,单卡功耗超过1000瓦。
二是国家和各省市近两年才开始实施IDC建设政策和东数西算政策,出台了1.3、1.25、1.2等PUE标准,主要针对新建数据中心。新建数据中心的落地始于去年,例如桐乡的系统就配备了45千瓦的机柜,但仅能安装四个,因此电力成为了一个问题。只有新建的机房才能采用液冷技术,因此从现在开始,液冷技术的市场占有率有望快速上升。
在计算栈作为解决方案的讨论中,赵雷先生表示全液冷布局是未来的发展趋势。尽管当前全液冷产品的成本较高,但从总体拥有成本(TCO)的角度来看,这是合理的选择。随着功耗的不断增加,一些客户已经选择全液冷方案,甚至不再安装机房空调。他认为,至少在未来五年内,风液混合冷却将是一种成本效益较高的主流方式,但追求极致PUE的客户可能会选择全液冷方案。