您的位置:首页 > 互联网

释放AI基础设施新动能:联想陈振宽诠释为客户提供纵横智能化时代的“万全”之策

发布时间:2024-04-19 02:30:52  来源:互联网     背景:

释放AI基础设施新动能:联想陈振宽诠释为客户提供纵横智能化时代的“万全”之策 通信产业网|2024-04-18 16:38:35作者:通文来源:通信产业网

4月18日,以“AI for All,让世界充满AI”为主题的联想创新科技大会(2024 Lenovo Tech World)在上海举办。

联想集团副总裁、联想中国基础设施业务群总经理陈振宽以《异构智算 释放AI基础设施新动能》为主题进行了演讲,分享联想在AI基础设施领域的战略布局、核心能力与技术创新成果。

“在人工智能1.0时代,基于全球智慧和本地创新,联想打造了全面的基础设施产品组合,包括计算、存储、网络、边缘和超融合,并在通用计算、科学计算和AI计算等不同算力领域获得大量的最佳实践,帮助千行百业的客户取得成功。”陈振宽表示,如今大模型开启的AI 2.0时代已经迈着大步朝我们走来,我们需要重塑过去积累的技术,来升级联想基础设施。

(联想集团副总裁、联想中国基础设施业务群总经理陈振宽)

为解决用户面临的挑战,联想AI基础设施将聚焦三大领域实现科技创新,即超强算力、核心算法和液冷创新,释放AI基础设施新动能。他介绍说,基于三大领域,联想已经积累了八项核心能力,包括高性能、高可靠性以及液冷技术等。他重点分享了针对AI2.0时代的五大创新技术,包括:算力匹配魔方、GPU内核态虚拟化、联想集合通信算法库、AI高效断点续训技术、AI与HPC集群超级调度器。

此外,陈振宽在大会上正式发布了联想万全异构智算平台。“联想万全异构智算平台是AI2.0时代联想中国基础设施战略框架的核心。”他说,作为联想“全栈AI”战略布局的中坚力量,联想中国基础设施业务正以“一横五纵”战略框架,通过构建布局完整、稳定高效的AI导向的基础设施,为企业智能化转型打造坚实可靠的智算底座。

联想AI基础设施聚焦三领域,应对AI 2.0时代的算力挑战

过去40年,联想积累了包括全球供应能力、全球研发能力以及全球生态能力的全球智慧,并引领了一个又一个的中国IT技术发展浪潮。在通用计算领域,联想的x86服务器可靠性连续9年第一,截至2023年底已斩获536项性能世界纪录;在科学计算领域,联想9次实现中国HPC TOP 100 NO.1,助力中国在科学计算、仿真、气象等前沿领域的创新突破;联想基于中国特色需求设计了完整AI基础设施组合,助力中国客户赢得AI 1.0时代的发展。

在AI 2.0时代,AI大模型具备超强的泛化、生成能力,促使人工智能进入更广的应用场景和更深的业务流程中。陈振宽提到,在制造、金融、医疗、交通、能源、政府等各行业中,大模型在产品设计、金融评估、办公辅助、自动驾驶、能源调配等方方面面,颠覆式地改变生产方式,极速促进生产效率。然而,陈振宽也认为,随着AI 2.0时代对于AI算力的需求快速增加,算力使用者在使用AI基础设施的时候正在面临巨大的挑战。

极米rs pro hdr

陈振宽进一步介绍了AI 2.0时代用户在AI基础设施领域面临四大挑战:

如何选择和匹配算力是第一大挑战。陈振宽指出,目前已经有五种以上主流算法框架和十种以上算子库来支持不同的应用场景。同时,不同类型的GPU、服务器、存储和网络组成了上百种不同的集群配置。场景、算法和集群之间的选择和验证,不但技术繁杂而且周期长。

其次是如何减少故障中断时间。陈振宽强调,目前千卡集群每月至少有15次的故障断点。在常规的断点续训手段下,每次恢复训练需要几个小时,产生的额外费用超过百万元。随着AI集群规模从千卡到万卡,故障中断次数及恢复所需时间呈指数级增长。

第三大挑战是如何改善AI算力利用率。陈振宽引用行业通用的指标MFU(模型算力利用率)来作阐述,他指出当前业内MFU普遍在30%左右,顶尖的集群利用率也只能做到50%。行业需要解决GPU卡利用率,集群通讯效率,AI故障恢复,算法匹配度等系统性问题。

第四大挑战是如何突破散热瓶颈,降低数据中心PUE。陈振宽指出,在算力升级带来的能耗飙升的情况下,如何通过先进的散热技术,突破芯片在系统中的散热瓶颈,同时提升能效,降低数据中心PUE。

为解决上述用户面临的挑战,陈振宽强调,联想AI基础设施持续聚焦三大领域,实现科技创新。首先是超强算力,智能匹配:为用户匹配经过验证优化的最佳算力;其次是核心算法,极致提效:以核心算法挖掘算力潜力,提升计算效率。第三,液冷创新,算力绿化:以先进的液冷技术帮助用户节能增效,并突破芯片散热的瓶颈。

公布五大技术创新,首发万全异构智算平台

“联想在这三大领域里面长期耕耘,积累了八项核心能力。”陈振宽重点介绍了联想为AI 2.0时代带来的五大技术创新:

第一,用户智能匹配算力的算力匹配魔方。基于海量的硬件评测和AI算子算法集成工作,联想构建了AI场景与算法与集群硬件三者匹配关系的算力魔方知识库,来标识AI场景、算法、集群配置这三者的匹配关系。用户只需输入场景和数据,算力魔方即可自动加载最优算法,并调度最佳集群配置。

第二,逼近GPU算力极限的GPU内核态虚拟化。联想研究院开发了在GPU驱动层的内核态虚拟化算法,新算法可以将虚拟化造成的GPU算力损耗降到5%以下,极致情况可以降到1%以下,大幅提升GPU利用率。

第三,提升网络通信效率的联想集合通信算法库。可实现对多类型网络拓扑的实时感知,并以先进算法使数据在拓扑中以最佳路径进行传输。以千卡规模集群为例,采用集成了联想集合通信库的联想异构智算平台做管理调度,可使网络通信效率提升超10%,并且集群规模越大,效果越显著。

第四,减少AI训练中断时间的AI高效断点续训技术。联想异构智算平台对大量的AI训练故障进行了特征采样,开发了预测AI训练故障的AI模型,实现“用AI来预测AI”。在断点前提前优化备份,由此能将断点续训恢复时间缩减到分钟级,大幅提升了训练效率,以千卡集群为例,每月可节约上百万元算力费用支出,让宝贵的AI算力持续可用。

第五,AI与HPC集群超级调度器。这是针对混合集群做资源共享的前沿技术。联想AI与HPC超级调度器架构于AI和HPC调度之上,能够切换AI和HPC的调度沟通,能全局监控任务和动态共享资源,使得用户可以充分利用基础设施的每一分算力。

除了公布以上五大技术创新,陈振宽还在大会上正式发布了“联想万全异构智算平台”。他表示,联想万全异构智算平台是AI 2.0时代联想中国基础设施战略框架的核心,它融合了联想的五大技术创新,是AI2.0时代大模型训练和推理的基础设施底座。

对于未来的研究方向,陈振宽透露,联想将挑战超过万卡规模集群的通讯算法优化,挑战秒级的断点续训,深入研究相变式液冷技术,布局模块化液冷数据中心。这些技术帮助AI算力朝着更强大、更稳定、更高效和更绿色的方向,高质量发展。

“人工智能技术给我们带来的新时代是百花齐放,百舸争流的时代,也将是英雄辈出的时代。”陈振宽表示,联想将持续投入,坚持创新,持续升级万全之力,为英雄助力,成就英雄。加速中国智能化转型,释放社会进步新动能。

奔驰车的广告

责任编辑:党博文

618天猫销量


返回网站首页

本文评论
微软将使用Intel 18A工艺设计芯片 英特尔芯片代工业务拿下微软订单
【】2月22日消息,微软董事长兼首席执行官Satya Nadella在Intel Foundry Direct Connect大会发言中宣布,微软计划采用Intel 18A制程节点生产其设计的一款芯片。微软董事长兼首...
日期:02-22
opgg爬虫「OpenAI推出网络爬虫机器人GPTBot:收集数据改进AI模型」
快科技8月8日消息,OpenAI推出了一种名为GPTBot的网络爬虫机器人,用于收集信息数据以改进未来的AI模型。腾讯音乐分拆上市过程据了解,GPTBot将严格遵守任何付费墙的规则,不会抓取...
日期:08-08
豆瓣7.8分!贾玲新片《热辣滚烫》网播定档4月19日_热辣辣 原唱
快科技4月10日消息,腾讯视频、爱奇艺等平台纷纷宣布,贾玲新片《热辣滚烫》网播定档4月19日。届时,无需进电影院大家就能观看这部超励志的贾玲新作了。不过从各平台云影院”、云...
日期:04-10
乘客因定位偏差拒下车 反正我有水:司机硬扛就是不送 网友吵翻
近日,浙江杭州一乘客使用一口价方式约车,因打车时使用的定位点和实际目的地有偏差,乘客拒绝下车。iphone14promax美版改双卡对于这样的行为,司机则表示一口价定位点就到这里,都是...
日期:05-22
波及员工万余名 消息称特斯拉将全球裁员10%_特斯拉剥削员工
【】4月15日消息,今天下午,微博博主@朱玉龙-YL曝光了一则特斯拉CEO马斯克的内部邮件,其中提到,特斯拉将在全球范围内裁员10%以上。百度技术官王海峰特斯拉此前提交给美国证券交...
日期:04-15
2021京东数码节「成交额超去年11.11同期全程 京东数码11.11超级战报出炉」
来源:中关村在线10月31日晚8点,京东百亿补贴日火爆开启。自10月23日晚8点现货开卖以来,随着海量低价好物、趋势新品持续释放,京东11.11迎来多轮爆发。京东数码11.11超级战报显示...
日期:11-01
ios15音量键失灵「苹果iPhone 15 Pro设计再曝光:采用音量双按键设计、无固态按键」
4月15日消息,此前有消息爆料称,iPhone 15 Pro将会有重大的设计改变,取消物理按键,采用固态按键。但现在又知情人士表示,苹果又修改了这一设计,采用音量双按键设计,无固态按键。消息...
日期:04-14
华为Mate60系列好评率99% 用户满意度很高「华为mate40好评率」
近日,华为Mate60和Mate60 Pro两款手机在没有任何预兆的情况下突然发售,引起了业界的广泛关注。这两款手机的首批用户评价已经出炉,好评率高达99%。据华为商城数据显示,Mate60 Pr...
日期:09-14
京东中断支付宝合作 或为防止淘宝研究其数据
晨报讯在京东商城的在线支付网页上,支付宝标志已经消失了,让人不由产生双方终止合作的怀疑。昨天,记者在京东商城的在线支付方式中发现,一向占据大头的支付宝已从这个页面消失,...
日期:07-28
Meta 向员工演示为 Whatsapp 和 Messenger 开发的生成式 AI 聊天机器人
6月9日消息:Facebook 所有者 Meta 于周四向员工提供了一系列正在开发的人工智能工具的初步展示,其中包括计划在 Messenger 和 WhatsApp 上使用类似 ChatGPT 的聊天机器人,这些...
日期:06-09
索尼指责微软误导消费者:《使命召唤》只能在PS上保留3年
iphone12 pro max国行售价  讯 北京时间9月9日早间消息,据报道,索尼指控微软在关于《使命召唤》可以继续支持PlayStation游戏机的问题上对游戏行业和监管者形成误导。  在...
日期:09-10
传音 Tecno Phantom V2 Fold 折叠屏手机跑分曝光
IT之家 1 月 19 日消息,传音旗下品牌 Tecno 于 2023 年推出 Phantom V Fold,从而正式进军可折叠手机市场。现在,该机的继任者已经现身 GeekBench 跑分库,型号为 AE10。特斯拉上...
日期:01-20
金山毒霸:DOS病毒复活 穿越者轻松突破主流杀毒软件_金山毒霸自带病毒
  目前,主流计算机均使用64位CPU,操作系统逐步从32位升级到64位,新出厂的PC中大多安装了64位Windows 7 。当人们认为16位程序(多是DOS程序)将消失时,病毒打破了平静。10月25...
日期:07-24
小米屏幕反转「小米新机曝光:屏幕可向后翻折」
小米一项折叠屏手机外观专利获授权,折叠屏手机又有了新的模式。新款折叠屏手机的上半部分可以向后翻折,折叠后前置摄像头可转换为后置摄像头。iphone14 pro的电池是多大此次小...
日期:04-08
iPad2和iPhone将为苹果明年带来丰收_ipad2什么时候上市
  业内分析师称,仅仅iPad和iPhone就能给苹果带来一个丰收的2011年。   发售当天,iPad销量就达到30万台,上一季度销量达到420 万台,并给苹果带来了大量新用户;凭借FaceTime视...
日期:07-25
苹果15pro价格表官网报价「iPhone 15 Pro订单量暴增 苹果对Pro版信心足」
据了解,苹果预计将在今年9月如期发布新的iPhone 15系列,该产品现已在富士康等工厂生产中。据显示器供应链咨询公司的最新研究报告显示,iPhone 15系列的面板订单中,Pro型号占比达...
日期:06-29
AI机器人上岗粘假睫毛 收费90美元 节省1/3的时间「假机器人视频」
6月15日 消息:据《华盛顿邮报》6月10日报道,一些美容美发公司开始使用计算机视觉机器人为顾客粘贴假睫毛。美国加州奥克兰的美容工作室LUUM提供使用 AI 计算机视觉技术训练机...
日期:06-15
还不知道价格 三星S23 Ultra用户就预订了一加Ace 2 Pro
快科技8月15日消息,三星Galaxy S23 Ultra用户在酷安晒出了一加Ace 2 Pro订单,还不知道价格,这位用户就提前锁定了一台。据悉,一加Ace 2 Pro将于8月16日正式发布,该机搭载高通骁龙...
日期:08-15
节能电动自行车 台铃超能系列「华为入局电动自行车 台铃官宣:强强联合开启新时代」
2月7日消息,台铃电动车官宣称:2023一汽跑更远台铃集团品牌发布会将于2月9日上午9:00正式开幕,此次发布会上,台铃集团将迎来一位重磅伙伴,而它正是华为。在预热海报上出现了台铃*华...
日期:02-08
特斯拉发布会 机器人「特斯拉2022年AI日活动开启:人形机器人擎天柱亮相 预计每台2万美元」
10月1日,特斯拉2022 AI Day于加州帕罗奥图举行,特斯拉CEO埃隆马斯克出席,他表示将带来擎天柱”人形机器人、特斯拉FSD以及Dojo超级计算机的相关进展。会议刚开始,人形机器人擎天...
日期:10-05