您的位置:首页 > 互联网

老黄H100再破纪录,4分钟训完GPT-3!全新特供版H20、L20和L2曝光,性能史诗级缩水

发布时间:2023-11-11 03:48:26  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

H100再次在MLPerf中刷新了记录!

英伟达超算NVIDIA Eos在GPT-3模型的基准测试中,只用了3.9分钟就完成了训练。

这比6月份的刷新记录的成绩——10.9分钟,提升了近3倍。

Eos使用了多达10,752个H100和NVIDIA Quantum-2InfiniBand网络互连。

通过推算,Eos现在可以在短短8天内进行训练,比之前使用512个A100GPU的先进系统快73倍。

在本轮新的生成式AI测试中,1,024个NVIDIA Hopper架构GPU在2.5分钟内完成了基于Stable Diffusion文本到图像模型的训练基准测试,为这一新工作负载设定了高标准。

与此同时,外媒曝光了英伟达为应对新规而打造的全新特供版芯片——H20、L20和L2。

系统扩展效率飙升93%

最新的结果部分是由于使用了有史以来应用于MLPerf基准测试的最多加速器。

10,752个H100GPU远远超过了6月份AI训练的规模,当时英伟达使用了3,584个Hopper GPU。

GPU数量扩展3倍,性能扩展了2.8倍,效率达到93%,这在一定程度上要归功于软件优化。

高效扩展是生成式AI的关键要求,因为LLM每年都在以一个数量级的速度增长。

最新结果显示,即使是世界上最大的数据中心,英伟达也有能力应对这一前所未有的挑战。

这一成就归功于加速器、系统和软件创新的全栈平台,Eos和Microsoft Azure在最近一轮测试中都使用了该平台。

索尼原装内存卡

iphone折叠款手机苹果专利证实

Eos和Azure在各自的提交中都采用了10,752个H100。它们的表现相差不到2%,展示了英伟达AI在数据中心和公有云部署中的高效性。

英伟达依靠Eos完成了各种关键任务。

它有助于推进NVIDIA DLSS和ChipNeMo等计划,后者是帮助设计下一代GPU的生成式AI工具。

天猫618发布会

9项基准测试,刷新记录

除了在生成式AI方面取得进步,英伟达在这一轮测试中还刷新了几项新的记录。

比如,在训练推荐系统模型的测试中,H100GPU比上一轮快了1.6倍。在计算机视觉模型RetinaNet的测试中,性能提高了1.8倍。

这些性能提升来源于软件和硬件规模扩充的优化结合。

英伟达再次成为唯一一家完成了所有MLPerf测试的公司。H100在9项基准测试中展示了最快的性能和最大的扩展性。

这些加速为用户训练大模型或用NeMo等框架自定义模型以满足业务需求,带来了更快上市时间、更低成本和节省能源。

这一轮测试中,包括华硕、戴尔技术、富士通、技嘉、联想、QCT和超微等11家系统制造商在提交结果中使用了NVIDIA AI平台。

特供版H20、L20和L2性能曝光

在过去几年中,美国对高性能硬件出口实施了非常严格的限制。

尤其是在2023年11月生效的新规,更是要求所有达到一定总处理性能和/或性能密度的硬件都必须获得出口许可。

据最新泄露的文件和四位熟悉内情的人士透露,为了遵守美国的出口管制,英伟达已经推出了三款全新的中国定制版芯片——HGX H20、L20PCle 和 L2PCle GPU。

其中,HGX H20配有高达96GB的HBM3显存,以及4TB/s的带宽,并且基于全新的Hopper架构。

与H100的50MB二级缓存相比,H20还拥有更大的60MB二级缓存。

然而在性能方面,HGX H20只能提供FP64精度1TFLOPS(H100为34TFLOPS)和FP16/BF16精度148TFLOPS(H100为1,979TFLOPS)的算力。

由此,功耗也从700W降到了400W。

有趣的是,基于安培架构并配备24GB HBM2的入门级A30GPU,在FP64和FP16/BF16精度下,都要比HGX H20快不少。

至于L20和L2PCIe GPU,则是基于阉割后的AD102和AD104核心,对应的是与L40和L40S相同的市场。

更直观地,RTX4090采用的便是AD102的变体,而4070和4070Ti则是基于AD104的变体。

除此之外,为了遵守新规,HGX H20、L20PCle和L2PCle GPU不仅性能是残血的,而且还只配备了残血版的NVLink连接。


返回网站首页

本文评论
meta分析的前提_Meta启动一系列调整:为创作者提供更有利、公平的环境
  为创作者提供更有利、公平的环境,meta 公司于 5 月 4 日宣布了一系列优化调整。在算法优化方面将优先考虑原创内容,并为创作者提供更直观、全面的洞察力工具以及更多变...
日期:07-18
充电宝能修么「男子向大熊猫“园润”泼水情节恶劣:终身禁止入园」
5月30日消息,成都大熊猫繁育研究基地官方发布了关于不文明行为情况的通报”。通报称:2023年5月29日,吕某某(男,30岁)在成都大熊猫繁育研究基地(以下简称:熊猫基地)参观时,向大熊猫1号...
日期:05-31
快手修订违背承诺实施细则 发货违规罚款5000元_快手逾期发货罚款么?
9月28日 消息:9月27日,快手发布《【违背承诺】实施细则(商户)》修订公告,对发货违规”、“消极处理售后”、“商责纠纷违规”进行调整。本细则于2022年9月27日修订,2022年10月5日...
日期:10-01
布雷博发起第二届骇客马拉松
·布雷博组织的第二届骇客马拉松活动开始报名·活动在传统创新流程之外寻找全新解决方案,契合布雷博的愿景:“将能量转化为灵感”布雷博作为全球汽车制动技术的领导 者和创新...
日期:10-12
抖音新增《【供应链管理平台】国内供应商入驻规则》「抖音货源供应链」
10月8日 消息:10月6日,抖音发布关于新增《【供应链管理平台】国内供应商入驻规则》的意见征集通知,意见征集期为2022年10月6日—2022年10月13日。目前,供销平台仅向食品、生鲜...
日期:10-24
淄博烧烤怎么火的「进淄赶“烤”!淄博郊区的烧烤店都被游客占领了」
4月30日消息,据看看新闻报道,由于淄博市区的烧烤店过于火爆,很多游客希望去淄博郊区相对偏僻的烧烤店体验一把淄博烧烤。但是没想到的是,游客们再一次感受到了淄博烧烤的火爆。...
日期:04-30
五一长假已开启 网友对调休不满 专家称调休式放假更包容更弹性
4月28日下班之后,国内的五一假期正式开启了,这次有5天时间,4月29日(星期六)至5月3日(星期三)放假调休,但是节前节后各有一个周末要调休。调休式放假最近也引发热议,此前中国新闻周刊...
日期:04-29
二次机会:魅族5款手机又能免费换电池了!「魅族官方换电池活动」
不少厂商经常提供给手机低价换电池的福利活动,但免费换电池,还给二次机会的,魅族应该是第一家。在此之前,魅族已经三个批次,为不少旗下手机提供了免费换电池活动。小米watch最新...
日期:10-04
小米Civi 2续航公布:4500mAh电池支持67W快充_小米civi多长时间充满电
下午14:00,小米在发布会中发布了全新的小米Civi 2手机,新机主打轻薄,机身只有7.23mm的厚度,重量仅有171.8g,厚度也仅有7.23mm,与现在动不动就飚到200g以上的手机相比,称得上轻薄,而...
日期:10-01
m3u8视频转成mp4失败怎么办?m3u8网页视频怎么打开?「缓存视频m3u8转换mp4手机视频不能播放」
由于m3u8格式文件很小,因此网上逐渐开始出现这个格式的视频。由于m3u8格式的文件只是存储多媒体播放列表,因此打开它时播放软件并不是播放它,而是根据它的索引找到对应的音视频...
日期:11-27
三星s21代号「安卓新机皇将至!消息称三星Galaxy S24系列手机代号“Muse”」
据国外科技媒体SamMobile报道,三星计划在明年年初推出Galaxy S24系列手机,该系列的内部代号被称为“Muse”。“Muse”一词源自希腊语,代表缪斯女神,具有思考、思索等含义,并引申...
日期:06-25
强强联手 国产龙芯支持鸿蒙开源系统「鸿蒙系统龙头股」
中关村在线消息:龙芯中科宣布,在龙芯中科与润和软件共同努力下,OpenHarmony操作系统与龙芯2K0500开发板完成适配验证,龙架构平台对于OpenHarmony已形成初步支持。下一部将龙芯与...
日期:10-20
华为何刚确认:MatePad Pro 13.2首发“星闪”技术 遥遥领先蓝牙!
快科技9月19日消息,华为官方今天上午官宣,MatePad Pro13.2平板将于9月25日发布。海报上的NearLink星闪logo引起了大家的注意,纷纷猜测该机或首发星闪连接技术。明星代言的电商...
日期:09-19
以太坊市值即将超越比特币「以太币市值将挑战比特币 市场份额已上升至20.5%」
9月14日 消息:加密货币市场要变天?据报道,以太坊正在推进一项非常重要的“合并”软件升级。如果开发者未来几天内完成升级,以太坊区块链的能源消耗将大幅降低。报道称,合并后,以...
日期:09-18
华为Mate X5换屏只要599!华为Care 服务上新:一年期999元
快科技9月18日消息,上周华为Mate X5折叠屏旗舰已经正式全面开售,起售价12999元。天猫国际双11有活动吗同时官方还公布了维修价格,华为Mate X5内屏为5199元、外屏999元、主板449...
日期:09-18
苹果与诺基亚续约 继续使用5500多项5G专利「苹果与诺基亚续约 继续使用5500多项5g专利可以吗」
7月1日 消息:诺基亚和苹果公司今天发布联合声明,宣布双方续签了一项长期专利许可协议。奥迪车型销量根据这项协议,苹果将继续使用诺基亚在5G和其他技术方面的专利发明。此前的...
日期:07-01
真我gtneo百科「真我GT Neo新品曝光 将对标Redmi K60 Ultra」
Redmi即将发布K60 Ultra,该机搭载联发科天玑9200 旗舰平台。而与此同时真我也将在下半年推出新品真我GT Neo5 Pro,该机搭载高通骁龙8 Gen2移动平台。真我GT Neo5 Pro使用的骁...
日期:06-24
哈啰出行更换新 Logo_哈啰出行车主换车
  哈啰出行官宣更换新 Logo,从之前的 H 样式图案更换为了“哈啰”圆角矩形图标,看起来更加像 App 图标了。   官网显示,哈啰是国内专业的本地出行及生活服务平台,致力于应...
日期:11-23
谷歌正在以训练人工智能聊天机器人的方式训练机器人「谷歌智能机器人对话」
7月29日 消息:据theverge报道,谷歌希望通过发布人工智能学习模型 Robotic Transformer (RT-2)来使其机器人变得更加智能。RT-2是该公司所谓的视觉-语言-动作 (VLA) 模型的新版本...
日期:07-29
电脑故障诊断卡_电脑故障诊断卡IRDy不亮
是一种工具,可以用于帮助用户诊断电脑故障。本文将介绍的定义、用途、种类、优缺点以及如何使用。一、定义是一种电子工具,用于帮助用户快速诊断电脑故障。它可以将电脑故障显...
日期:05-29