您的位置:首页 > 智能设备

老黄手捧ChatGPT专用「核弹」炸场,英伟达H100至尊版速度提10倍!「英伟达H100最新消息」

发布时间:2023-03-24 10:00:09  来源:互联网     背景:


新智元报道

编辑:编辑部

【新智元导读】GTC大会上,老黄石破天惊地祭出了专为ChatGPT打造的H100 NVLINK,并放出豪言,称英伟达就是行业内的台积电。

英伟达,赢麻了!

刚刚结束的GTC大会上,靠着满屏的「生成式AI」,手握一块支撑ChatGPT算力、提速10倍的H100 NVLINK芯片,老黄就差把这几个字写在脸上——「我是赢家」。


ChatGPT,Microsoft 365, Azure,Stable Diffusion,DALL-E,Midjourney……所有这些时下最红最爆的AI产品,英伟达全都能从中分得一杯羹。

今年初ChatGPT在全球的爆火,让英伟达股价飙升,市值直接增加700多亿美元。目前,英伟达市值为6400亿美元。


而如今,AI的iPhone时刻已经到来,第四次科技革命就要开启,而手握A100和H100的英伟达,或成最大赢家。

在GTC大会上,老黄宣布了英伟达在GPU、加速库、计算光刻、云平台上的亮眼进步,更是放出豪言——英伟达就是要做AI圈的台积电!

现在已经有人猜测,今天的演讲都是在H100上用AIGC模型生成的。

ChatGPT专用GPU已来

这次大会上最重磅的发布,就是针对ChatGPT打造的NVIDIA H100 NVLINK。

因为算力需求巨大,针对ChatGPT等LLM的推理,英伟达推出了新款Hopper GPU,配备双GPU NVLINK的PCIE H100,具有94B内存。


事实上,深度学习的历史从2012年之后,就一直与英伟达息息相关。

老黄表示,2012年深度学习元老Hinton和学生Alex Kerchevsky、Ilya Suskever在训练AlexNet时,用的正是GeForce GTX 580。

随后,AlexNet一举夺得ImageNet图像分类竞赛冠军,成为了深度学习大爆炸的奇点。

而时隔10年,在OpenAI的Ilya Suskever也是用着英伟达的DGX,训练出了ChatGPT背后的GPT3,及GPT3.5。


老黄自豪地说,目前在云上唯一可以实际处理ChatGPT的GPU,就是HGX A100。

但与A100相比,一台搭载四对H100和双GPU NVLINK的服务器速度还要快上10倍!因为H100可以将LLM的处理成本降低一个数量级。

随着生成式AI掀起一波机遇浪潮,AI正处于转折点,使得推理工作负载呈阶梯函数式增长。


在以前,设计一个云数据中心来处理生成式AI,是巨大的挑战。

一方面,理想情况下最好使用一种加速器,使数据中心具有弹性;但另一方面,没有一个加速器能以最优的方式处理在算法、模型、数据类型和大小方面的多样性。英伟达的One Architecture平台就兼具加速功能和弹性。

而今天,英伟达宣布,推出全新的推理平台。每种配置都对某类工作负载进行了优化。


英伟达h100用来做什么

比如针对AI视频工作负载,英伟达就推出了L4,在视频解码和转码、视频内容审核、视频通话功能上做了优化。

而一台8-GPU L4服务器,将取代一百多台用于处理AI视频的双插槽CPU服务器。

同时,英伟达还针对Omniverse、图形渲染以及文本转图像/视频等生成式AI推出了L40。其性能是英伟达最受欢迎的云推理GPU T4的10倍。

当前,Runway推出的Gen-1,以及Gen-2生成式AI模型拥有的强大能力便是借助了英伟达的GPU。


另外,英伟达还推出了全新的超级芯片Grace-Hopper,适用于推荐系统和向量数据库。


挑战芯片极限破,计算光刻提速40倍

在芯片领域,英伟达联合台积电、ASML和Synopsys,历时4年终于完成了计算光刻技术的一项重大突破——NVIDIA cuLitho计算光刻库。

在到达2nm制程的极限后,光刻就是突破点。

计算光刻模拟了光通过光学元件后与光刻胶相互作用时的行为,通过应用逆物理算法,我们可以预测掩膜板上的图案,以便在晶圆上生成最终图案。

在芯片设计和制造领域中,计算光刻是最大的计算工作负载,每年都要消耗数百亿CPU小时。相比之下,英伟达创造的这个新算法,可以让日益复杂的计算光刻工作流程能够在GPU上并行执行。

总结来说,cuLitho不仅能使计算速度提升40倍,而且功耗也可以降低9倍之多。


举个例子,英伟达的H100需要89块掩膜板。

如果用CPU进行处理的话,每个掩膜板都需要消耗两周的时间。而如果在GPU上运行cuLitho,则只需8个小时即可处理完一个掩膜板。

而台积电也可以用500个DGX H100系统中的4,000个Hopper GPU,完成之前需要多达40,000台基于CPU的服务器才能搞定的工作,并且功率也会从35MW降至5MW。


值得注意的是,cuLitho加速库与Ampere和Volta架构的GPU也是兼容的,不过Hopper是最快的解决方案。

老黄表示,由于光刻技术已经处于物理学的极限,晶圆厂能够提高产量,为2nm及以后的发展做好准备。

AI的iPhone时刻

这几个月,ChatGPT以摧枯拉朽之势,眼看就要掀起第四次科技革命。「我们正处于AI的iPhone时刻」这个说法,也随之广泛流传开。

在GTC大会上,老黄也是激动地把这句话重复了三遍。


iPhone时刻来临,初创公司如OpenAI在竞相构建颠覆性的产品和商业模式,而谷歌、微软这样的老牌公司,则在寻求着应对之法。

它们的种种举动,都是由生成式AI在全球引发的制定AI战略的紧迫感。

英伟达加速计算始于DGX AI超级计算机,这也是当前大型语言模型实现突破的背后引擎。

GTC上,老黄自豪地表示,是我亲手将全球首款DGX交给了OpenAI。


从那之后,「财富」100强企业中,其中有一半都安装了DGXAI超级计算机。

DGX配有8个H100 GPU模组,同时H100配有Transformer引擎,能够处理ChatGPT这样令人惊叹的模型。

8个H100模组通过NVLINK Switch彼此相连,实现了全面无阻塞通信。8个H100协同工作,就像是一个巨型的GPU。


让老黄倍感激动的是,微软宣布Azure将向其H100 AI超级计算机开放私人预览版。

并称,「DGX超计算机是现代AI工厂。我们正处于AI的iPhone时刻。」


一手带出ChatGPT

过去十年,加速和纵向扩展结合使各种应用实现百万倍性能提升。

令人印象最深刻的例子,便是2012年,AlexNet深度学习框架的提出。

当时,Alex Krizhevsky、Ilya Suskever,以及Hinton在GeForce GTX 580上使用了1400万张图完成了训练,可处理262千万亿次浮点运算。

十年后,Transformer面世。

Ilya Suskever训练了GPT-3来预测下一个单词,需要进行的浮点运算比训练AlexNet模型要多一百万倍。

由此,创造出了令全世界震惊的AI——ChatGPT。

用老黄的一句话总结:

这意味着崭新的计算平台已经诞生,AI的「iPhone时刻」已经到来。加速计算和AI技术已经走进现实。

加速库是加速计算的核心。这些加速库连接了各种应用,进而再连接到各行各业,形成了网络中的网络。

经过30年的开发,目前已经有数千款应用被英伟达的库加速,几乎涉及科学和工业的每个领域。

目前,所有的英伟达GPU都兼容CUDA。

现有的300个加速库和400个AI模型覆盖了量子计算、数据处理、机器学习等广泛的领域。


这次GTC大会,英伟达宣布更新了其中的100个。

英伟达Quantum平台由库和系统组成,可供研究人员推进量子编程模型、系统架构和算法。

cuQuantum是用于量子电路仿真的加速库,其中IBM、百度等公司已经将这一加速库集成到他们的仿真框架中。

Open Quantum CUDA是英伟达的混合GPU-Quantum编程模型。

英伟达还宣布推出一个量子控制链路,这是与Quantum Machines合作开发的。它可以将英伟达GPU连接到量子计算机,以极快的速度进行纠错。

还有RAFT新库推出,用于加速索引、数据加载和近邻搜索。

此外,英伟达还宣布了DGX Quantum,用DGX构建,并利用最新开源的CUDA Quantum,这个新平台为从事量子计算的研究人员提供了一个革命性的高性能和低延迟的架构。


英伟达还推出了NVIDIA Triton Management Service软件,可在整个数据中心自动扩展和编排Triton推理实例。适用于像GPT-3大语言模型的多GPU、多节点推理。

用于计算机视觉的CV-CUDA和用于视频处理的VPF是英伟达新的云规模加速库。


老黄宣布CV-CUDA Beta优化了预处理和后处理,实现了更高的云吞吐量,将成本和能耗减少了四分之一。

目前,微软处理视觉搜索、Runway为其生成式AI视频处理过程,全都采用了CV-CUDA和VRF库。


此外,英伟达加速计算还帮助基因组学实现了里程碑式发展。使用英伟达助力的仪器设备,将整个基因组测序的成本降低至100美元,成为另一个里程碑。

英伟达NVIDIA Parabrics加速库可用于云端或仪器设备内的端到端基因组分析,并且适用于各种公有云和基因组学平台。


ChatGPT在跑,英伟达在赚

现在,ChatGPT、Stable Diffusion、DALL-E和Midjourney,已经唤醒了全世界对于生成式AI的认知。

当红炸子鸡ChatGPT仅在推出2个月后,就月活破亿,已经成为史上用户增长最快的应用。


可以说,它就是一台计算机。不仅能生成文本、写诗、改写研究论文、解决数学问题、甚至还能编程。


众多突破性成果造就了今天的生成式AI。

Transformer能够以大规模并行的方式,从数据的关系和依赖性中学习上下文和含义。这使得LLMs能够利用海量数据进行学习,在没有明确训练的情况下执行下游任务。

另外,受物理学启发的扩散模型,能够通过无监督学习来生成图像。

老黄总结道,短短十几年,我们就从识别猫,跨越到了生成在月球行走的太空服猫的过程。


现在完全可以说,生成式AI就是一种新的计算机,一种可以用人类语言进行编程的计算机。


此前,命令计算机解决问题,是独属于程序员的特权,但是如今,人人都可以是程序员了。

和比尔盖茨一样,老黄也下了类似的定义:生成式AI是一种新型计算平台,与PC、互联网、移动设备和云类似。

通过Debuild,我们只要说清楚自己想要什么,就可以直接设计和部署Web应用。


很明显,生成式AI将几乎重塑所有行业。


要做AI界的「台积电」

在这样的背景下,专业公司都需要使用自己的专有数据,来构建定制模型。

接着,老黄自豪宣布,行业需要一个类似台积电的代工厂,来构建自定义的大语言模型,而英伟达,就是这个「台积电」!

大会上,英伟达宣布推出NVIDIA AI Foundations云服务,让客户可以定制LLM和生成式AI。


这个云服务包括语言、视觉和生物学模型制作服务。

其中,Nemo用于构建定制的语言文本转文本生成式模型。


而Picasso是视觉语言模型制作,可以用于训练自定义模型,包括图像、视频和3D应用。

只要向Picasso发送文本提示和元数据的API调用,Picasso就会用DGX Cloud上的模型把生成的素材发送回应用。

更厉害的地方是,把这些素材导入NVIDIA Omniverse,就可以构建逼真的元宇宙应用,和数字孪生仿真。


另外,英伟达还在和Shutterstock合作,开发Edify-3D生成式模型。

同时,英伟达和Adobe的合作也继续扩展,把生成式AI融入营销人员和创意人士的日常工作流,并且,尤其注意对于艺术家版权的保护。


第三个领域,就是生物学。

如今,药物研发行业的价值已经达到近2万亿元,研发投入高达2500亿美元。

NVIDIA Clara就是一款医疗健康应用框架,用于影像、仪器、基因组学分析和药物研发。

而最近,生物圈的热门方向是利用生成式AI发现疾病靶因、设计新分子或蛋白类药物等。


与之相应的,BIONEMO可以让用户使用专有数据创建、微调、提供自定义模型,包括AlphaFold、ESMFold、OpenFold等蛋白质预测模型。


腾讯微视官方微博

最后,老黄总结道,NVIDIA AI Foundations是一个云服务和代工厂,用于构建自定义语言模型和生成式AI。

我国可以购买英伟达h100吗

老黄云服务,月租36999美元

英伟达这次,还推出了一款云服务。

它敏锐地看到客户需要更简单快捷访问NVIDIA AI的需求,因而推出了NVIDIA DGX Cloud。


DGX Cloud与Microsoft Azure、Google GCP和Oracle OCI都有合作。只要一个浏览器,NVIDIA DGX AI超级计算机,就能即时接入每家公司!

在这款云上,可以运行NVIDIA AI Enterprise加速库套件,直接解决AI端到端的开发和部署。

并且,云上不止提供NVIDIA AI,还有全球最主要的几大云服务商。

而英伟达的第一个NVIDIA DGX Cloud,就是Oracle Cloud Infrastructure(OCI)。


在OCI中,NVIDIA CX-7和BlueField-3两个王炸合体,立马组合出一台强力超算。

据介绍,企业现在可以租用DGX Cloud,月租36999美元起。

最后,当然还是每年GTC大会的保留节目——Omniverse。老黄宣布了关于元宇宙平台Omniverse更新。


现在,Microsoft和NVIDIA,正准备将Omniverse带给数以亿计的Microsoft 365和Azure用户。

此外,还有消息称:老黄为了能让H100合规地出口中国,便照着之前A800的经验特调了一款「H800」,将芯片之间的数据传输率降到了H100的50%左右。

总结来说,老黄在这次的大会已经相当明确,英伟达要做AI领域的台积电,像晶圆厂一样提供代工,在此基础上让行业内其他公司训练算法。

这种商业模式,能成功吗?

参考资料:

触宝旗下app

https://www.NVIDIA.com/gtc/keynote/



返回网站首页

本文评论
苹果iPhone 14/Pro系列卫星SOS紧急求救服务正式上线
IT之家 11 月 15 日消息,苹果在新闻稿中宣布,iPhone 14 / Pro 系列卫星 SOS 紧急求救服务今日在美国和加拿大正式推出,并将于 12 月扩展到更多国家和地区。苹果表示,这项技术适...
日期:11-25
t-mobile5g覆盖美国_美国 T-Mobile 将于 2024 年 4 月 2 日关停其 2G GSM 网络
IT之家 2 月 18 日消息,虽然 T-Mobile 此前已透露将关闭其 2G 网络,但并未真正提供时间表。现在,T-Mobile 宣布将在 2024 年 4 月 2 日淘汰其 2G 网络。T-Mobile 声称,该公司已...
日期:02-25
realme 10 pro手机推荐_一亿像素曲面屏旗舰手机:realme真我10 Pro+正式发布 售价1699元起
11月17日消息,真我realme今日发布了真我10系列新品,包括真我10 Pro+、真我10 Pro和真我10三款新品,售价1699元起。据介绍,真我10 Pro+搭载了一块耗费亿元打造的2160Hz旗舰曲面屏...
日期:11-25
索尼称ps5涨价未影响需求_索尼宣布PS5供应增加,称持续两年多的短缺已结束
IT之家 1 月 31 日消息,在周一发表的一篇博文中,索尼硬件副总裁伊莎贝尔-托马蒂斯(Isabelle Tomatis)宣布,在两年多的短缺之后,现在 PlayStation 5 游戏机的“供应增加”。她写道:...
日期:02-07
oppo跟vivo的自研芯片有啥区别「OPPO即将发布第二颗自研芯片」
鞭牛士 12月8日消息,OPPO宣布将于12月14日OPPO未来科技大会上发布第二颗自研芯片。2021年,OPPO发布了首颗自研影像NPU芯片马里亚纳 X,截至目前出货已超一千万颗。资料显示,OPPO...
日期:12-09
荣耀magic5外观爆料「荣耀Magic5遭曝光 硬件太猛了」
中关村在线消息:近期,关于荣耀Magic5的曝光消息越来越多,基本都表示荣耀新旗舰的硬件很顶。从爆料的信息来看,荣耀Magic5系列的屏幕将非常给力,标准版和Pro版分别采用两块6.78"±...
日期:10-17
现在的高性能CPU是5年前i7-7700K的8倍!「和i712700kf性能差不多的cpu」
不知道有没有人关注到我们CPU天梯图的一个细节,其实我们的天梯图显示得不是很准确,很多地方为了美观所以没有显示真实的性能评分数值。CPU天梯图从上面这张图上,你能猜到i9-109...
日期:01-16
“灵动岛”造型别人还能用吗?苹果iPhone 14 Pro外观专利获授权「苹果iphone14promax灵动岛演示」
苹果公司的最新外观设计专利已于2月28日获得授权。该专利适用于运行程序和通信的手机,并强调了其独特的形状设计。据专利图显示,该专利涵盖的是iPhone 14 Pro的外观设计。此外...
日期:03-01
小米新款30000mah充电宝_宝藏款 小米口红充电宝发布,重仅127g
  9月28日消息,今日,小米口红移动电源129元首发。根据介绍,该充电宝内置5000mAh容量,可带上飞机,充电宝机身宽约为30.6mm,重为127g,女生使用起来也能无负担地一直放在小包包里,随...
日期:10-04
iPhone 14 Pro又双叒翻车:被曝充电时突然重启「iphone14pro退机」
  来源:快科技  作者/乃河  这一段时间,iPhone 14/14 Pro系列出现了各种或硬件或软件层面的问题,让人哭笑不得。  今天,又双叒有用户反馈,表示自己的iPhone 14 Pro遇到了...
日期:09-28
苹果新专利:Apple Pencil可充当VR游戏控制器「apple vr眼镜」
IT之家 2 月 10 日消息,根据美国商标和专利局(USPTO)公示的清单,苹果今天获得了一项关于 Apple Pencil 的技术专利。根据专利描述,Apple Pencil 可以和混合现实头显、iPad、Mac...
日期:02-13
苹果ipod扩容有什么坏处_iPod之父:苹果垄断 欧盟强制它使用USB-C接口是正确之举
上汽OPPOiPod之父法德尔凤凰网科技讯 北京时间10月7日消息,苹果公司前副总裁、有“iPod之父”之称的托尼·法德尔(Tony Fadell)周四表示,欧盟强制苹果使用USB-C接口是正确之举...
日期:10-26
苹果6.1版本_苹果发布iOS 6.0.1新固件!
  今天早些时候,美国媒体报道称,已经有用户收到了苹果的提示,他们会在11月21日左右,陆续收到预定的iPad mini/iPad 4 LTE版(Cellular)。凯迪拉克凯雷德汽车天猫双十一GMV北京5...
日期:07-25
iphone11和华为mate40网速对比,结果在意料之中「苹果尴尬了!华为Mate 50实测4G网速比iPhone 13的5G还要快」
华为Mate 50系列手机已经发布,该机依然最高支持4G网络,无缘5G。那么,这真的影响使用吗?据数码博主定焦数码分享的网络测速数据,华为Mate50 Pro的4G,实际跑出了峰值 75.95Mbps下载...
日期:09-11
中兴天机axon 30pro_中兴Axon 40 Pro官方爆料
  5月6日消息,计划将在后天(5月9日)的新品发布会上亮相的中兴Axon 40 Pro迎来新的曝光消息,而这次是官方爆料,官方微博发布中兴Axon 40 Pro机型海报,首一次公开该机的正反面...
日期:07-14
国行iPad Air/mini 2不支持移动4G「ipad air2支持移动4g吗」
  今天上午,国行数据(Wi-Fi+Cellular)版的iPad Air/mini 2携手出现在了苹果中国官网上,虽然并没有正式发售,但这至少意味着它离我们非常近了。  相信有很多用户都认为国行...
日期:07-26
Tinder创始人的最新作品:量化心理健康的智能戒指
  本文来自cnBeta  Tinder创始人Sean Rad旗下的Happy Health公司推出名为Happy Ring的智能戒指,这家公司成立于2019年底,目前有40名员工,其中13名员工位于该创业公司总部所...
日期:08-25
华强北耳机支持爱思助手检测吗「华强北再迎挑战_iOS 16支持检测山寨AirPods 网友」
来源:中关村在线华为6000毫安电池facebook Oculusaigo u盘怎么使用中关村在线消息:9月13日上午,苹果正式推送了iOS 16版本,为用户们带来了大量功能、细节更新,其中一项“检测AirP...
日期:09-15
iPhone年年焕新改为3到13个月!原设备可折价50%,网友:太低了,不划算
中国经济周刊-经济网讯 8月15日,有网友反馈,苹果 iPhone年年焕新计划资格已从“第10-13 个月”更新至“第 3-13 个月”。据苹果中国官网介绍,有了 iPhone 年年焕新计划,就可每年...
日期:08-19
华为Mate 50 Pro拆解:预留5G芯片位「华为mate50pro会用5g芯片吗」
很多用户还在抢购华为Mate 50手机,抖音博主“波哥评测”就已经率先拆解了华为Mate 50 Pro,让我们一睹Mate 50 Pro的内幕。曝iphone15pro影像参数win7电脑连不上打印机怎么解决...
日期:09-23