您的位置:首页 > 互联网

英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场_英伟达 ai芯片

发布时间:2023-11-15 15:12:02  来源:互联网     背景:

智能家用洗地机

出品 | 科技

作者 | 梁昌均

在全球算力荒的情况下,AI芯片巨头英伟达加速算力竞赛。当地时间11月13日,英伟达宣布推出新一代人工智能芯片H200,称其是目前世界“最强”的AI芯片。

英伟达hgx a100

H200此次升级主要体现在带宽更高、容量更大的内存,能以每秒4.8TB的速度提供141GB的内存,而其目前最先进的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现,并有助于提升高性能计算应用的计算能力。

英伟达预计,H200将在明年二季度开始发货,谷歌、微软、甲骨文等科技巨头将会率先实现首批部署。但毫无疑问,H200将无缘中国市场。

英伟达最强AI芯片,推理性能提升90%

H200是英伟达当前用于训练最先进大语言模型H100芯片的升级产品,它基于英伟达Hopper架构,配备具有先进内存的NVIDIA H200 Tensor Core GPU,可处理生成式AI和高性能计算工作负载的大量数据。

H200还是英伟达第一款使用HBM3e内存的芯片。HBM3E是最新一代的内存规格,可以满足用于AI存储必备的速度,也在发热控制和客户使用便利性等所有方面达到全球最高水平,存储巨头SK海力士、美光等都在布局。

借助内存速度更快、容量更大的HBM3e,英伟达H200以每秒4.8TB的速度提供141GB的内存,与A100相比,容量几乎是其两倍,带宽也提升大43%,从而加速生成式AI和大语言模型,提高高性能计算(HPC)的工作负载。

内存带宽对HPC应用程序至关重要,因为它可以实现更快的数据传输,减少复杂的处理瓶颈。英伟达表示,对模拟、科学研究和人工智能等内存密集型HPC应用,H200更高的内存带宽可确保高效地访问和操作数据,与CPU相比速度最多可加快110倍。

据英伟达测算,借助H200,1750亿参数的GPT-3的推理速度是H100的1.6倍,700亿参数的Llama2大模型的推理速度则是H100的1.9倍,而高性能仿真计算速度则达到A100的2倍。总体来看,H200由于更强大的内存,更适用于推理,在其用于推理或生成问题答案时,性能较H100提高60%至90%。

此外,H200和H100两款芯片可以互相兼容。英伟达称,这意味着已经在使用H100进行训练的人工智能公司,不需要改变他们的服务器系统或软件来适应H200。

英伟达大规模与高性能计算副总裁Ian Buck表示,要利用生成式人工智能和高性能计算应用创造智能,必须使用大型、快速的GPU显存,来高速高效地处理海量数据。借助H200,业界领先的端到端人工智能超算平台可以更快解决一些世界上最重要的挑战。

有很多数据的网站

除H200之外,英伟达还发布了HGX H200 平台,这是使用较新加速器的8路 HGX H100 的更新版本。而当H200与英伟达Grace CPU搭配使用时,就组成了性能更为强大的超级计算机GH200 Grace Hopper,其专为大型HPC和AI应用的计算而设计。

英伟达xavier芯片

英伟达称,在H200加持之下,GH200超级芯片将为全球各地的超级计算中心提供总计约200 Exaflops的AI算力,用以推动科学创新。德国尤里希超级计算中心、筑波大学和东京大学共同成立的日本先进高性能计算联合中心、德克萨斯高级计算中心、伊利诺伊大学香槟分校的美国国家超级计算应用中心等都将利用GH200超级芯片提升计算能力。

此外,英伟达还公布了未来的产品路线图,将使用同一构架设计三款芯片,在明年和后年会继续推出B100和X100,性能有望进一步提升。

明年二季度开始出货,加速与AMD、英特尔竞赛

英伟达表示,H200可以部署在各种类型的数据中心,包括本地、云、混合云和边缘,其全球生态系统合作伙伴服务器制造商(如华硕、戴尔、惠普、联想等)可以利用H200更新其现有系统。

该公司预计,明年第二季度开始出货搭载H200的系统,包括服务器制造商和云服务提供商。除英伟达自己投资的CoreWeave、Lambda和Vultr外,亚马逊云、谷歌云、微软Azure和甲骨文云基础设施将成为首批部署H200的厂商。但显然,H200无法面向中国市场销售,这也将影响其未来销售规模的增长。

目前,全球科技巨头都在囤算力,H100/A100成为抢手货,甚至有公司将其作为融资的抵押物。市场数据显示,今年以来,H100单价高达2.5万至4万美元,而据美国金融机构Raymond James透露,H100芯片成本仅3320美元。目前,英伟达还未公布H200价格。

由于AI大模型往往至少需要数千块GPU,上千亿参数的更大模型则需要更多。马斯克此期称,GPT-5可能需要3万-5万块H100,而摩根士丹利的说法是2.5万个。正是高价格和高需求的同振,让H100成为有史以来最赚钱的一种芯片。

这也推动英伟达业绩暴涨。今年第二季度,英伟达实现营收135亿美元,同比增长101%;净利润达62亿美元,同比更是暴增843%。该公司还预计,三季度将实现营收160亿美元,同比继续增长170%,保持连续两个季度翻倍。

英伟达股价也因此暴涨,成为全球首家超过万亿美元市值的芯片公司,年内股价上涨230%。最新交易日,英伟达股价报486.2美元,市值达1.2万亿美元,是AMD+英特尔市值之和的3倍多。

英伟达芯片排行

英伟达推出的H200还被视为应对竞争的最新武器。今年6月,它的老对手AMD发布MI300X系列芯片,最高支持192GB的HBM3内存,内存带宽为5.2TB/s,分别是英伟达H100的2.4倍和1.6倍。这显然给英伟达也带来压力,而此次发布的H200在内存和宽带上仍不及MI300X。

AMD CEO苏姿丰在11月初透露,MI300系列芯片将在未来几周开始出货,并已获得强劲的早期订购,包括大型云计算客户。她预计,该芯片会在四季度带来4亿美元的收入,并有望成为公司史上销售额最快达到10亿美元的产品,2024年全年将超20亿美元。

英特尔同样瞄准了AI算力市场,计划将在明年推出第三代Gaudi AI芯片,并将内存容量从目前的96GB增加到144GB。英特尔Max系列显卡目前内存容量最高为128GB,未来也将继续提升该系列芯片容量。

可以说,面对AI算力市场强劲的需求和市场前景,英伟达、AMD和英特尔等老对手又开启了新竞争。目前,英伟达仍垄断超过90%的AI算力市场,而它的老对手们显然不会让其一家独大。随着更多更强性能产品的推出,这场算力军备竞赛将会持续。


返回网站首页

本文评论
iphone11升级5g基带「自研失败!iPhone 15/16系列依旧采用高通骁龙5G基带」
中关村在线消息:近日,海通国际证券分析师Jeff Pu在周五的研究报告中说,他预计2024年发布的iPhone机型将使用高通尚未公布的骁龙X75调制解调器。与骁龙X70一样,X75预计有望基于台...
日期:10-10
重庆首个自主研发的大语言模型“兆言”发布
7月14日 消息:7月13日,上海交通大学重庆人工智能研究院在西部(重庆)科学城发布其最新研发成果“兆言”大模型产品。库克的iPhone据了解,兆言大模型是上海交大重庆人工智能研究院...
日期:07-14
消息称美国将要求字节跳动出售TikTok股份 否则将会封杀「如果字节跳动真卖了美国业务 会怎么样」
凤凰网科技讯 北京时间3月16日消息,知情人士称,拜登政府将要求TikTok所有者字节跳动公司出售他们在该视频分享应用中的股份,否则该应用可能会面临美国的禁令。iphone14 pro max...
日期:03-16
爱立信吴日平:AI算法实现节能,5G基站能耗将进一步降低
【网易科技10月9日报道】近日,爱立信召开媒体沟通会,强调了其在5G网络演进下的最新动向。此次演讲涵盖了爱立信未来发展的四大支柱,包括“卓越性能”、“绿色低碳”、“赋能增...
日期:10-11
苹果最新财报发布时间「苹果公司将于10月27日公布2022财年第四财季财报」
9月29日消息,据国外媒体报道,当地时间周三,苹果公司宣布,将于10月27日公布2022财年第四财季财报。股票金山云美股2022财年第四财季,苹果发布了iPhone 14系列手机、Apple Watch Se...
日期:10-06
艾漫数据上线“艺人风险尽调”服务,品牌选代言人不再担惊受怕
  8月17日,基于11年7*24小时不间断抓取且永久存档的泛娱乐大数据资产积累,艾漫数据宣布推出“艺人风险尽调”服务升级举措,为品牌邀请代言人提供包括政策风险评估、风险系数...
日期:05-09
中信银行财富管理部总经理王洪栋:数字人财富顾问将上线中信APP,服务上亿用户
“国之大者是使命担当,落实金融工作的政治性、人民性是我们的天职,这是普惠型财富管理的初衷。”2023世界人工智能大会期间,中信银行财富管理部总经理王洪栋接受网易科技采访时...
日期:07-12
三年内换了四位:Netflix 任命新首席营销官_Netflix创始人
  北京时间 3 月 4 日早间消息,据报道,流媒体播放平台 Netflix 任命玛丽安・李 (Marian Lee) 为新的首席营销官,取代了博佐马・圣・约翰 (Bozoma Saint John),负责向全球销售...
日期:07-17
外部投资短缺,与吉利需求适配度低,星纪魅族终止芯片研发
通信世界网消息(CWW)8月8日下午,星纪魅族回应“裁员”风波时表示,面对全球经济环境的不确定性,决定终止自研芯片业务,未来将更加聚焦产品创新和软件用户体验。近日有消息称,因业务...
日期:08-09
iPhone SE4曝光 放弃小屏配6.1英寸刘海屏_4寸iPhone se 测评
中关村在线消息:近日,根据Display Supply Chain Consultants分析师Ross Young在报告中预测,四代iPhone SE将会配备6.1英寸LCD显示屏,屏幕顶部保留刘海。iPhone SE4可能会引入全...
日期:10-13
东方网力PVG10视云联网平台千万级兼容接入 重磅加持“雪亮工程”
  “雪亮工程”在全国范围内的建设,进一步推动了安防企业将云计算、大数据、AI等技术在多场景下的落地探索。与此同时,多行业、多领域资源的接入需求,负载量大等问题越来越...
日期:02-26
小鹏汽车与小灵狗出行、神州租车达成战略合作_神州租车小鹏g3
1月9日 消息:小鹏汽车与小灵狗出行、神州租车正式签署三方战略合作协议,并在宁波完成首批小鹏P7的交付仪式。据了解,在本次的战略合作关系中,小灵狗出行负责小鹏P7的车辆采买,后...
日期:01-09
苹果16英寸「iPhone 16系列配更大屏幕 重量增加20克」
9月30日,有消息称,苹果最新的iPhone 16、iPhone 16 Plus、iPhone 16 Pro和iPhone 16 Pro Max的重量和尺寸已经获得初步信息。据消息,iPhone 16 Pro和iPhone 16 Pro Max将配备更...
日期:09-30
实时翻译讯飞翻译机 不错_专业翻译难怎么办?讯飞双屏翻译机覆盖16行业轻松破!
  眼下,随着人工智能发展趋势的到来,人机对话智能交互技术在近年内也获得了快速而长足的发展。而在此领域内一直是头部玩家的科大讯飞,通过自身技术不断的积累,打造出的讯飞...
日期:10-22
微软重新设计了 Edge 浏览器 PWA 应用菜单
  5 月 25 日消息 据外媒 MSPoweruser 报道,在最新的 Edge Canary 版本中,微软为 PWA 应用菜单带来了全新外观,使其与 Edge 上普通网站的椭圆菜单区分开来。   此前的菜单...
日期:05-23
蜜雪冰城商标被模仿获赔50万!法院:主观攀附太明显「蜜雪冰城商标官司」
蹭知名品牌的商标,为自家产品做宣传,此类的案例屡见不鲜,但是如果被对方追究起来的话,可能最终成了搬起石头砸自己脚。三星fold铰链松动11月1日消息,近日,蜜雪冰城公司与蜜雪约(广...
日期:11-03
首个全国生态日,国家林草局联合腾讯科普国家公园五大旗舰物种
2023 年 8 月 15 日是我国首 个“全国生态日”。当日,国家林业和草原局联合腾讯推出系列科普活动,以公众喜闻乐见的创意形式,让国家公园旗舰物种走进人们的数字生活。藏羚羊、...
日期:08-15
灰色产业有多暴利「每年千亿,越打越狂,这个灰色产业,值得再次严打了」
图片来源@视觉中国文 | 华商韬略“XX楼盘交通便利、环境优美”“贷款利率4.5%考虑一下”“游泳健身办卡八折”……如今,几乎每个人都被这类营销电话搞得不胜其扰。它们不分早...
日期:10-11
与国内用户无关,苹果彻底怂了,库克要哭_库克接手苹果
iOS相对于安卓最大的区别在于其封闭性,就像应用商店一样。在iOS上只能从苹果自带的应用商店下载APP,第三方想都不用想,根本不可能。不过这一情况在2024年将面临改变,这一次苹果...
日期:11-09
比亚迪 新能源汽车销量「9月新能源车销量出炉:比亚迪20万辆一枝独秀 碾压特斯拉」
10月9日,乘联会公布2022年9月新能源乘用车厂商批发销量,预估9月销量66.4万辆,环比8月约增长5%,同比去年9月增长约90%。具体厂商方面,比亚迪以超过200973辆的销量一枝独秀,不仅是唯...
日期:10-11