您的位置:首页 > 互联网

超擎数智800G/400G InfiniBand NDR网络产品应用与连接方案_超擎科技怎么样

发布时间:2024-03-08 19:27:41  来源:互联网     背景:

大模型技术因其良好的通用性与泛化性,显著降低了人工智能应用的门槛,其溢出效应正在加速推进新一轮的科技革命和社会产业的变革。尤其是以ChatGPT为代表的生成式人工智能应用的出现,使大模型的发展成为AI领域最重要的热点趋势,越来越多的科技巨头竞相推出千亿、万亿参数的大模型。而训练超大参数规模的大模型也给智能计算基础设施带来了前所未有的挑战。大模型的训练过程需要数千张GPU卡协同计算数周或数月,这就要求智能计算网络能够提供更强大的性能和更高的稳定性与可靠性。

超擎数智凭借对高速率网络发展趋势的理解,和丰富的高性能网络项目实施经验,基于NVIDIA Quantum-2InfiniBand平台为客户提供NDR (Next Data Rate)网络产品应用与连接方案。NVIDIA Quantum-2InfiniBand平台以超高的带宽、超低的传输延时以及极简的运维成为了人工智能和超大规模数据中心的首选。与上一代产品相比,Quantum-2实现了两倍的端口速度,三倍的交换机端口密度,五倍的交换机系统容量,以及32倍的交换机AI加速能力。如果采用Dragonfly+拓扑,基于Quantum-2的网络可在3个hop内实现百万余个节点的400Gb/s连接能力。可为AI开发者和科研人员提供超强网络性能,帮助他们应对全球极具挑战的问题。

Quantum-2InfiniBand交换机

超擎数智提供基于NVIDIA Quantum-2的QM9700和QM9790交换机。NVIDIA Quantum-2盒式交换机主要有两个型号:QM9790和QM9700,两者主要区别在于管理方式,QM9700带管理接口,支持外部管理,而QM9790不支持,在端口形态、速率上则没有任何区别。QM9700系列交换机支持64个400G端口、或128个200G端口的灵活搭配,需要注意的是QM9700采用的1U的设计,单面板32*OSFP端口,每个OSFP端口支持2X400G速率,在交换机内部则以IB1/**/1、IB1/**/2的形式展示64个400G端口的信息。

NVIDIA Quantum-2搭载第三代NVIDIA SHARP技术,能够为各种规模的网络数据聚合创造几乎无限的可扩展性,其AI加速能力将达至前一代的32倍。此外,第三代SHARP技术可在不降低性能的情况下,支持多个租户或多个并行应用共享基础设施。MPI_Alltoall加速和MPI标签匹配硬件引擎以及其他功能(如高级拥塞控制、动态路由以及自我修复网络)可为高性能计算(HPC)和AI集群提供至关重要的增强功能,从而使其性能更上一层楼。

ConnectX-7HCA网卡

NVIDIA ConnectX@-7InfiniBand网卡(HCA) ASIC可提供400Gb/s的数据吞吐量,并支持16通道的PCle5.0或PCle4.0主机接口。400Gb/s lnfiniBand采用先进的每通道100Gb/s的SerDes,通过交换机和HCA端口上的OSFP连接器实现物理连接。每个交换机OSFP连接器支持两个400Gb/s InfiniBand端口或200Gb/s InfiniBand端口。网卡HCA的OSFP连接器支持一个400Gb/s InfiniBand端口。400Gb/s线缆产品包括有源及无源铜缆、收发器以及MPO光缆。需要注意的是,虽然网卡与交换机都采用的OSFP封装,但在物理尺寸上有所区别:交换机端的OSFP模块带散热鳍片,而网卡端采用OSFP-RHS结构不带散热片,依靠网卡端口上的散热片辅助模块进行散热。

NDR光连接解决方案

超擎数智提供灵活的NDR光连接解决方案,NDR交换机端口的物理形态是OSFP,每个接口有八个通道,每通道采用100Gb/s的SerDes;所以从连接速率上来看,有800G to800G、800G to2X400G与800G to4X200G三种主流连接方案;同时,每个通道支持从100Gb/s降至50Gb/s,所以它也可以与上一代HDR(HDR采用50Gb/s的SerDes)设备互连,即可以支持400G to2X200G。

NDR系列电缆和收发器提供了丰富的产品选择,用于配置任何网络交换和适配器系统,专注于长达2公里的数据中心长度,用于加速人工智能计算系统。为了最大限度地减少数据重传,电缆和收发器都具有低延迟、高带宽人工智能和加速计算应用所需的极低误码率 (BER)。

从连接件类型上来看,主要有三种方式:无源铜缆DAC、有源铜缆ACC与光模块+跳线的方案。其中DAC支持1-3米的传输距离(其中直连DAC传输距离为2米),ACC支持3-5米的传输距离,多模光模块最远支持50米传输距离,单模光模块最远支持500米传输距离。

超擎数智NDR交换机到NDR设备连接方案

NDR InfiniBand Quantum-2交换机 —— NDR InfiniBand Quantum-2交换机

1、NDR光模块

多模光模块——MMA4Z00-NS(50m)

单模光模块——MMS4X00-NS(100m)、MS4X00-NM(500m)

① Single2x400Gb/s OSFP - Single2x400Gb/s OSFP:使用OSFP双端口收发器和两根直连MPO-12/APC光纤跳线以800G (2x400G) 速率将两台OSFP端口的 QM9700/QM9790交换机连接在一起,多模最远传输距离可以达到50m,单模传输距离可以达到100m或500m;

② Single2x400Gb/s OSFP - Dual2x400Gb/s OSFP:使用OSFP双端口收发器和两根MPO-12/APC光纤跳线还可以路由到两个不同的交换机,形成两条400Gb/s 链路,然后将额外的OSFP端口路由到更多的交换机。

800G SR8连接示意图

800G DR8100m连接示意图

800G DR8500m连接示意图

2、NDR Copper(DAC / ACC)

超擎软件

NDR Copper Cable的主要用途是将两个双端口、基于 OSFP 的 Quantum-2InfiniBand 或 Spectrum-4以太网交换机相互连接在一起,分为无源铜缆DAC和有源铜缆ACC,其中平顶Flat Top用于 DGX H800,翅片顶部Finned Top连接器用于 InfiniBand 或以太网交换机。

-MCP4Y10:无源铜缆(DAC),长度最长2m。

-MCA4J80:有源铜缆 (ACC),可将长度延长至3、4和5米,同时保持每端1.5瓦的极低延迟和极低功耗。

800G DAC连接示意图

800G ACC连接示意图

NDR InfiniBand Quantum-2交换机 ——2x400G ConnectX-7(OSFP/QSFP112)Adapter/BlueField-3DPU(QSFP112)

1、NDR光模块

交换机侧:800G Twin-port OSFP光模块——MMA4Z00-NS(50m)、MMS4X00-NS(100m)

网卡侧:400G Single port OSFP/QSFP112光模块——MMA4Z00-NS400/ MMA1Z00-NS400(50m)、MMS4X00-NS400(100m)

使用两根光纤跳线的双端口 OSFP 光模块最多可支持两个适配器和/或 DPU 组合。两条4通道光纤跳线中的每一条都可以连接到 OSFP 或 QSFP112封装的400G 光模块,多模最远传输距离可达50米,单模最远传输距离可达100m。

-仅 ConnectX-7/OSFP 支持单端口 OSFP。

-QSFP112封装光模块可用于ConnectX-7/QSFP112和BlueField-3/QSFP112DPU。

-使用 OSFP 或 QSFP112的 ConnectX-7和 BlueField-3的任意组合可同时与双端口 OSFP 光模块连接使用。

800G SR8——2x400G SR4连接示意图

800G DR8——2x400G DR4连接示意图

2、NDR Copper(DAC/ACC)

800Gb/s 双端口 OSFP至2x400Gb/s OSFP/QSFP112分支铜缆适用于400Gb/s NVIDIA 端到端 Infiniband和以太网解决方案。主要用途是将800Gb/s Quantum-2交换机或 Spectrum-4交换机连接到基于 OSFP/QSFP112的400Gb/s ConnectX-7PCIe 网络适配器卡/BlueField-3DPU。

-单端口 OSFP仅适用于 ConnectX-7/OSFP 网络适配器。

-BlueField-3/QSFP112DPU 和 ConnectX-7/QSFP112适配器需要 MCP7Y10和 MCA7J65铜缆上的 QSFP112端。

-有源铜缆 (ACC) MCA7J60、MCA7J65的长度可提供4米和5米。

OSFP -2x400G OSFP DAC/ACC连接示意图

OSFP -2x400G QSFP112DAC连接示意图

NDR InfiniBand Quantum-2交换机 ——4x200G ConnectX-7(OSFP/QSFP112)Adapter/BlueField-3DPU(QSFP112)

1、NDR Twin-port光模块

交换机侧:800G Twin-port OSFP光模块——MMA4Z00-NS(50m)、MMS4X00-NS(100m)

网卡侧:400G Single port OSFP/QSFP112光模块——MMA4Z00-NS400/ MMA1Z00-NS400(50m)、MMS4X00-NS400(100m)

使用两根1:2分支光纤跳线的双端口 OSFP 光模块最多可支持四个适配器和/或 DPU 组合。两根4通道1:2分支光纤跳线中的每根都可以连接到 OSFP 或 QSFP112封装的400G 光模块,最远传输距离可达50米。在400G 光模块中仅激活其中的两个通道,从而实现200G 应用。

-仅 ConnectX-7/OSFP 支持单端口 OSFP。

-QSFP112封装光模块可用于 ConnectX-7/QSFP112和BlueField-3/QSFP112DPU。

-ConnectX-7和 BlueField-3网卡的任意组合可同时与双端口OSFP 光模块连接使用。

-单模直连光纤最大传输距离为100米,但1:2分支光纤跳线的最大传输距离为50米。

800G SR8——4x200G SR2连接示意图

800G DR8——4x200G DR2连接示意图

2、NDR Copper(DAC/ ACC)

800Gb/s 双端口 OSFP至4x200Gb/s OSFP/QSFP112分支铜缆适用于400Gb/s NVIDIA 端到端 Infiniband和以太网解决方案。主要用途是将800Gb/s Quantum-2交换机或 Spectrum-4交换机连接到基于 OSFP/QSFP112的200Gb/s ConnectX-7PCIe 网络适配器卡/BlueField-3DPU。

-单端口 OSFP仅适用于 ConnectX-7/OSFP 网络适配器。

-BlueField-3/QSFP112DPU 和 ConnectX-7/QSFP112适配器需要 MCP7Y40和 MCA7J75铜缆上的 QSFP112端。

-有源铜缆 (ACC) MCA7J70、MCA7J75的长度可提供4米和5米。

OSFP -4x200G OSFP DAC/ACC连接示意图

华硕灵耀s二代

OSFP -4x200G QSFP112DAC连接示意图

NDR InfiniBand Quantum-2交换机 —— DGX H800GPU Systems

1、NDR光模块

DGX-H800在顶部机箱部分包含8个“Hopper”H800GPU,在底部服务器部分包含两个 CPU、存储以及 InfiniBand 和/或以太网网络设备。其中包含八个400Gb/s ConnectX-7IC,安装在两个称为“Cedar-7”板卡的夹层板上,用于 GPU 到 GPU InfiniBand 或以太网网络。板卡 I/O 在内部路由至四个800G 双端口 OSFP 机箱,内置散热器安装于前面板上的机箱顶部。这需要在 DGX H800中使用flat-top transceivers、ACC 和 DAC 线缆。由于交换机中的气流入口减少,400G IB/EN 交换机需要使用finned-top2x400G 光模块进行额外冷却。

每个双端口2x400G 光模块提供两条从 DGX 到 Quantum-2或 Spectrum-4交换机的400G ConnectX-7链路。与 DGX A800相比,这减少了 ConnectX-7板卡冗余、复杂性和光模块数量,DGX A800使用8个独立的 HCA 和8个光模块或 AOC 线缆以及两个用于 InfiniBand 或以太网存储的附加 ConnectX-6。

此外,对于存储、集群和管理的传统网络,DGX-H800还支持多达四个 ConnectX-7和/或两个 BlueField-3DPU 在 InfiniBand 和/或以太网中用于存储 I/O,以及支持使用 OSFP 或 QSFP112光模块的400G 或200G 设备进行的额外网络。这些 PCIe 卡槽位于OSFP GPU机箱的两侧,并使用单独的电缆和/或光模块。

800G SR8连接示意图

800G DR8连接示意图

2、NDR Copper(DAC/ ACC)

OSFP 平顶端Flat Top线缆可用于液冷交换机和 DGX H800系统,其中,MCP4Y10-N0XX-FLT无源DAC电缆长度为0.5m和1m,MCA4J80有源ACC电缆连接到DGX-H800Cedar 系统可使用的长度为3m。

800G DAC连接示意图

800G ACC连接示意图

超擎数智NDR交换机到HDR设备连接方案

NDR InfiniBand Quantum-2交换机 ——2x HDR InfiniBand Quantum交换机

NDR InfiniBand Quantum-2交换机 ——2x200G QSFP56ConnectX-6Adapter/BlueField-2DPU

MFA7U10-H00X是一款 OSFP 至2x QSFP56、400Gb/s 至2x200Gb/s 有源分光器电缆 (AOC),将来自单个 OSFP 端上的8个 MMF(多模光纤)对中的每对数据信号连接到每个 QSFP56多端口端的四对。MFA7U10-H00X用于将带有 OSFP 端口的 NDR 交换机连接到基于QSFP56端口的2个HDR 交换机或ConnectX-6适配器/BlueField-2DPU 。

400G OSFP -2x200G QSFP56AOC线缆连接示意图


返回网站首页

本文评论
宏碁推出新款31.5寸显示器:4K 165Hz屏、1500R大曲率_宏碁23寸显示器
快科技9月14日消息,宏碁发布了新款31.5英寸显示器XZ320QK P3,售价为450美元(约人民币3276元)。航天员可以在空间站用手机上网吗据了解,新款显示器采用了31.5英寸的VA面板,1500R大...
日期:09-14
谷歌Gemini被曝视频造假!多模态视频竟是剪辑配音,击败GPT-4靠作弊?
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。【新智元导读】才一天,谷歌Gemini被质疑造假、夸大宣传的议论声淹没了。多模态视频是剪辑拼贴的,打败GP...
日期:12-08
宝马投资7亿美元改造慕尼黑工厂,2027年底开始专门生产纯电动车_宝马慕尼黑工厂车型
1月11日消息,周三,宝马宣布,将投资6.5亿欧元(约合7.11亿美元),从2027年底开始把位于慕尼黑的主厂区改造成专门生产电动汽车的工厂。小米京东小魔方新品日这是宝马向电动汽车时代过...
日期:01-11
两位顶级世界富豪“约架”要泡汤?扎克伯格自曝膝韧带撕裂,两天前马斯克曾再次喊话
美国元(Meta)公司创始人兼首席执行官马克·扎克伯格在综合格斗(MMA)训练中膝盖受伤,接受了修复韧带撕裂的手术。当地时间11月3日,扎克伯格在社交平台上发布了一张自己躺在医院病床...
日期:11-06
海底捞要求必须点锅底 不能再单点清水锅「海底捞 只点清水锅」
有网友爆料称,海底捞不再允许点4个清水锅,至少要点一个付费的锅底。这一消息很快登上了微博热搜榜第一。海底捞客服回应称,这是今年的新规定,在全国门店都要执行。如果不点一个...
日期:03-14
奇墨是什么意思「奇墨勒索病毒全栈解决方案 铸起企业信息安全的“铜墙铁壁”」
你信息泄露了吗?被勒索了吗?随着企业数字化转型的加快,觊觎企业核心数据成为某些人“敛财手段”,勒索病毒因此“臭名昭著”。airpods pro爆音根据勒索病毒报告显示, 2023 年的勒...
日期:12-29
买完就退 羊毛党用无理由退货漏洞薅了100万:20人团队被端
网络购物经常有优惠,大家平常也能薅薅电商羊毛,这也是正常的,然而一些专业的团队就不止是薅羊毛了,日前上海就破获了一起利用漏洞薅羊毛导致企业损失100万元的案件,有20人被抓。...
日期:07-07
谷歌 Gboard 全力发展生成式 AI:加入人工智能校对和表情符号生成功能
8月11日消息:人工智能是今年 Google I/O 开发者大会的关键词,谷歌展示了生成式语言模型如何改变其一些重要产品。看起来该公司正准备将同样的魔力添加到 Gboard 中,这几乎是最...
日期:08-11
抖音、瑞幸开启鸿蒙相关岗位招聘_瑞幸咖啡招募
DoNews11月27日消息,抖音、瑞幸咖啡已经上线鸿蒙相关职位。小米11更新12.0.17其中,字节跳动上线了“大前端高级开发工程师”一职,主要负责抖音大前端基础工程与架构设计、大前...
日期:11-27
消息称一加12电池增至5400mAh 支持100W有线闪充「一加充电多少瓦」
7月19日 消息:根据最新爆料,一加12将配备6.7英寸LTPO OLED曲面屏,前置摄像头位于屏幕中央,并搭载高通骁龙8Gen3移动平台。它还配备16GB LPDDR5X内存和UFS4.0闪存,前置3200万像素...
日期:07-19
Pro机型将成主打产品 iPhone,15系列面板订单透露苹果秘密_苹果15pro最新消息
6 月 27 日消息,据显示器供应链分析,苹果公司正在为今年秋季发布的 iPhone 15 系列做好准备。据显示器供应链咨询公司 DSCC 的最新研究报告,2023 年 6 月的 iPhone 15 面板订单...
日期:09-23
小米MIUI正式更名,成为历史!小米澎湃OS即将到来_小米应该改名
近日,小米公司正式宣布将MIUI更名为小米澎湃OS(Xiaomi HyperOS),这意味着MIUI即将成为历史。小米CEO雷军此前透露,小米已为小米澎湃OS的研发工作准备了很长时间。自2014年开始初...
日期:10-22
笔记本性价比排行_14寸笔记本性价比排行
随着科技的飞速发展,笔记本电脑已经成为了现代人生活必备的电子设备之一。而随着笔记本电脑市场的不断扩大和竞争的加剧,各大品牌也在为争夺市场份额而竞相推出各种型号和规格...
日期:05-30
百度360同日发布压缩软件 挑战好压霸主地位(360压缩良心软件)
  3月3日,360推出了360安全压缩软件,百度也在同天公布了百压压缩软件的网站页面,并且表示百压客户端正在内测。一时之间,国产压缩软件如雨后春笋般一个一个冒出尖尖头,这块许...
日期:07-26
台式电脑功耗「台式电脑功耗是多少瓦」
是指台式电脑在运转时所消耗的能量。随着电脑的普及和使用量不断增加,电脑功耗的问题也愈加引人关注。为了保护环境,节能减排,降低家庭和办公室的能源消耗,我们需要了解相关信息...
日期:05-29
三星cdie海力士cjr「三星、SK 海力士正致力于研发人工智能时代的降低内存功耗技术」
7月13日消息:三星电子和 SK 海力士等内存制造商正在研究降低内存功耗的技术,随着 HBM 和 DDR5 等内存在高性能计算中的重要性日益增加,内存的功耗问题变得越来越突出。13代酷...
日期:07-13
拍拍贷正规合法的吗?可以通过哪些方法查验_拍拍贷是否正规
近年来,随着互联网技术的不断发展和普及,互联网金融飞速发展,给人们带来了极大的方便,让更多的人可以享受到金融服务的便利,但同时也带来了一些安全问题。例如,一些互联网金融平台...
日期:09-21
电影院预计复工时间?利好消息传出,当贝F1投影仪居家观影新潮流
  前些日子疫情控制得很利索,以为到了抗战的尽头,以为即将迎来电影院开业,可没想这东西着实难缠,抗战的意识还是要时刻保持住。所以,电影院什么时候恢复营业?想看电影怎...
日期:07-14
218元自助餐女子5次吃出4万多:店家气到要起诉_吃自助餐收费标准
4月16日消息,据指尖新闻报道,贵州贵阳一店长对记者表示,一顿218元的自助餐,女子月消费5次吃出4万多元总价。店长称,这名女子花了218元下的单,吃的菜品都是一万多,八千多的总价。对...
日期:04-17
联通 小米「联通小米路由器默认密码」
联通和小米的战略合作关系已经有一段时间了。以小米为代表的新兴手机品牌在近年来市场份额不断攀升,而联通则是中国通信市场老牌大佬之一。两者的合作为消费者提供了更好的产...
日期:05-30