您的位置:首页 > 互联网

进一步了解大规模部署AI的更优解:Habana® Gaudi®2

发布时间:2023-07-21 13:33:24  来源:互联网     背景:

通信世界网消息(CWW)大语言模型(Large Language Model,下文简称为:LLM)的发展如火如荼。以ChatGPT为代表的LLM可执行更为广泛的任务并具有更高的智能化程度,刷新了人们对AI技术的新认知。当然,LLM规模庞大,通常包含数十亿参数,需要海量的训练数据与强大算力支撑才能达到预期的效果。

其实,无论LLM还是其他应用越来越广泛的深度学习模型,从模型训练到推理应用,都需要高性能、可扩展的基础设施作为底层支撑,这往往也意味着高昂的成本。近日,英特尔发布的最新Habana® Gaudi®2,专为训练大语言模型而构建,并为数据中心大规模扩展而设计,同时为深度学习训练和推理工作负载提供极具性价比的解决方案。

在6月公布的MLCommons® MLPerf® 基准测试中,Gaudi®2在GPT-3模型、计算机视觉模型ResNet-50(使用8个加速器)、Unet3D(使用8个加速器),以及自然语言处理模型BERT(使用8个和64个加速器)上均取得了优异的训练结果。与市场上其他面向大规模生成式AI和大语言模型的产品相比,Gaudi®2拥有卓越的性能与领先的性价比优势,能够帮助用户提升运营效率的同时,降低运营成本。

Gaudi®2实现性能、可扩展性和能效飞跃

第二代Gaudi AI深度学习夹层卡 HL-225B 专为数据中心实现大规模横向扩展而设计。其AI处理器基于第一代 Gaudi的高效架构打造而成,目前采用7纳米制程工艺,在性能、可扩展性和能效方面均实现了飞跃。

夹层卡搭载的HL-2080 处理器拥有24个完全可编程的第四代张量处理器核心(TPC)。这些核心原生设计便能够为广泛的深度学习工作负载加速,同时还赋予用户按需进行优化和创新的灵活性。此外,它还集成了96GB HBM2e内存和48MB SRAM,支持600瓦夹层卡级热设计功耗(TDP)。

Gaudi®2 处理器具备出色的2.1 Tbps 网络容量可扩展性,原生集成21个100 Gbps RoCE v2 RDMA端口,可通过直接路由实现Guadi 处理器间通信。Gaudi®2处理器集成了专用媒体处理器,用于图像和视频解码及预处理。

此外,Gaudi®2 深度学习夹层卡符合OCP OAM 1.1(开放计算平台之开放加速器模块)等多种规范,可以为客户带来系统设计的灵活性。

图:Gaudi®2 深度学习夹层卡 HL-225B 主要参数

多维度技术创新,实现卓越性价比

我们的未来生活未来5g的发展及其在各行各业的应用

ie主页设置不起作用

excel快捷键大全初学者

Gaudi®2 处理器是一款高性能、完全可编程的AI处理器,它整合了多项技术创新,从计算架构、内存和扩展能力三个维度打造全新的AI 专用处理器。同时,它具有高内存带宽/容量和基于标准以太网技术的纵向扩展能力,支持使用外接网卡通过PCIe接口实现横向扩展,满足多节点集群需要。

[ 性能更高的计算架构 ]Gaudi®2 采用经过验证的高性能深度学习AI训练处理器架构,利用Habana完全可编程的TPC和GEMM引擎,支持面向AI的高级数据类型:FP8、BF16、FP16、TF32和FP32。TPC核心旨在支持深度学习训练和推理工作负载。TPC是一款VLIW SIMD矢量处理器,其指令集和邮件经过定制,可高效处理上述工作负载。

[ 更先进的内存技术 ]内存带宽和容量与计算能力同样重要。Gaudi®2 采用先进的HBM内存技术,内存容量高达96GB,内存带宽高达2.4TB/s。Gaudi先进的HBM控制器已针对随机访问和线性访问进行了优化,在各种访问模式下均可提供高内存带宽。

[ 通过集成RDMA实现纵向扩展 ]Gaudi AI训练处理器芯片上集成了RDMA(RoCEv2),可与成熟且广泛使用的以太网进行连接。HL-2080芯片互连技术基于42对56 Gbps Tx/Rx PAM4 SerDes(配置为21个100 GbE端口)发挥作用。

与广泛的软件生态一起,帮助简化模型的开发和迁移

为支持客户轻松构建模型,或将当前基于GPU的模型业务和系统迁移到基于全新Gaudi®2服务器,并帮助保护软件开发投入,SynapseAI® 软件套件针对Gaudi平台深度学习业务进行了优化,旨在与广泛的软件生态系统一起,帮助简化模型的开发和迁移。

SynapseAI® 软件套件旨在提高 Habana AI处理器的易用性和支持高性能训练,能够将神经网络拓扑高效映射到Gaudi系列硬件上。该软件套件包括Habana 的图编译器和运行时、经过性能优化的TPC算子库、固件和驱动程序以及开放工具,例如用于自定义核心开发的TPC 编程工具套件和SynapseAI 图编译器。SynapseAI与TensorFlow和PyTorch等主流框架集成,并已针对基于Gaudi AI 处理器家族产品的训练进行了优化。数据科学家和开发人员在这里可以找到开始基于Gaudi AI 处理器进行训练所需的各类信息资料,包括教程、参考模型、操作指南、文档等。

扩展AI产品阵容,加速AI落地

Gaudi®2不仅以高性能为AI模型的训练与推理加速,其高扩展性和性价比,也将加速AI应用落地的进程。多年来,借助强大的软硬件基础,英特尔基于全面的AI产品和解决方案,与广泛合作伙伴一同构建开放生态,为越来越多不同需求和场景的AI应用落地提供更多元的解决方案,持续引领产品技术发展,进一步加速大规模深度学习部署,助力中国本地AI市场发展。


返回网站首页

本文评论
强者愈强,海信连续4年入选BrandZ中国全球化品牌10强(brandz全球化品牌50强)
  7月16日,Google联合WPP和Kantar推出了“2020年BrandZ中国全球化品牌50强”,海信连续4年位列榜单TOP10。该调研发现,在全球化方面头部品牌力成长最快且波动最小,榜单前10强...
日期:07-14
第55颗北斗导航卫星于何时何地发射成功「第56颗北斗导航卫星成功发射」
(原标题:我国成功发射第五十六颗北斗导航卫星 ) 苹果5伏1安充电头2023年5月17日10时49分,我国在西昌卫星发射中心用长征三号乙运...
日期:05-17
东菱便携式电热水杯_东菱便携烧水杯成春节出行必备好物,轻松搞定饮水难题
  春节放假回家,却挡不住许多人爱自由的心。有的人选择和亲人一起在家里团聚,也有很多人趁着阖家团圆的好日子选择一起出游,度过一个美好而有趣的春节。出行就免不了要住酒...
日期:07-10
B站陈睿十二周年演讲:稳步促进社区的健康成长_b站ceo陈睿的事迹
  不久前,B站迎来了自己的第十二个生日,历经数十载的发展,B站已经成为了当下国内知名的文化社区。这个围绕着用户、社区、内容和UP主构建起来的多维社区,在陈睿董事长的带领...
日期:04-12
网易有道培训师待遇怎么样_网易有道保底50万年薪面向毕业生招“网课老师”
  近日,各大公司纷纷开启2021届校园秋招季,名校应届生的新贵职业offer又出现新选择。8月5日,网易有道旗下K12网校有道精品课发布了2021届校招职位,面向优秀的知名学府毕业生...
日期:07-15
2020信创目录_首份2022信创报告全文下载,信创云三足鼎立
  2021年是“十四五”开局之年,作为“十四五”发展目标的重要抓手,信创产业以信息技术产业为根基,通过科技创新,构建国内信息技术产业生态体系,形成了一大批有竞争力的、逐渐...
日期:07-10
ARM 将推迟在伦敦上市的计划 转而决定在纽约IPO「arm公司最新消息」
3月3日消息:据彭博报道,ARM 计划推迟在伦敦上市的计划,转而决定在纽约上市。马斯克删推特账号 新闻罗技usb摄像头消息称,英国一直希望 ARM 在英国敦证券交易所上市,但 ARM 的前...
日期:03-03
倒下的易趣网,精明的邵亦波
马云曾说过一句话,如果当初邵亦波没有卖掉易趣网,他不会创立淘宝。   文 | 喜乐   来源 | 东四十条资本   世界每天都在变,最近发生的一些小事也将原来的一条暗线描绘得...
日期:07-31
腾讯QQ阅读订阅规则改了!不再同步起点订阅数据_qq阅读订阅比一般是多少
根据早些时候腾讯QQ阅读发布的公告,今天(4月6日)起,QQ阅读将正式调整订阅互通规则。在规则调整后,QQ阅读与起点读书、红袖添香之间订阅的章节内容将不再互通;不过,此前用户已经订阅...
日期:04-06
线上KubeCon 2020分论坛前瞻丨定制+扩展Kubernetes+社区(kubecon 2021)
  由CNCF与全球开源志愿者共同发起的“Cloud Native + Open Source Virtual Summit China 2020中国线上峰会”,将于2020年7月30日-8月1日正式上线。本次峰会仅对报名注册...
日期:07-14
Win10再见 更新将结束了!微软加速抛弃:20H2版正式停止 快升Win11_微软官方升级win11
快科技5月10日消息,对于微软来说,放弃Windws 10系统的时间早已确定,而2022年10月推出的Windows 10 22H2将是该操作系统的最后一个功能更新版本。按照微软的说法,所有版本的Windo...
日期:05-10
海盐网论坛求职招聘「知乎宣布“海盐计划5.0”发力方向:职人创作者权重提升」
4月13日 消息:今日,知乎在京举办“2023知乎发现大会”,并宣布“海盐计划5.0”的发力方向并锚定职人创作者群体,给予权重提升。据悉,“海盐计划”是知乎围绕创作体系、流量和收益...
日期:04-13
国内5月上映 迪士尼《小美人鱼》新剧照公布:脏辫黑人鱼与王子对视
4月12日消息,5月26日,迪士尼真人版《小美人鱼》将在中国内地上映,影片提供2D、3D、IMAX、CINITY等格式。日前,《小美人鱼》公布全新剧照,一头脏辫的美人鱼与王子深情对视,王子左手...
日期:04-12
三星笔记本电脑最新款2020价格「三星笔记本电脑报价及图片」
三星作为全球知名品牌,其笔记本电脑一直备受消费者追捧。随着科技的发展,三星的笔记本电脑也在不断地创新与进化,从而满足不同消费者的需求。本文将为大家介绍三星笔记本电脑的...
日期:06-01
传阿里巴巴向淡马锡融资回购雅虎所持股票
  10月10日上午消息,据知情人士透露,阿里巴巴(微博)集团(微博)已经与新加坡国有投资公司淡马锡控股展开谈判,希望通过融资回购雅虎所持的40%阿里巴巴集团股票。   知情人...
日期:07-23
四川大学回应女生曝光地铁大叔:还在调查,后续会出官方通知
6月9日,“大叔被疑偷拍自证清白后仍遭女子曝光”成为了热门话题,引起网友们的广泛热议。有网友爆料称,涉事女子是四川大学新闻学院的研究生。对于此事,四川大学研究生院研工部回...
日期:06-10
iPhone 15系列或将沿用高通基带:苹果自研5G芯片要等2025年「苹果13采用的5g基带」
早在iPhone 14系列发布之前,就有消息称苹果正在为iPhone系列自主研发5G基带芯片,但从iPhone 14系列依旧采用高通基带来看,苹果的进度并不理想。电脑快速启动和正常启动近日,根据...
日期:10-16
全国最大规模RedCap预商用验证 RedCap来了!
全国最大规模RedCap预商用验证 RedCap来了! 家里这5种家电没有必要买贵的荣耀智慧屏x1价格上涨理想汽车销量下降thinkpad x1 titanium 2022评测...
日期:05-26
诸葛智能推出客户数据管理平台“诸葛CDP 2.0”,升级诸葛io 3.0等产品「诸葛app可信吗」
3月22日消息,诸葛智能推出客户数据管理平台“诸葛CDP 2.0”、一站式用户行为分析平台“诸葛io 3.0”以及用户互动平台“诸葛CEP 2.0”,为企业数字化经营构建个性化与智能化的...
日期:03-24
手机被机器人控制了怎么办「想走出这个实验室,一台手机要被机器人“敲打”20万次」
杨净 发自 凹非寺量子位 | 公众号 QbitAI北京一个150平米的厂房里,一群装有摄像头和AI算法、可自主行动的机器人正在7*24小时不间断地运作。他们只有一个目的:“攻击”人类的...
日期:05-08