您的位置:首页 > IT热点资讯

AMD Zen4架构深入揭秘!49%性能提升从何而来?_amd的zen4架构

发布时间:2022-10-23 14:24:38  来源:互联网     背景:

AMD锐龙7000系列的性能大家都见识过了,提升幅度可能没有预想得那么猛,但依然诚意十足。锐龙9 7900X作为次旗舰,就足以碾压12代酷睿顶级灰烬版i9-12900KS。主流的锐龙5 7600X更是再次展现爆款潜质,直接让i5-12600K抬不起头来。

至于和Intel 13代酷睿究竟鹿死谁手,还要到这个月底才能见分晓了。

按照AMD的官方数据,Zen4相比于Zen3,同等性能下功耗可降低至多62%,同等功耗下性能可提升至多49%!

今天,我们就来深入了解一下Zen4架构、平台的革新之处,看看如此巨大的提升是从而来的。

一、全新的Zen4内核:前端大变、不一样的AVX-512

先从Zen架构的历史讲起

Zen4已经是AMD Zen系列架构的第四代(Zen/Zen+算作一代),对比来看它的改革、提升幅度都不是最大的,更多的是在Zen3基础上的一次深度优化增强,并在新工艺的加持下大幅提升频率,最高加速频率不但首次突破5GHz,而且跨越性地达到了5.7GHz!

对比四代架构,初代Zen的变革、提升幅度最猛(当然主要是推土机实在太弱了),Zen2是一次优化升级,尤其chiplet设计奠定未来基础,Zen3则是再一次革命性的大变,19% IPC提升也非常感人,Zen4再来个小步快跑就非常符合情理和逻辑了。

按照AMD的说法,Zen4架构的设计目标有三个方面:

一是性能,IPC(每时钟周期指令数或同频性能)和频率提升幅度都要达到两位数(超过10%);

二是延迟,通过增大二级缓存、改进缓存有效性,大幅降低平均延迟;

三是能效,在整个TDP(热设计功耗)范围内,显著降低动态功耗。

为了达成以上目标,Zen4对整个微架构体系进行了升级优化,包括前端、执行引擎、载入/存储单元、缓存、指令集等等,后边我们会一一讲到。

整体而言,Zen4架构的核心升级点包括:改进分支预测、增大OP指令作缓存、增大指令退役队列、增大整数/浮点寄存器文件、加深核心缓冲吞吐、浮点单元支持AVX-512指令、改进载入/存储单元、增大二级缓存。

前端部分变化较大,这里包括指令缓存、分支预测、解码器、指令缓存、微指令队列等模块。

马斯克在推特上推的币

Zen4架构重点改进了分支预测部分,包括每时钟周期预测两个跳转分支、一级缓存BTB(分支目标缓冲)增大50%达到1.5K条目、二级缓存BTB扩容从6.5K略增至7K。

另外,指令缓存(Op Cache)增大了约68%达到6.75K条目,每时钟周期可以完成多达9个宏指令(增加1个)。

不变的则是解码器每时钟周期发出4条指令、微指令队列每时钟周期分派6个整数+浮点指令。

执行引擎部分变化较小,尤其是每时钟周期10次整数、6次浮点的指令分派保持不变。

指令退役队列或者说ROB(重排序缓冲)从256条目增大25%至320条目,整数寄存器从192个增至224个,浮点寄存器从160个增至192个,缓存与核心之间的吞吐能力也提升了。

载入/存储单元部分,载入队列从72个增大至88个(22%),存储队列维持64个不变,二级缓存DTLB(数据页表缓冲)从2K条目增大了多达50%至3K条目,另外还减少了数据缓存端口的冲突几率。

amd处理器架构zen3

也许有同学会问,很多模块都是不断增大、再增大,为什么不一步到位,从设计之初就做个大容量呢?

一方面,谁也无法精准预测每个模块多大容量下效率最好,而且不同模块之间需要彼此协调配合;

另一方面,更大容量意味着更多晶体管、更大核心面积、更高功耗、更高成本,需要在性能、能效之间做出妥协、寻求平衡。

缓存体系也做了优化,尤其是二级缓存,不但容量翻了一番,每核心来到1MB,还提升了速度。

同时,从二级缓存到三级缓存、从三级缓存到内存,都支持更多命中失败(outstanding miss),可以减少流水线的停顿,增加缓存回填带宽,提升整体效率。

不过整体缓存架构没变,一级缓存依然是32KB+32KB的每核心容量组合,三级缓存则继续每8个核心一组共享32MB。

AVX-512指令集或许是大家对Zen4最感兴趣的地方之一,毕竟在以往这是Intel处理器的专属技术,而且争议非常大,有人觉得它非常有用,有人觉得它只是徒增功耗,甚至成为极限烤机专用

Zen4支持的AVX-512并非直接将Intel那套技术照搬过来(也不允许),而是选择了不一样的实现方式。

Intel处理器执行AVX-512指令时,是完整的512-bit通道(这也是该指令集命名的来源),但是AMD走的是256-bit通道,也就是砍了一半,因此遇到512-bit的指令就需要拆分成两个256-bit指令来执行。

事实上,AMD推土机家族、Zen家族在执行AVX-2 256-bit指令的时候,也是拆分成两个128-bit。这都是一脉相承的

AMD表示,这么做可以节省芯片面积,并且避免执行AVX-512指令时发热过大、频率下降的情况出现(峰值性能确有轻微损失),因为真正长达512-bit的指令并不多,就像以前256-bit的指令不够多。

Zen4支持的AVX-512指令一览并不是把Intel的全都搬了过来,而是选择性地加入,除了一些基础指令,特别值得注意的是用于AI加速的VNNI、BF16,这也是Intel之前宣传的重点。

VNNI是面向AI模型推理的矢量指令,可将多个8-bit或16-bit整数串联成512-bit,提升卷积神经网络常用的MAC(乘法累加)的速度。

另一个是BF16,面向AI加速,将双精度浮点FP32中的23位小数减少到7位,并保留1位符号、8位指数,结果与FP32相比范围相同,只是精度较差,但仍远高于单精度FP16。

按照AMD的说法,加入AVX-512指令集后,Zen4架构的FP32浮点推理多线程性能可提升1.31倍,VNNI INT8整数推理多线程性能可提升2.47倍!

另外,Zen4还增加了一些虚拟化、安全性方面的新指令,就不赘述了。

以上是Zen4、Zen3的具体变化对比,可以看到其中不少都维持不变,其他很多则只是数量/容量上的扩充,因此说Zen4就是个放大优化版的Zen3也没什么毛病。

值得注意的是,Zen4二级缓存、三级缓存的延迟甚至还略微加大了。

AMD宣称,Zen4 IPC平均提升了13%,这是在固定4GHz八核心情况下,通过22个项目对比Zen3得出的几何平均结果。

amd的zen4架构

当然不同项目的变化幅度差异很大,比如说CPU-Z单线程只提升了1%(所以这个测试项目跑分变化不大),寒霜引擎游戏、《GTA V》、PUBG吃鸡、CineBench R23单线程这些项目提升也有限。

wPrime 1024M是变化最大的提升幅度达惊人的39%,另外像是Dolphin Web测试和《看门狗:军团》、《F1 2022》、《杀出重围:人类分裂》、《地铁:离去》等游戏的提升也很喜人。

13%的提升进一步划分,可以看到前端架构改进带来的提升幅度最大,其次是载入/存储单元、分支预测单元,而来自执行引擎、二级缓存的贡献相对较小。

这和前边架构分析的变化幅度是相符合的。

IPC提升之外,锐龙7000系列的频率也达到了前所未有的高度,旗舰锐龙9 7950X最高可以加速到5.7GHz(还有个5.85GHz fMax频率但官方一直保持缄默)。

当然,5.7GHz的频率只有单核心加速可以做到,AMD也公布了锐龙9 7950X在不同核心/线程下的最高加速频率,可以看到2核心可以到5.6GHz,8核心可以接近5.4GHz,16核心全开也能到5.2GHz。

13% IPC提升,加上频率拉到最高5.7GHz,锐龙7000的单线程性能提高了最多29%。

一个很容易被忽略的点,就是锐龙7000系列支持Eco模式,运行在更低的TDP,比如170W的可以低至105W或者65W,105W的可以低至65W。

AMD宣称,锐龙9 7950X 65W Eco模式下的性能,依然可以超过正常的锐龙9 5950X。

amd zen4 cpu

Eco模式未来会集成在主板BIOS的超频模块,可一键开启,还会集成在锐龙Master软件中。

有趣的是,得益于新的架构和工艺,Zen4单个核心加二级缓存总面积仅为3.84平方毫米,相比于Intel 7工艺的12代酷睿的7.46平方毫米,小了几乎一半,能效则高了几乎一半。


返回网站首页

本文评论
手机入殓师,年入百万元_入殓师 两万一个月
  撰文/张继康  编辑/李原  1996年出生的林西是一位有3年拆解经验的“手机入殓师”。她的工作是为旧手机完成一场“赛博”仪式的告别。  2021年暑假,一位年轻的用户...
日期:10-15
折叠、展开、旋停 三星Galaxy Z Fold4重塑智能手机体验_三星z fold3折叠手机
从2019年三星推出Galaxy Fold以来,折叠屏手机已经成长为智能手机市场中最具活力的品类。如今,折叠屏手机新品层出不穷,但仔细观察却不难看出,这些产品虽然都有着可折叠的机身,但...
日期:09-14
工信部发展5G_工信部:持续推动5G、数据中心节能降耗
在工信部今天举行的“新时代工业和信息化发展”线上发布会上,工信部信息通信发展司负责人表示,“十三五”期间单位电信业务量综合能耗年均降幅超过20%,未来将进一步积极推动信...
日期:08-20
iPhone14就只涨200元!全系取消128GB标配256GB_iphonex扩容256能升ios14
中关村在线消息:8月11日,据相关爆料,预计iPhone14系列全系售价均会上涨1000,iPhone14 Pro国行预计售价8999元起步,iPhone 14 Pro Max预计售价9999元起步,顶配1TB版的iPhone 14 Pro...
日期:08-13
“孩子脾气挺大 肯定遗传妈妈”?优普爱湿巾广告惹争议
  近日,辽宁大连一位网友发视频称,优普爱的一款湿巾广告词写着“孩子脾气挺大,肯定遗传妈妈”,引发网友热议。  对此,该品牌客服人员称,这款产品2月份已经下架,目前公司正积极...
日期:09-01
特斯拉中国9月交付超8.3万辆,再创月度交付新高_特斯拉上半年销量
  10月9日,据特斯拉中国消息,9月特斯拉交付量超过8.3万辆,再次创下月度交付的新纪录。特斯拉2022发布新车700公里  乘联会数据显示,今年1-8月,特斯拉上海工厂已经完成近40万...
日期:10-12
辨识度拉满!华为P60渲染图出炉:极为大胆的后摄模组「华为p60概念图曝光」
  新酷产品第一时间免费试玩,还有众多优质达人分享独到生活经验,快来新浪众测,体验各领域最前沿、最有趣、最好玩的产品吧~!下载客户端还能获得专享福利哦!iphone 14或延迟发布...
日期:12-29
首批配备更快的Wi-Fi 7的智能手机最早将于2024年推出
9月21日消息:根据DigiTimes的一份新报告,首批支持Wi-Fi7的智能手机可能最早在2024年下半年开始面世,该报告引用了IC后端公司和检验实验室的数据。Wi-Fi7能够使用320MHz信道,它...
日期:09-23
余承东发话了:华为Mate 50紧急补货 让大家能原价买_余承东华为mate40发布会
在本周,华为Mate 50系列正式开始销售,但离谱的是,开售的当天仅仅几分钟,首批大约400万台全系华为Mate 50就已经被抢购一空,最终官方数据表示,3款型号最终在首销不到10秒钟就全部售...
日期:09-26
iPhone SE4将代替iPhone mini,或搭载全面屏OLED屏幕_iPhone第几代用oled屏
中关村在线消息:近日,根据知名显示器分析师Ross Young称,苹果还没有确定计划在2024年发布的iPhone SE4的显示尺寸,并且显示屏材质也没有确定。目前,苹果开始考虑两家供应商的6.1...
日期:11-08
手机入殓师年入百万元一_手机入殓师,年入百万元
  撰文/张继康  编辑/李原  1996年出生的林西是一位有3年拆解经验的“手机入殓师”。她的工作是为旧手机完成一场“赛博”仪式的告别。  2021年暑假,一位年轻的用户...
日期:10-06
原来iPhone自带防偷窥功能:适用于手机所有界面 再也不怕别人乱翻微信、相册
近日,一则#原来iPhone自带防偷窥功能#的话题登上微博热搜,引发网友热议。不少人感慨:这样的功能我怎么才知道”这么多年苹果算是白用了”。相信很多人都遇到过这样的场景:给家人...
日期:09-11
个性当道,三星Lifestyle系列电视自成一派
随着90后、Z世代成为新的消费主力,人们对于家电产品的需求也发生了翻天覆地的变化。个性、颜值、附加值等逐渐成为用户最关注的因素,不一样的趣味体验更是成为消费的源动力。...
日期:08-19
goosegooseduck鹅鸭杀收不到邮箱、验证失败、邮箱验证打不开、注册邮箱无法验证解决方法
《鹅鸭杀/鹅鹅鸭/鹅人杀(Goose Goose Duck)》是一款团队合作类游戏,游戏类似狼人杀,鹅玩家需要一起完成任务,还需要注意鸭玩家的破坏。但有很多玩家在注册游戏账号过程中遇到收...
日期:12-22
7nm锐龙4000处理器_AMD加快优化锐龙7000处理器:DDR5内存有惊喜
按照之前的爆料,AMD将在9月15日上市锐龙7000处理器,这一代升级了5nm Zen4架构,IPC性能提升8-10%,加速频率可达5.5GHz以上,同时还升级了AM5平台,支持DDR5及PCIe 5.0等新技术。距离...
日期:08-11
中兴Axon 30S全面屏手机今天正式发售:首发1698元「全新一代屏下摄像手机中兴Axon 30 5G发布」
9月26日消息,今天中兴新款屏下摄像手机:中兴Axon 30S正式开售。采用6.92英寸真全面屏,无刘海无挖孔,支持120Hz刷新率,屏幕素质不错。同时搭载高通骁龙870芯片,长时间使用也不易发...
日期:09-27
人工智能芯片公司地平线据悉考虑筹集1亿至2亿美元新资金_地平线机器人融资情况
讯 北京时间8月18日下午消息,据报道,人工智能芯片初创企业地平线正考虑筹集1亿至2亿美元新资金。   知情人士说,拥有英特尔支持的这家公司正在在顾问机构帮助之下,评估投资者...
日期:08-19
受欧盟法律逼迫 苹果将允许外部应用商店登陆iPhone_苹果应用商店允许第三方
凤凰网科技讯 北京时间12月14日消息,为了在2024年满足欧盟的严格法律要求,苹果公司准备对其业务进行大范围调整,其中一项就是准备允许其他应用商店登陆iPhone和iPad。matestati...
日期:12-14
苹果13出来二手12会降价吗_iPhone 14二手贬值速度是iPhone 13两倍
  中关村在线消息:近日,根据国内科技媒体报道iPhone14系列在国内二手市场的贬值速度是iPhone 13两倍,该媒体认为这一现象的出现是因为iPhone 14和iPhone 14 Plus尚未达到苹果...
日期:10-27
DigiTimes:苹果 iPhone14 供应商在上市前对需求存在不确定性
8月12日消息:据供应链消息人士向DigiTimes透露,即将推出的iPhone14的供应商据说对苹果即将推出的旗舰产品的需求有多大感到不确定。即将将发布的付费完整报道的预览说,「第四...
日期:08-13