您的位置:首页 > IT热点资讯

AMD Zen4架构深入揭秘!49%性能提升从何而来?「zen4 cpu」

发布时间:2022-10-17 14:14:17  来源:互联网     背景:

AMD锐龙7000系列的性能大家都见识过了,提升幅度可能没有预想得那么猛,但依然诚意十足。锐龙9 7900X作为次旗舰,就足以碾压12代酷睿顶级灰烬版i9-12900KS。主流的锐龙5 7600X更是再次展现爆款潜质,直接让i5-12600K抬不起头来。

至于和Intel 13代酷睿究竟鹿死谁手,还要到这个月底才能见分晓了。

按照AMD的官方数据,Zen4相比于Zen3,同等性能下功耗可降低至多62%,同等功耗下性能可提升至多49%!

今天,我们就来深入了解一下Zen4架构、平台的革新之处,看看如此巨大的提升是从而来的。

一、全新的Zen4内核:前端大变、不一样的AVX-512

先从Zen架构的历史讲起

Zen4已经是AMD Zen系列架构的第四代(Zen/Zen+算作一代),对比来看它的改革、提升幅度都不是最大的,更多的是在Zen3基础上的一次深度优化增强,并在新工艺的加持下大幅提升频率,最高加速频率不但首次突破5GHz,而且跨越性地达到了5.7GHz!

对比四代架构,初代Zen的变革、提升幅度最猛(当然主要是推土机实在太弱了),Zen2是一次优化升级,尤其chiplet设计奠定未来基础,Zen3则是再一次革命性的大变,19% IPC提升也非常感人,Zen4再来个小步快跑就非常符合情理和逻辑了。

按照AMD的说法,Zen4架构的设计目标有三个方面:

amd zen4处理器

一是性能,IPC(每时钟周期指令数或同频性能)和频率提升幅度都要达到两位数(超过10%);

二是延迟,通过增大二级缓存、改进缓存有效性,大幅降低平均延迟;

三是能效,在整个TDP(热设计功耗)范围内,显著降低动态功耗。

为了达成以上目标,Zen4对整个微架构体系进行了升级优化,包括前端、执行引擎、载入/存储单元、缓存、指令集等等,后边我们会一一讲到。

整体而言,Zen4架构的核心升级点包括:改进分支预测、增大OP指令作缓存、增大指令退役队列、增大整数/浮点寄存器文件、加深核心缓冲吞吐、浮点单元支持AVX-512指令、改进载入/存储单元、增大二级缓存。

前端部分变化较大,这里包括指令缓存、分支预测、解码器、指令缓存、微指令队列等模块。

Zen4架构重点改进了分支预测部分,包括每时钟周期预测两个跳转分支、一级缓存BTB(分支目标缓冲)增大50%达到1.5K条目、二级缓存BTB扩容从6.5K略增至7K。

另外,指令缓存(Op Cache)增大了约68%达到6.75K条目,每时钟周期可以完成多达9个宏指令(增加1个)。

不变的则是解码器每时钟周期发出4条指令、微指令队列每时钟周期分派6个整数+浮点指令。

执行引擎部分变化较小,尤其是每时钟周期10次整数、6次浮点的指令分派保持不变。

指令退役队列或者说ROB(重排序缓冲)从256条目增大25%至320条目,整数寄存器从192个增至224个,浮点寄存器从160个增至192个,缓存与核心之间的吞吐能力也提升了。

载入/存储单元部分,载入队列从72个增大至88个(22%),存储队列维持64个不变,二级缓存DTLB(数据页表缓冲)从2K条目增大了多达50%至3K条目,另外还减少了数据缓存端口的冲突几率。

也许有同学会问,很多模块都是不断增大、再增大,为什么不一步到位,从设计之初就做个大容量呢?

一方面,谁也无法精准预测每个模块多大容量下效率最好,而且不同模块之间需要彼此协调配合;

另一方面,更大容量意味着更多晶体管、更大核心面积、更高功耗、更高成本,需要在性能、能效之间做出妥协、寻求平衡。

amd架构zen3

缓存体系也做了优化,尤其是二级缓存,不但容量翻了一番,每核心来到1MB,还提升了速度。

同时,从二级缓存到三级缓存、从三级缓存到内存,都支持更多命中失败(outstanding miss),可以减少流水线的停顿,增加缓存回填带宽,提升整体效率。

不过整体缓存架构没变,一级缓存依然是32KB+32KB的每核心容量组合,三级缓存则继续每8个核心一组共享32MB。

AVX-512指令集或许是大家对Zen4最感兴趣的地方之一,毕竟在以往这是Intel处理器的专属技术,而且争议非常大,有人觉得它非常有用,有人觉得它只是徒增功耗,甚至成为极限烤机专用

Zen4支持的AVX-512并非直接将Intel那套技术照搬过来(也不允许),而是选择了不一样的实现方式。

Intel处理器执行AVX-512指令时,是完整的512-bit通道(这也是该指令集命名的来源),但是AMD走的是256-bit通道,也就是砍了一半,因此遇到512-bit的指令就需要拆分成两个256-bit指令来执行。

事实上,AMD推土机家族、Zen家族在执行AVX-2 256-bit指令的时候,也是拆分成两个128-bit。这都是一脉相承的

AMD表示,这么做可以节省芯片面积,并且避免执行AVX-512指令时发热过大、频率下降的情况出现(峰值性能确有轻微损失),因为真正长达512-bit的指令并不多,就像以前256-bit的指令不够多。

Zen4支持的AVX-512指令一览并不是把Intel的全都搬了过来,而是选择性地加入,除了一些基础指令,特别值得注意的是用于AI加速的VNNI、BF16,这也是Intel之前宣传的重点。

VNNI是面向AI模型推理的矢量指令,可将多个8-bit或16-bit整数串联成512-bit,提升卷积神经网络常用的MAC(乘法累加)的速度。

另一个是BF16,面向AI加速,将双精度浮点FP32中的23位小数减少到7位,并保留1位符号、8位指数,结果与FP32相比范围相同,只是精度较差,但仍远高于单精度FP16。

ipad五代2017款

按照AMD的说法,加入AVX-512指令集后,Zen4架构的FP32浮点推理多线程性能可提升1.31倍,VNNI INT8整数推理多线程性能可提升2.47倍!

另外,Zen4还增加了一些虚拟化、安全性方面的新指令,就不赘述了。

以上是Zen4、Zen3的具体变化对比,可以看到其中不少都维持不变,其他很多则只是数量/容量上的扩充,因此说Zen4就是个放大优化版的Zen3也没什么毛病。

值得注意的是,Zen4二级缓存、三级缓存的延迟甚至还略微加大了。

AMD宣称,Zen4 IPC平均提升了13%,这是在固定4GHz八核心情况下,通过22个项目对比Zen3得出的几何平均结果。

当然不同项目的变化幅度差异很大,比如说CPU-Z单线程只提升了1%(所以这个测试项目跑分变化不大),寒霜引擎游戏、《GTA V》、PUBG吃鸡、CineBench R23单线程这些项目提升也有限。

wPrime 1024M是变化最大的提升幅度达惊人的39%,另外像是Dolphin Web测试和《看门狗:军团》、《F1 2022》、《杀出重围:人类分裂》、《地铁:离去》等游戏的提升也很喜人。

13%的提升进一步划分,可以看到前端架构改进带来的提升幅度最大,其次是载入/存储单元、分支预测单元,而来自执行引擎、二级缓存的贡献相对较小。

这和前边架构分析的变化幅度是相符合的。

IPC提升之外,锐龙7000系列的频率也达到了前所未有的高度,旗舰锐龙9 7950X最高可以加速到5.7GHz(还有个5.85GHz fMax频率但官方一直保持缄默)。

当然,5.7GHz的频率只有单核心加速可以做到,AMD也公布了锐龙9 7950X在不同核心/线程下的最高加速频率,可以看到2核心可以到5.6GHz,8核心可以接近5.4GHz,16核心全开也能到5.2GHz。

13% IPC提升,加上频率拉到最高5.7GHz,锐龙7000的单线程性能提高了最多29%。

一个很容易被忽略的点,就是锐龙7000系列支持Eco模式,运行在更低的TDP,比如170W的可以低至105W或者65W,105W的可以低至65W。

AMD宣称,锐龙9 7950X 65W Eco模式下的性能,依然可以超过正常的锐龙9 5950X。

Eco模式未来会集成在主板BIOS的超频模块,可一键开启,还会集成在锐龙Master软件中。

有趣的是,得益于新的架构和工艺,Zen4单个核心加二级缓存总面积仅为3.84平方毫米,相比于Intel 7工艺的12代酷睿的7.46平方毫米,小了几乎一半,能效则高了几乎一半。


返回网站首页

本文评论
小鹏汽车市值超百度_哔哩哔哩收涨近30%,小鹏汽车涨超26%,京东健康涨超15%
查看最新行情 大流量卡的骗局泡泡玛特盲盒一整盒没有重复么  香港恒生指数收涨4.51%,恒生科技指数涨9.27%,大型科技股普涨,互联网医疗、汽车...
日期:12-12
轻松斩获全渠道八冠王!OPPO Watch 3系列今日首销「oppo watch销量」
8月19日0点,OPPO Watch3系列正式开启首销,OPPO Watch3首销日到手价为1499元起,OPPO Watch3Pro首销日到手价为1899元起。开售仅36分钟后,OPPO Watch3系列销售额就超过了OPPO Watc...
日期:08-20
知情人士:吉利“雷神动力”电混车型四季度产能或将实现单月3万辆
  记者从知情人士处获悉,吉利汽车旗下“雷神动力”电混车型产能今年四季度或实现单月3万辆,明年第二季度产能预计达到单月6万辆。数据显示,8月,吉利汽车新能源汽车销量37500辆...
日期:09-08
中国移动开发5G潮汐智能天线:哪里人多就指向哪_5g手机天线数量
大学校园内,学生人群会出现明显的时空潮汐效应,也就是学生位置在特定时间存在规律性迁移:白天去教学楼、晚上回宿舍。近日,针对北京邮电大学内教学楼、宿舍楼、餐厅等场景的时空...
日期:09-26
苹果证实iOS 16等要大量推送广告 原因不可抗拒_苹果手机总是推送广告
小米等安卓手机厂商看到这一幕后,估计都笑了,成熟的商业模式苹果怎么会高傲的看不上?据外媒最新报道,苹果计划扩大其广告业务,这将使其在大幅提高收入的同时,与社交媒体巨头发生正...
日期:08-16
雷军晒Redmi K50版屏幕参数:高画质与低功耗的平衡_REDMI K50
据Redmi红米手机官方不久前宣布,全新的RedmiK50宇宙终极大作将命名为RedmiK50至尊版,并将于8月11日也就是今天正式与大家见面,目前已在多个平台开启预约,不出意外的话,该机将是“...
日期:08-11
iPhone 15依旧采用叹号屏 果粉:13还能再用「iphone13为什么信息有感叹号」
中关村在线消息:iPhone 14系列已经正式发布了,关于新机的叹号屏众说纷纭。今日据爆料称,苹果计划将灵动岛扩展到明年发布的所有四款iPhone 15机型,也就是今年不喜欢灵动岛的朋友...
日期:09-19
郭明錤:14/16吋MacBook Pro所用M2芯片仍为5nm工艺_有必要等m2芯片mac
天风证券知名分析师郭明錤老师表示,苹果即将到来的 14 英寸和 16 英寸 MacBook Pro 将会在今年第 4 季度投入量产,所配备的 M2 芯片将会使用 5nm 生产工艺。在本周一发布的推...
日期:08-23
同程旅行:机票和火车票搜索量同比涨680%和540%,上海成最热门出发地
  讯 12月14日下午消息,同程旅行方面表示,自二十条和“新十条”发布以来,铁路和民航客运运力迅速回升,截至12月13日,机票火车票搜索热度、订单量双双大幅上扬。  平台机票搜...
日期:12-14
苹果为了环保不配充电器_“环保”的代价?苹果因iPhone不附带充电器再被巴西罚款1900万美元
你在哪里我都能找到你  讯 北京时间10月14日早间消息,据报道,巴西一家法院周四决定对苹果公司罚款1亿雷亚尔(约合1900万美元),并裁决该公司在巴西出售新iPhone时必须附带充电器...
日期:10-27
ODC22开发者大会:OPPO生态域体验仓究竟能干啥?(视频)
  上周,OPPO、上汽集团以及上汽零束发布机跨端融合解决方案“生态域”。今天@我是郭晓光 在ODC22大会期间坐进了去体验了一下。汉王科技副总裁中国5g普及情况看母猪肉能吃...
日期:08-31
iPhone 14立减1230元 入手只要4769元_iphone12价格会降么
iPhone14系列已经发布一个多月,虽然在首发当天就破发,但是现在双11已经走到了历史的最低价,现在立减1230元,已经比苹果官网优惠了太多,而且比较好抢购,剩余的数量不多,今年的双11苹...
日期:11-07
彭博社:印度考虑限制中企在印销售千元以下手机
【文/观察者网 齐倩】彭博社8月8日援引消息称,印度为扶植本地企业,正试图限制中国智能手机制造商在印销售价格低于1.2万卢比(约合1000元人民币)的手机。报道称,如若成真,或对部分...
日期:08-10
iPhone 14 Pro或支持30W快充:仅比上代快3W_iphone13pro支持20w快充吗
8月30日消息,据数码博主DuanRui消息,某充电品牌正在向苹果寄送30W充电器,似乎是为将要推出的iPhone 14 Pro系列所准备。诺基亚9pureview拍照评测苹果这几年在充电功率上下了功...
日期:08-31
上海一蔚来汽车周三傍晚从3楼掉落,两名试车员不幸去世「上海 蔚来 事故」
(原标题:蔚来客服回应测试车坠楼事故确有此事,消防救援站称已造成一死一伤) 上海创新港蔚来总部疑一辆...
日期:08-29
马斯克:若推特被谷歌苹果下架 将生产属于自己的智能手机_马斯克与推特ceo
11月26日消息,据国外媒体报道,马斯克在推特回复网友称,如果谷歌和苹果将推特从应用商店中移除,他将生产一款自己的智能手机作为替代品。oppo findx2测评马拉松半程马拉松据悉,该...
日期:11-27
三星s21放弃曲面屏_Galaxy S23 Ultra可能放弃曲面显示屏而选择平面部件
如果一切按计划进行,那么Galaxy S23系列将在2023年初面世。当然,三星刚刚发布了Galaxy Z Flip和Z Fold设备,但这并不意味着该公司不关注Galaxy S23 Ultra和其他设备。可以说,到...
日期:08-30
iPhone 15要改名字 Pro Max型号或绝版「iphone 12 pro max 手机型号后缀ZA」
中关村在线消息:据彭博社记者Mark Gurman报道称,明年发布的iPhone 15系列或将取消Pro Max型号,取代它的是全新型号Ultra,这或许证明下一代旗舰iPhone手机或将有较大升级。刚刚发...
日期:09-14
苹果放弃iPhone 14增产计划:随后蒸发7000亿「苹果12什么时候投入量产」
由于iPhone 14的用户实际需求明显低于预期,苹果在今晨已经放弃了iPhone 14以及在售款iPhone的等产品的增产计划,将会维持此前原计划的节奏继续量产,目前截止年底将会生产9000万...
日期:09-30
X80 Pro+不会有了vivo下款旗舰就是X90_vivo手机x80pro+
有消息称vivo 的X80系列没有X80Pro+,下一代旗舰直接上X90系列。此前vivo韩伯啸就表示,X80是X70Pro的升级版,X80Pro是X70Pro+的升级版。该机首发起售价3699元,上市后开卖火爆。在...
日期:09-01