您的位置:首页 > IT热点资讯

amd zen4 5nm_AMD Zen4架构深入揭秘!49%性能提升从何而来?

发布时间:2022-10-18 14:08:00  来源:互联网     背景:

AMD锐龙7000系列的性能大家都见识过了,提升幅度可能没有预想得那么猛,但依然诚意十足。锐龙9 7900X作为次旗舰,就足以碾压12代酷睿顶级灰烬版i9-12900KS。主流的锐龙5 7600X更是再次展现爆款潜质,直接让i5-12600K抬不起头来。

amd zen4 cpu

至于和Intel 13代酷睿究竟鹿死谁手,还要到这个月底才能见分晓了。

按照AMD的官方数据,Zen4相比于Zen3,同等性能下功耗可降低至多62%,同等功耗下性能可提升至多49%!

今天,我们就来深入了解一下Zen4架构、平台的革新之处,看看如此巨大的提升是从而来的。

一、全新的Zen4内核:前端大变、不一样的AVX-512

扎克伯格投资元宇宙

先从Zen架构的历史讲起

高投入、高增长,拼多多三季度持续“烧钱”引流量

Zen4已经是AMD Zen系列架构的第四代(Zen/Zen+算作一代),对比来看它的改革、提升幅度都不是最大的,更多的是在Zen3基础上的一次深度优化增强,并在新工艺的加持下大幅提升频率,最高加速频率不但首次突破5GHz,而且跨越性地达到了5.7GHz!

对比四代架构,初代Zen的变革、提升幅度最猛(当然主要是推土机实在太弱了),Zen2是一次优化升级,尤其chiplet设计奠定未来基础,Zen3则是再一次革命性的大变,19% IPC提升也非常感人,Zen4再来个小步快跑就非常符合情理和逻辑了。

按照AMD的说法,Zen4架构的设计目标有三个方面:

一是性能,IPC(每时钟周期指令数或同频性能)和频率提升幅度都要达到两位数(超过10%);

二是延迟,通过增大二级缓存、改进缓存有效性,大幅降低平均延迟;

三是能效,在整个TDP(热设计功耗)范围内,显著降低动态功耗。

为了达成以上目标,Zen4对整个微架构体系进行了升级优化,包括前端、执行引擎、载入/存储单元、缓存、指令集等等,后边我们会一一讲到。

整体而言,Zen4架构的核心升级点包括:改进分支预测、增大OP指令作缓存、增大指令退役队列、增大整数/浮点寄存器文件、加深核心缓冲吞吐、浮点单元支持AVX-512指令、改进载入/存储单元、增大二级缓存。

前端部分变化较大,这里包括指令缓存、分支预测、解码器、指令缓存、微指令队列等模块。

Zen4架构重点改进了分支预测部分,包括每时钟周期预测两个跳转分支、一级缓存BTB(分支目标缓冲)增大50%达到1.5K条目、二级缓存BTB扩容从6.5K略增至7K。

另外,指令缓存(Op Cache)增大了约68%达到6.75K条目,每时钟周期可以完成多达9个宏指令(增加1个)。

不变的则是解码器每时钟周期发出4条指令、微指令队列每时钟周期分派6个整数+浮点指令。

执行引擎部分变化较小,尤其是每时钟周期10次整数、6次浮点的指令分派保持不变。

指令退役队列或者说ROB(重排序缓冲)从256条目增大25%至320条目,整数寄存器从192个增至224个,浮点寄存器从160个增至192个,缓存与核心之间的吞吐能力也提升了。

载入/存储单元部分,载入队列从72个增大至88个(22%),存储队列维持64个不变,二级缓存DTLB(数据页表缓冲)从2K条目增大了多达50%至3K条目,另外还减少了数据缓存端口的冲突几率。

也许有同学会问,很多模块都是不断增大、再增大,为什么不一步到位,从设计之初就做个大容量呢?

一方面,谁也无法精准预测每个模块多大容量下效率最好,而且不同模块之间需要彼此协调配合;

另一方面,更大容量意味着更多晶体管、更大核心面积、更高功耗、更高成本,需要在性能、能效之间做出妥协、寻求平衡。

缓存体系也做了优化,尤其是二级缓存,不但容量翻了一番,每核心来到1MB,还提升了速度。

同时,从二级缓存到三级缓存、从三级缓存到内存,都支持更多命中失败(outstanding miss),可以减少流水线的停顿,增加缓存回填带宽,提升整体效率。

不过整体缓存架构没变,一级缓存依然是32KB+32KB的每核心容量组合,三级缓存则继续每8个核心一组共享32MB。

AVX-512指令集或许是大家对Zen4最感兴趣的地方之一,毕竟在以往这是Intel处理器的专属技术,而且争议非常大,有人觉得它非常有用,有人觉得它只是徒增功耗,甚至成为极限烤机专用

Zen4支持的AVX-512并非直接将Intel那套技术照搬过来(也不允许),而是选择了不一样的实现方式。

Intel处理器执行AVX-512指令时,是完整的512-bit通道(这也是该指令集命名的来源),但是AMD走的是256-bit通道,也就是砍了一半,因此遇到512-bit的指令就需要拆分成两个256-bit指令来执行。

事实上,AMD推土机家族、Zen家族在执行AVX-2 256-bit指令的时候,也是拆分成两个128-bit。这都是一脉相承的

amd zen4 cpu

AMD表示,这么做可以节省芯片面积,并且避免执行AVX-512指令时发热过大、频率下降的情况出现(峰值性能确有轻微损失),因为真正长达512-bit的指令并不多,就像以前256-bit的指令不够多。

Zen4支持的AVX-512指令一览并不是把Intel的全都搬了过来,而是选择性地加入,除了一些基础指令,特别值得注意的是用于AI加速的VNNI、BF16,这也是Intel之前宣传的重点。

VNNI是面向AI模型推理的矢量指令,可将多个8-bit或16-bit整数串联成512-bit,提升卷积神经网络常用的MAC(乘法累加)的速度。

另一个是BF16,面向AI加速,将双精度浮点FP32中的23位小数减少到7位,并保留1位符号、8位指数,结果与FP32相比范围相同,只是精度较差,但仍远高于单精度FP16。

按照AMD的说法,加入AVX-512指令集后,Zen4架构的FP32浮点推理多线程性能可提升1.31倍,VNNI INT8整数推理多线程性能可提升2.47倍!

另外,Zen4还增加了一些虚拟化、安全性方面的新指令,就不赘述了。

以上是Zen4、Zen3的具体变化对比,可以看到其中不少都维持不变,其他很多则只是数量/容量上的扩充,因此说Zen4就是个放大优化版的Zen3也没什么毛病。

值得注意的是,Zen4二级缓存、三级缓存的延迟甚至还略微加大了。

AMD宣称,Zen4 IPC平均提升了13%,这是在固定4GHz八核心情况下,通过22个项目对比Zen3得出的几何平均结果。

当然不同项目的变化幅度差异很大,比如说CPU-Z单线程只提升了1%(所以这个测试项目跑分变化不大),寒霜引擎游戏、《GTA V》、PUBG吃鸡、CineBench R23单线程这些项目提升也有限。

wPrime 1024M是变化最大的提升幅度达惊人的39%,另外像是Dolphin Web测试和《看门狗:军团》、《F1 2022》、《杀出重围:人类分裂》、《地铁:离去》等游戏的提升也很喜人。

13%的提升进一步划分,可以看到前端架构改进带来的提升幅度最大,其次是载入/存储单元、分支预测单元,而来自执行引擎、二级缓存的贡献相对较小。

这和前边架构分析的变化幅度是相符合的。

IPC提升之外,锐龙7000系列的频率也达到了前所未有的高度,旗舰锐龙9 7950X最高可以加速到5.7GHz(还有个5.85GHz fMax频率但官方一直保持缄默)。

当然,5.7GHz的频率只有单核心加速可以做到,AMD也公布了锐龙9 7950X在不同核心/线程下的最高加速频率,可以看到2核心可以到5.6GHz,8核心可以接近5.4GHz,16核心全开也能到5.2GHz。

13% IPC提升,加上频率拉到最高5.7GHz,锐龙7000的单线程性能提高了最多29%。

为什么电影国庆高票房

一个很容易被忽略的点,就是锐龙7000系列支持Eco模式,运行在更低的TDP,比如170W的可以低至105W或者65W,105W的可以低至65W。

AMD宣称,锐龙9 7950X 65W Eco模式下的性能,依然可以超过正常的锐龙9 5950X。

Eco模式未来会集成在主板BIOS的超频模块,可一键开启,还会集成在锐龙Master软件中。

有趣的是,得益于新的架构和工艺,Zen4单个核心加二级缓存总面积仅为3.84平方毫米,相比于Intel 7工艺的12代酷睿的7.46平方毫米,小了几乎一半,能效则高了几乎一半。

华为手机挑战苹果案例分析市场营销


返回网站首页

本文评论
苹果iOS 16已支持检测假冒AirPods,iPhone弹窗提醒不要连接_iPhone检测不到airpods
  IT之家9月13日消息,从;iOS16开始,如果苹果用户尝试将假冒的AirPods连接到iPhone,就可能会在iPhone上看到“无法验证AirPods”的警报,苹果今日在官网支持页面公布了这一消息,...
日期:09-14
小米磁吸充电宝开始预约:199元 苹果iPhone 13/12专用_小米无线充电宝苹果12
9月13日消息,今天小米磁吸无线充电宝开始预约,9月16日和苹果iPhone 14同天发售。这款磁吸充电宝转为苹果iPhone 13/iPhone 12设计,售价199元。不想有太多充电线的小伙伴可以入...
日期:09-14
iPhone mini有继任者了:搭载A17明年见「苹果mini7」
iPhone 14砍掉mini版本,并不意味着苹果要放弃小屏手机了,据相关爆料,iPhone SE4的外观设计已经曝光。iPhone SE4采用了iPhone XR的外观设计,不过刘海会更小。2020粤港澳大湾区生...
日期:09-03
9月25号官网下单iphone13pro max什么时候发货?_曝iPhone 14 Pro Max将9999起 9月16日发货
Phone14已经官宣,将在9月8日发布,而此次发布后1周就将迎来首销,现在产业链曝光了iPhone14 Pro Max售价,图片显示iPhone14 Pro Max拥有石墨色、金色、银色和紫色四种配色,128G售价...
日期:09-03
联想拯救者Y730_联想拯救者Y70旗舰手机发布:骁龙8+性能野兽
今晚(8月18日),联想拯救者Y70高性能手机发布。外形方面,采用Legion家族设计,机身厚度只有7.99mm,可能是市面上最薄的骁龙8+手机。用料方面,航空铝金属中框,拉丝工艺,视觉硬朗,手感圆润...
日期:08-19
真就这么火?华为AITO问界M5 EV订单量突破30000辆
  [智车派新闻]9月6日下午,在全场景秋季新品发布会上,华为发布了AITO问界M5;EV。作为问界系列的首款纯电车型,新车定位纯电中型SUV,全系共提供六款车身颜色、四款内饰颜色,推出...
日期:09-07
青少年防沉迷手机 360 Q20 Pro售价2699
中关村在线消息:近日,360在中国电信终端库入库了新款手机360 Q20 Pro,产品定位为青少年防沉迷手机,零售价格2699元。根据安兔兔的介绍,360 Q20 Pro采用了一块6.58英寸,分辨率为240...
日期:09-23
iphone13 pro max溢价_赢麻了 iPhone 14 Pro Max屏幕获15个奖项
近日,海外专业测试平台DisplayMate公布了其测试iPhone14Pro Max屏幕的成绩及奖项,iPhone14Pro Max收获了多达15个奖项,这是这个平台目前为止获奖最多的在售手机产品。最终iPhon...
日期:10-06
投影仪怎么选择什么品牌的好?2022千元投影仪推荐「现在什么投影仪最好」
投影仪价格跨度大,从几百元到上万元不等,新手一般会选择入门级别的投影仪,小编根据销量、口碑、性能等方面综合表现,整理了千元投影仪推荐,如果你正在选购投影仪却不知道投影仪怎...
日期:09-21
iPhone14 Plus破发千元!吓得黄牛不敢囤「iPhone13发售黄牛加价1000」
iPhone 14 Plus在发售之后便遇冷,和此前预期的一样,大屏并没有让消费者对这款机型有更高的热情,渠道报价显示,iPhone 14 Plus全系破发,顶配512G版本的价格比官网低了千元之多。其...
日期:10-26
入围9大领域!360数字安全集团获评ISC 2022创新百强年度创新力十强
   12 月 21 日,有数字安全界“奥斯卡”之称的ISC2022 数字安全创新能力百强颁奖典礼在北京成功举办。 360 数字安全集团凭借领先技术和创新实践入围 9 大技术创新领域,并获...
日期:12-23
工信部:1—8月规上电子信息制造业增加值同比增长9.3%「电子信息制造业增加值增速」
  2022年1—8月份电子信息制造业运行情况  1—8月份,我国电子信息制造业生产稳步增长,出口规模持续扩大,企业营收不断提升,投资保持快速增长。  一  生产稳步增长  1...
日期:10-03
员工称自己是行走的100万美元 卢伟冰等员工已经换上Redmi K60
自从小米13发布之后,大家的关注点也逐渐来到了小米旗下子品牌Redmi K60系列。由于Redmi K系列一直是小米旗下的“焊门将”级别的存在。2022年Redmi K50大放异彩,甚至该机型的...
日期:12-20
中兴通讯去年盈利超51亿,获46个5G商用合同_中兴5G项目双双获奖,斩获多项中国物流与采购联合会科学技术奖
中兴5G又双叒叕获奖啦,近日中国物流与采购联合会公布了2022年度中国物流与采购联合会科学技术奖的获奖情况,中兴5G的多项供应链创新成果分别斩获了科学技术进步一等奖1项,二等...
日期:09-09
罗永浩为苹果新设计点“硬赞”:这些年实在太烂 不得已憋出邪招
凤凰网科技讯 9月8日消息,在凌晨结束的苹果2022年秋季新品发布会上,iPhone 14 Pro系列新增正面设计“灵动岛”,替代了备受“吐槽”的iPhone 14 Pro叹号屏,被视为发布会的最大亮...
日期:09-09
Facebook App将取代Android的WebView 但不会使用Custom Tabs「facebook android download now」
当你在其他应用程序中打开一个链接时,它通常会在你的浏览器(如Chrome)或Custom Tabs中启动。Facebook选择在其自己的应用内浏览器中打开网页,该浏览器由Android系统WebView提供...
日期:10-03
美股周五:三大股指连跌4天,特斯拉3天蒸发约7456亿元市值「美国股票三大指数 特斯拉」
美国时间周五,美股收盘主要股指连续第四个交易日全线下跌,道琼斯指数收于2020年11月以来的最低水平。美联储周三宣布加息后,美债收益率飙升,三大股指本周再度下跌。道琼斯指数收...
日期:09-24
赛力斯:拟15亿元投建新能源汽车升级项目_赛里斯新能源汽车
  财联社9月28日电,赛力斯公告,拟在重庆市两江新区投资建设新能源汽车升级项目,公司预计于本项目将投资15亿元。vivoiQOO7代言人商务部等六部门:扩大跨境电商零售进口试点每...
日期:10-28
Mate50也环保!以旧换新至高补贴1888元「mate40以旧换新补贴」
一直宣称“环保”的iPhone被不少用户吐槽,不过环保不止有苹果在做,华为和京东,爱回收一起携手打造了“可持续发展计划”,旨在倡导低碳环保的消费理念,鼓励用户理性消费,回收旧物,以...
日期:09-23
2022年VR/AR设备全球出货量同比降12% Meta开局不利「VR设备出货量」
12月29日消息,市场研究公司NPD Group公布的统计数据显示,截至12月初,虚拟现实(VR)和增强现实(AR)头盔全球出货量同比下降了12%,其中美国销量下降2%。不过,随着苹果入场,它可能在2023年...
日期:12-29