您的位置:首页 > 互联网

AMD Zen4架构深入揭秘!49%性能提升从何而来?「amd处理器架构zen3」

发布时间:2022-10-11 17:59:04  来源:互联网     背景:

AMD锐龙7000系列的性能大家都见识过了,提升幅度可能没有预想得那么猛,但依然诚意十足。锐龙9 7900X作为次旗舰,就足以碾压12代酷睿顶级灰烬版i9-12900KS。主流的锐龙5 7600X更是再次展现爆款潜质,直接让i5-12600K抬不起头来。

红米k30支持65w充电吗

至于和Intel 13代酷睿究竟鹿死谁手,还要到这个月底才能见分晓了。

诺基亚骁龙855概念新机

组装苹果12pro max的配件

按照AMD的官方数据,Zen4相比于Zen3,同等性能下功耗可降低至多62%,同等功耗下性能可提升至多49%!

今天,我们就来深入了解一下Zen4架构、平台的革新之处,看看如此巨大的提升是从而来的。

一、全新的Zen4内核:前端大变、不一样的AVX-512

先从Zen架构的历史讲起

Zen4已经是AMD Zen系列架构的第四代(Zen/Zen+算作一代),对比来看它的改革、提升幅度都不是最大的,更多的是在Zen3基础上的一次深度优化增强,并在新工艺的加持下大幅提升频率,最高加速频率不但首次突破5GHz,而且跨越性地达到了5.7GHz!

对比四代架构,初代Zen的变革、提升幅度最猛(当然主要是推土机实在太弱了),Zen2是一次优化升级,尤其chiplet设计奠定未来基础,Zen3则是再一次革命性的大变,19% IPC提升也非常感人,Zen4再来个小步快跑就非常符合情理和逻辑了。

按照AMD的说法,Zen4架构的设计目标有三个方面:

一是性能,IPC(每时钟周期指令数或同频性能)和频率提升幅度都要达到两位数(超过10%);

二是延迟,通过增大二级缓存、改进缓存有效性,大幅降低平均延迟;

三是能效,在整个TDP(热设计功耗)范围内,显著降低动态功耗。

zen4核显性能

为了达成以上目标,Zen4对整个微架构体系进行了升级优化,包括前端、执行引擎、载入/存储单元、缓存、指令集等等,后边我们会一一讲到。

整体而言,Zen4架构的核心升级点包括:改进分支预测、增大OP指令作缓存、增大指令退役队列、增大整数/浮点寄存器文件、加深核心缓冲吞吐、浮点单元支持AVX-512指令、改进载入/存储单元、增大二级缓存。

前端部分变化较大,这里包括指令缓存、分支预测、解码器、指令缓存、微指令队列等模块。

Zen4架构重点改进了分支预测部分,包括每时钟周期预测两个跳转分支、一级缓存BTB(分支目标缓冲)增大50%达到1.5K条目、二级缓存BTB扩容从6.5K略增至7K。

另外,指令缓存(Op Cache)增大了约68%达到6.75K条目,每时钟周期可以完成多达9个宏指令(增加1个)。

不变的则是解码器每时钟周期发出4条指令、微指令队列每时钟周期分派6个整数+浮点指令。

执行引擎部分变化较小,尤其是每时钟周期10次整数、6次浮点的指令分派保持不变。

指令退役队列或者说ROB(重排序缓冲)从256条目增大25%至320条目,整数寄存器从192个增至224个,浮点寄存器从160个增至192个,缓存与核心之间的吞吐能力也提升了。

载入/存储单元部分,载入队列从72个增大至88个(22%),存储队列维持64个不变,二级缓存DTLB(数据页表缓冲)从2K条目增大了多达50%至3K条目,另外还减少了数据缓存端口的冲突几率。

也许有同学会问,很多模块都是不断增大、再增大,为什么不一步到位,从设计之初就做个大容量呢?

一方面,谁也无法精准预测每个模块多大容量下效率最好,而且不同模块之间需要彼此协调配合;

另一方面,更大容量意味着更多晶体管、更大核心面积、更高功耗、更高成本,需要在性能、能效之间做出妥协、寻求平衡。

缓存体系也做了优化,尤其是二级缓存,不但容量翻了一番,每核心来到1MB,还提升了速度。

同时,从二级缓存到三级缓存、从三级缓存到内存,都支持更多命中失败(outstanding miss),可以减少流水线的停顿,增加缓存回填带宽,提升整体效率。

不过整体缓存架构没变,一级缓存依然是32KB+32KB的每核心容量组合,三级缓存则继续每8个核心一组共享32MB。

AVX-512指令集或许是大家对Zen4最感兴趣的地方之一,毕竟在以往这是Intel处理器的专属技术,而且争议非常大,有人觉得它非常有用,有人觉得它只是徒增功耗,甚至成为极限烤机专用

Zen4支持的AVX-512并非直接将Intel那套技术照搬过来(也不允许),而是选择了不一样的实现方式。

Intel处理器执行AVX-512指令时,是完整的512-bit通道(这也是该指令集命名的来源),但是AMD走的是256-bit通道,也就是砍了一半,因此遇到512-bit的指令就需要拆分成两个256-bit指令来执行。

事实上,AMD推土机家族、Zen家族在执行AVX-2 256-bit指令的时候,也是拆分成两个128-bit。这都是一脉相承的

滴滴的总裁柳青

AMD表示,这么做可以节省芯片面积,并且避免执行AVX-512指令时发热过大、频率下降的情况出现(峰值性能确有轻微损失),因为真正长达512-bit的指令并不多,就像以前256-bit的指令不够多。

Zen4支持的AVX-512指令一览并不是把Intel的全都搬了过来,而是选择性地加入,除了一些基础指令,特别值得注意的是用于AI加速的VNNI、BF16,这也是Intel之前宣传的重点。

VNNI是面向AI模型推理的矢量指令,可将多个8-bit或16-bit整数串联成512-bit,提升卷积神经网络常用的MAC(乘法累加)的速度。

另一个是BF16,面向AI加速,将双精度浮点FP32中的23位小数减少到7位,并保留1位符号、8位指数,结果与FP32相比范围相同,只是精度较差,但仍远高于单精度FP16。

按照AMD的说法,加入AVX-512指令集后,Zen4架构的FP32浮点推理多线程性能可提升1.31倍,VNNI INT8整数推理多线程性能可提升2.47倍!

另外,Zen4还增加了一些虚拟化、安全性方面的新指令,就不赘述了。

以上是Zen4、Zen3的具体变化对比,可以看到其中不少都维持不变,其他很多则只是数量/容量上的扩充,因此说Zen4就是个放大优化版的Zen3也没什么毛病。

值得注意的是,Zen4二级缓存、三级缓存的延迟甚至还略微加大了。

AMD宣称,Zen4 IPC平均提升了13%,这是在固定4GHz八核心情况下,通过22个项目对比Zen3得出的几何平均结果。

当然不同项目的变化幅度差异很大,比如说CPU-Z单线程只提升了1%(所以这个测试项目跑分变化不大),寒霜引擎游戏、《GTA V》、PUBG吃鸡、CineBench R23单线程这些项目提升也有限。

wPrime 1024M是变化最大的提升幅度达惊人的39%,另外像是Dolphin Web测试和《看门狗:军团》、《F1 2022》、《杀出重围:人类分裂》、《地铁:离去》等游戏的提升也很喜人。

13%的提升进一步划分,可以看到前端架构改进带来的提升幅度最大,其次是载入/存储单元、分支预测单元,而来自执行引擎、二级缓存的贡献相对较小。

这和前边架构分析的变化幅度是相符合的。

IPC提升之外,锐龙7000系列的频率也达到了前所未有的高度,旗舰锐龙9 7950X最高可以加速到5.7GHz(还有个5.85GHz fMax频率但官方一直保持缄默)。

当然,5.7GHz的频率只有单核心加速可以做到,AMD也公布了锐龙9 7950X在不同核心/线程下的最高加速频率,可以看到2核心可以到5.6GHz,8核心可以接近5.4GHz,16核心全开也能到5.2GHz。

13% IPC提升,加上频率拉到最高5.7GHz,锐龙7000的单线程性能提高了最多29%。

一个很容易被忽略的点,就是锐龙7000系列支持Eco模式,运行在更低的TDP,比如170W的可以低至105W或者65W,105W的可以低至65W。

AMD宣称,锐龙9 7950X 65W Eco模式下的性能,依然可以超过正常的锐龙9 5950X。

Eco模式未来会集成在主板BIOS的超频模块,可一键开启,还会集成在锐龙Master软件中。

有趣的是,得益于新的架构和工艺,Zen4单个核心加二级缓存总面积仅为3.84平方毫米,相比于Intel 7工艺的12代酷睿的7.46平方毫米,小了几乎一半,能效则高了几乎一半。


返回网站首页

本文评论
甲乙方合作就像谈恋爱,的承诺是手放开_甲方和乙方谈恋爱
声明:本文来自于微信公众号 刀姐doris(ID:doriskerundong),整理|Even 编辑|刀姐doris,授权转载发布。本期推送为——播客《温柔一刀》Vol.33文字精选版,总字数为5191,预计阅读时间...
日期:11-27
三星嘲讽苹果 iPhone 14 没有创新_苹果13没创新
IT之家 9 月 2 日消息,苹果将于下周正式发布 iPhone 14,但相比 Pro 系列几乎可以说是 iPhone 13 Pro 系列换壳,似乎仅有内存、处理器有些变化,至少目前来看很难出现什么创新或新...
日期:09-14
谷歌 Chrome 浏览器推出 95.0.4638.69 紧急更新,修复两个零日漏洞(chrome浏览器更新出错)
  10 月 29 日消息,根据外媒 bleepingcomputer 报道,谷歌 Chrome 浏览器于 10 月 28 日推送了 95.0.4638.69 版紧急更新,修复了两个较为严重的 Zero-day 零日漏洞。目前,这一...
日期:07-17
价格或惊喜!华晨鑫源斯威大虎增程版亮相:比亚迪、长城合体
这或许是你能买到的最便宜的增程式混动SUV了。近日消息,华晨鑫源旗下斯威大虎增程版进行申报,该车定位于中型SUV,提供五座和七座两种版本,此前燃油版已经上市,售价5.99-7.89万元...
日期:12-15
华为mate 40降价「华为Mate 40 5G手机立减2000 提前过双十一」
华为Mate 50已经开售了一个月,但仍然一货难求,从现在的市场来看华为Mate 40系列依然值得入手,华为Mate 40有麒麟芯+5G的配置,同样有着不错的性能表现,5G版本的华为Mate 40 Pro手...
日期:10-09
全球电视巨头的新赛道:画质为本,应用是魂!
  北京时间1月11日晚,海信视像总裁于芝涛在史上首次线上CES展上宣布,2020年海信累计出货超过2500万台终端显示产品,在中国市场份额继续保持第一。2021年,海信将紧紧围绕画质...
日期:01-05
快快网络:功能齐全、高性价比的高防IP是企业刚需
  2020年,DDoS攻击呈整体上升态势。攻击者利用新技术使攻击手法更复杂和多样,攻击强度和复杂度也进一步提升。目前,DDoS攻击形势愈加猛烈,DDoS攻击防御形势随之愈加严峻。  ...
日期:10-01
iphone12 5699元「iPhone 14立减1230元 入手4769有赠品」
iPhone14在发售的一个多月期间,一直在降价,首发当天就跌了500元,而随着iPhone14不断地在降价,在目前双11已经走到了历史的最低价,现在立减1230元,已经比苹果官网优惠了太多,而且比...
日期:11-12
iqoo11发布会「热门机型849元起,iQOO 11.11预售狂欢一图看懂」
中关村在线消息:一年一度的11.11大促销又来了,想买手机的朋友们别错过。好消息是,iQOO手机也参与到了促销中来,预定最高省600元,热门机型最低849元起售,并且全程价保。具体详情,一...
日期:10-28
闲鱼推出七天无理由退货 仅针对经营性卖家_闲鱼没有七天无理由退货
10月9日 消息:二手交易也能无理由退货了?近日,闲鱼发布了关于新增《闲鱼社区七天无理由退货规范》的公示通知。公告称,为保障卖家权益,闲鱼社区新增了七天无理由退货。iphone 1...
日期:10-18
比特币由谁提供_比特币只属于有准备的人?不,也属于猪八戒网捡漏服务商
  如果不是最近比特币大火,我根本想不起来我还有比特币。   然而我也并没有暴富!   这事还得从三年前说起。   我有一个不大的科技公司,做一些网站和轻微开发的内...
日期:07-16
Chrome OS新功能曝光:类似macOS的触发角(mac上的chrome没有响应)
  Mac用户可以通过将鼠标移到屏幕的任意角落来触发一些快捷方式,该功能被称为“触发角”(Hot Corners)。如今,有证据表明谷歌可能会为Chrome OS构建自己的Hot Corners版本...
日期:01-24
深海捕鱼游戏APP_《捕鱼大明星》益智休闲手游上线!全新玩法带你探秘深海世界
  3月1日,由海南美联互动娱乐文化有限公司开发的益智休闲类手游《捕鱼大明星》已全线完成,目前上架了安卓和iOS双版本,在百度助手等多个应用平台均可下载。据了解,这款游戏设...
日期:07-16
丰田卡罗拉Altis灵活燃料混合动力车将在印度上路测试「丰田卡罗拉混动仪表」
丰田公司的卡罗拉Altis混合动力车将在印度作为乙醇动力车的技术示范车,作为其在印度测试灵活燃料汽车的试点项目。该车也以乙醇为燃料,由印度道路运输和公路部长Nitin Gadkari...
日期:10-14
腾讯三季度收入1401亿元,净利润399亿元同比增1%_「腾讯前三季度净利润」
11月16日消息,腾讯控股(00700)发布2022年第三季度业绩。报告显示,腾讯第三季度营收1400.93亿元,同比减少2%,环比增加5%。毛利619.83亿元,同比减少1%,环比增加7%;公司权益持有人应占...
日期:11-20
美国电动汽车充电桩「美国团队研发电动汽车新充电技术:10 分钟充电 90%,堪比加油」
  IT之家8 月 23 日消息,随着电动汽车技术的不断发展,许多用户选择购买电动汽车来满足日常出行需求。乘联会发布的 2022 年 7 月份我国乘用车市场分析显示,新能源乘用车 7 月...
日期:09-07
微软 Win11 全新照片 App 预览版上手体验:全新设计,功能更易用_windows11照片
  9 月 12 日消息 在 Windows 11 正式版发布之前,微软已经开始测试多个预装应用的新设计,例如截图工具、画图和照片。微软照片 App 正在通过 WinUI 和 Fluent Design 进行...
日期:07-17
店宝宝:叮咚买菜“进军”成都,买菜“大战”一触即发_叮咚买菜成都门店
  店宝宝获悉,11月28日,叮咚买菜正式宣布进军西南,首站入驻成都。其实,在成都的互联网生鲜大战场中,早已集结了盒马、7FRESH、京东到家等互联网巨头玩家。叮咚买菜的入局,势必...
日期:11-08
腾讯荷风艺术行动音乐会2021_腾讯荷风艺术行动音乐会举办,近180位乡村孩子圆梦
  5月31日,由腾讯和北京荷风艺术基金会联合举办的“田梗上的童年——腾讯荷风艺术行动音乐会”在北京中山公园音乐堂举行。来自北京、河北、新疆、青海、山东、广西、江苏...
日期:05-14
刘德华周杰伦同时开演唱会「刘德华、周杰伦以后开线上演唱会可能没那么容易了」
  持续火爆、且规模可观的在线演出市场,将面临新的监管和合规要求。  文|张剑;编辑|郭丽琴微信十年用户红包封面清华第一个人工智能学生  来源:财经E法;  今年以来,周杰...
日期:10-02