您的位置:首页 > 互联网

zen4核显性能「AMD Zen4架构深入揭秘!49%性能提升从何而来?」

发布时间:2022-10-18 00:15:22  来源:互联网     背景:

AMD锐龙7000系列的性能大家都见识过了,提升幅度可能没有预想得那么猛,但依然诚意十足。锐龙9 7900X作为次旗舰,就足以碾压12代酷睿顶级灰烬版i9-12900KS。主流的锐龙5 7600X更是再次展现爆款潜质,直接让i5-12600K抬不起头来。

至于和Intel 13代酷睿究竟鹿死谁手,还要到这个月底才能见分晓了。

按照AMD的官方数据,Zen4相比于Zen3,同等性能下功耗可降低至多62%,同等功耗下性能可提升至多49%!

今天,我们就来深入了解一下Zen4架构、平台的革新之处,看看如此巨大的提升是从而来的。

一、全新的Zen4内核:前端大变、不一样的AVX-512

先从Zen架构的历史讲起

Zen4已经是AMD Zen系列架构的第四代(Zen/Zen+算作一代),对比来看它的改革、提升幅度都不是最大的,更多的是在Zen3基础上的一次深度优化增强,并在新工艺的加持下大幅提升频率,最高加速频率不但首次突破5GHz,而且跨越性地达到了5.7GHz!

对比四代架构,初代Zen的变革、提升幅度最猛(当然主要是推土机实在太弱了),Zen2是一次优化升级,尤其chiplet设计奠定未来基础,Zen3则是再一次革命性的大变,19% IPC提升也非常感人,Zen4再来个小步快跑就非常符合情理和逻辑了。

按照AMD的说法,Zen4架构的设计目标有三个方面:

一是性能,IPC(每时钟周期指令数或同频性能)和频率提升幅度都要达到两位数(超过10%);

二是延迟,通过增大二级缓存、改进缓存有效性,大幅降低平均延迟;

三是能效,在整个TDP(热设计功耗)范围内,显著降低动态功耗。

为了达成以上目标,Zen4对整个微架构体系进行了升级优化,包括前端、执行引擎、载入/存储单元、缓存、指令集等等,后边我们会一一讲到。

整体而言,Zen4架构的核心升级点包括:改进分支预测、增大OP指令作缓存、增大指令退役队列、增大整数/浮点寄存器文件、加深核心缓冲吞吐、浮点单元支持AVX-512指令、改进载入/存储单元、增大二级缓存。

前端部分变化较大,这里包括指令缓存、分支预测、解码器、指令缓存、微指令队列等模块。

Zen4架构重点改进了分支预测部分,包括每时钟周期预测两个跳转分支、一级缓存BTB(分支目标缓冲)增大50%达到1.5K条目、二级缓存BTB扩容从6.5K略增至7K。

另外,指令缓存(Op Cache)增大了约68%达到6.75K条目,每时钟周期可以完成多达9个宏指令(增加1个)。

不变的则是解码器每时钟周期发出4条指令、微指令队列每时钟周期分派6个整数+浮点指令。

执行引擎部分变化较小,尤其是每时钟周期10次整数、6次浮点的指令分派保持不变。

指令退役队列或者说ROB(重排序缓冲)从256条目增大25%至320条目,整数寄存器从192个增至224个,浮点寄存器从160个增至192个,缓存与核心之间的吞吐能力也提升了。

载入/存储单元部分,载入队列从72个增大至88个(22%),存储队列维持64个不变,二级缓存DTLB(数据页表缓冲)从2K条目增大了多达50%至3K条目,另外还减少了数据缓存端口的冲突几率。

也许有同学会问,很多模块都是不断增大、再增大,为什么不一步到位,从设计之初就做个大容量呢?

一方面,谁也无法精准预测每个模块多大容量下效率最好,而且不同模块之间需要彼此协调配合;

另一方面,更大容量意味着更多晶体管、更大核心面积、更高功耗、更高成本,需要在性能、能效之间做出妥协、寻求平衡。

缓存体系也做了优化,尤其是二级缓存,不但容量翻了一番,每核心来到1MB,还提升了速度。

同时,从二级缓存到三级缓存、从三级缓存到内存,都支持更多命中失败(outstanding miss),可以减少流水线的停顿,增加缓存回填带宽,提升整体效率。

不过整体缓存架构没变,一级缓存依然是32KB+32KB的每核心容量组合,三级缓存则继续每8个核心一组共享32MB。

AVX-512指令集或许是大家对Zen4最感兴趣的地方之一,毕竟在以往这是Intel处理器的专属技术,而且争议非常大,有人觉得它非常有用,有人觉得它只是徒增功耗,甚至成为极限烤机专用

Zen4支持的AVX-512并非直接将Intel那套技术照搬过来(也不允许),而是选择了不一样的实现方式。

Intel处理器执行AVX-512指令时,是完整的512-bit通道(这也是该指令集命名的来源),但是AMD走的是256-bit通道,也就是砍了一半,因此遇到512-bit的指令就需要拆分成两个256-bit指令来执行。

事实上,AMD推土机家族、Zen家族在执行AVX-2 256-bit指令的时候,也是拆分成两个128-bit。这都是一脉相承的

AMD表示,这么做可以节省芯片面积,并且避免执行AVX-512指令时发热过大、频率下降的情况出现(峰值性能确有轻微损失),因为真正长达512-bit的指令并不多,就像以前256-bit的指令不够多。

Zen4支持的AVX-512指令一览并不是把Intel的全都搬了过来,而是选择性地加入,除了一些基础指令,特别值得注意的是用于AI加速的VNNI、BF16,这也是Intel之前宣传的重点。

VNNI是面向AI模型推理的矢量指令,可将多个8-bit或16-bit整数串联成512-bit,提升卷积神经网络常用的MAC(乘法累加)的速度。

另一个是BF16,面向AI加速,将双精度浮点FP32中的23位小数减少到7位,并保留1位符号、8位指数,结果与FP32相比范围相同,只是精度较差,但仍远高于单精度FP16。

按照AMD的说法,加入AVX-512指令集后,Zen4架构的FP32浮点推理多线程性能可提升1.31倍,VNNI INT8整数推理多线程性能可提升2.47倍!

另外,Zen4还增加了一些虚拟化、安全性方面的新指令,就不赘述了。

以上是Zen4、Zen3的具体变化对比,可以看到其中不少都维持不变,其他很多则只是数量/容量上的扩充,因此说Zen4就是个放大优化版的Zen3也没什么毛病。

三星手机s8电池鼓包

值得注意的是,Zen4二级缓存、三级缓存的延迟甚至还略微加大了。

AMD宣称,Zen4 IPC平均提升了13%,这是在固定4GHz八核心情况下,通过22个项目对比Zen3得出的几何平均结果。

当然不同项目的变化幅度差异很大,比如说CPU-Z单线程只提升了1%(所以这个测试项目跑分变化不大),寒霜引擎游戏、《GTA V》、PUBG吃鸡、CineBench R23单线程这些项目提升也有限。

wPrime 1024M是变化最大的提升幅度达惊人的39%,另外像是Dolphin Web测试和《看门狗:军团》、《F1 2022》、《杀出重围:人类分裂》、《地铁:离去》等游戏的提升也很喜人。

13%的提升进一步划分,可以看到前端架构改进带来的提升幅度最大,其次是载入/存储单元、分支预测单元,而来自执行引擎、二级缓存的贡献相对较小。

这和前边架构分析的变化幅度是相符合的。

IPC提升之外,锐龙7000系列的频率也达到了前所未有的高度,旗舰锐龙9 7950X最高可以加速到5.7GHz(还有个5.85GHz fMax频率但官方一直保持缄默)。

当然,5.7GHz的频率只有单核心加速可以做到,AMD也公布了锐龙9 7950X在不同核心/线程下的最高加速频率,可以看到2核心可以到5.6GHz,8核心可以接近5.4GHz,16核心全开也能到5.2GHz。

芒果超媒董事长

13% IPC提升,加上频率拉到最高5.7GHz,锐龙7000的单线程性能提高了最多29%。

zen4 cpu

小区门禁卡如何绑定手机NFC华为

一个很容易被忽略的点,就是锐龙7000系列支持Eco模式,运行在更低的TDP,比如170W的可以低至105W或者65W,105W的可以低至65W。

AMD宣称,锐龙9 7950X 65W Eco模式下的性能,依然可以超过正常的锐龙9 5950X。

Eco模式未来会集成在主板BIOS的超频模块,可一键开启,还会集成在锐龙Master软件中。

有趣的是,得益于新的架构和工艺,Zen4单个核心加二级缓存总面积仅为3.84平方毫米,相比于Intel 7工艺的12代酷睿的7.46平方毫米,小了几乎一半,能效则高了几乎一半。


返回网站首页

本文评论
港股美股暴跌「港股美团跌超11%,市值跌破1万亿港元」
  讯 8月16日下午消息,港股美团跌超11%,报159.6港元每股,市值跌破1万亿港元。此前有市场消息称,腾讯计划出售美团的全部或大部分股权。对此,腾讯方面回应称,不予置评。荣耀超级...
日期:09-26
域名大佬队长与孙含会律师团队成功追回被盗10年域名
  2021年4月7日,孙含会律师团队与与域名行业大佬王培陛(被行业称为“域名队长”)强强合作,就被盗十年的域名<6543.com>向亚洲域名争议解决中心(ADNDRC)香港秘书处提出投诉...
日期:07-17
协同发展 | 希沃交互智能录播助力江西省专递课堂建设
  2019年9月5日,南昌市京安学校与希沃举行了“专递课堂实景案例展示”观摩活动。江西省电教馆馆长、主任等省馆领导代表及四大运营商代表出席此次的观摩活动。   2018...
日期:01-04
Mozilla 宣布淘汰两个火狐浏览器 Firefox 扩展程序_Firefox 扩展
  今日,Mozilla 官方宣布,由于服务器关停,将于 2 月 19 日为用户自动卸载 Voice Fill 和 Firefox Voice Beta 两个扩展程序。   官方表示,这一决定是在公司决定淘汰 Mozil...
日期:07-10
三星 Galaxy 全球发布会汇总:两款折叠屏更轻薄,还有耳机和手表「三星折叠手机一代」
ate怎么读在三星官方放出的 8 月 10 日 Galaxy 全球发布会的前瞻宣传图中,「天生优越」这几个字在网友中间引起了不小的讨论。发布会前,预计在此次发布会面世的新品的情报不能...
日期:09-16
特斯拉model3维修方便吗「特斯拉喊话Model 3中国车主:请谨慎驾驶车辆 快点来检修」
11月25日,市场监管总局公告,特斯拉汽车(北京)有限公司、特斯拉(上海)有限公司召回部分进口Model S、Model X及部分进口和国产Model 3电动汽车。国家市场监督管理总局周五在公告中...
日期:11-27
网络动态防御系统_网络动态
  近日,国际数据公司(IDC)发布《PRC SDC Market Overview and Analysis, 2020H2/2020》报告。报告显示, 华为云以24.3%的市场份额,斩获中国容器软件市场第一。   当前,以...
日期:12-17
HUAWEI AppGallery Connect携手多家服务商,打造翻译服务“新引擎”(huawei link app)
  HUAWEI AppGallery Connect翻译服务全新升级,携手新宇智慧、语言桥等多家服务商为全球开发者提供优质的翻译服务,解决应用在全球分发时面临的多语言本地化问题,通过平...
日期:07-16
英特尔2020年净利润「英特尔三季度净利润下滑85%,未来三年将削减100亿美元成本」
  作者:彭新;  个人电脑和服务器芯片销售疲软拖累业绩,英特尔业绩承压,将采取裁员等措施削减成本。10月27日美股盘后,英特尔公布2022财年第三季度财报。报告显示,英特尔第三...
日期:10-31
福特遣散印度工厂:2592名工人获62个月薪水补偿
去年9月,福特汽车决定停止在印度生产汽车,并关闭位于印度西部古吉拉特邦萨南德(Gujarat)、南部城市金奈(Chennai)的制造工厂,为此裁员约4000人。不过,福特与工人的遣散补偿协议,...
日期:10-03
看天气顺带看新闻:iOS 16.2天气App加入Apple News新闻模块「iPhone播报天气」
近日,iOS 16.2和iPadOS 16.2迎来新的Beta测试版更新,在新版本中,系统自带的天气App获得了更新。新的天气App整合了苹果自家的Apple News新闻模块,将根据用户目前所处的位置,展示...
日期:11-08
春晚 小年_《头号英雄》央视频小年夜专场,在春晚回忆里提前过大年!
  1月17日小年夜,由国家广播电视总局网络司指导,由西瓜视频推出,抖音、今日头条联合出品的,全民互动直播答题活动《头号英雄》与央视频联合,为大家带来了一场小夜专场。本场主...
日期:08-03
消息称苹果 iPhone 14 手机壳与上一代通用_苹果11 12的手机壳通用吗
IT之家 9 月 1 日消息,苹果将于下周推出 iPhone 14 / Pro 系列新机,在发布会之前,外媒 9To5Mac 获得了更多信息。首先,苹果 iPhone 14 Plus 的 MagSafe 手机壳图片出现在了网上,...
日期:09-06
继 CBA、东京奥运会之后,快手正与 NBA 洽谈战略合作
  8 月 27 日消息 继 CBA、东京奥运会之后,快手目前正在与 NBA 就结为战略合作关系进行沟通,双方计划从内容及品牌商业化等方面全面合作。   据悉,在内容层面,快手将持有 N...
日期:07-17
普惠云计算 | ZStack立足国产化,服务泛政府行业需求(云计算主流服务模式)
  “去年,我们全年新增客户200多家,而今年上半年,新增客户已接近200家,其中大部分为政府、交通、公安、电信等泛政府行业客户。”7月10日,上海云轴(ZStack)创始人兼CEO 张鑫在...
日期:08-09
腾讯回应出售美团股权:不实!美团市值却跌掉千亿(腾讯收购美团股份)
《科创板日报》8月16日讯(记者 张洋洋) 今日午后,美团港股直线下挫,跌幅扩大至10%。此前有市场消息称,腾讯计划出售美团的全部或大部分股权,对此,腾讯方面回应《科创板日报》记者称...
日期:08-17
微软诉摩托罗拉侵权案将于下周开庭审理_微软诉摩托罗拉侵权案将于下周开庭审理吗
8月21日消息,据国外媒体报道,谷歌虽然宣布收购摩托罗拉移动,但是就算得到了监管部门的批准,此次交易在数月内也不会正式成立,甚至可能额外花上一年的时间。谷歌在本周表示,在这期...
日期:07-22
运营商取消“不限量套餐”_不限量套餐将取消
  此前推出的达量限速套餐,严重限制了运营商通过流量盈利的空间。在增长几近停滞甚至出现倒退的势头下,三大运营商急需从不限量套餐大战这个泥潭中抽身出来,为接下来的5G竞...
日期:06-26
多才多艺的全能王 国美年货节挑选笔记本有门道
  如今笔记本电脑已经成为我们日常生活、工作中不可缺少的产品。春节将至,正是上班族、学生族购买电脑的好时机,这个时间换电脑来年可以迅速投入使用,当然国美年货节的电脑...
日期:06-06
微软Edge睡眠选项卡功能更新(edge睡眠标签页)
  ITBEAR科技资讯4月8日消息:微软今天发博说,一种新的睡眠选项卡功能在Microsoft Edge 100更新,让与另一页面共享一个浏览器实例的页面进入睡眠状态。   休眠选项卡的功能...
日期:07-18