京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 6062|回复: 0

AMD Zen2架构深度揭秘:100%翻新 单核性能完美

[复制链接]

6

主题

0

回帖

10

积分

新手上路

积分
10
发表于 2019-6-11 13:36:29 | 显示全部楼层 |阅读模式 来自 中国
2017年,AMD Zen架构横空出世,Ryzen锐龙、EPYC霄龙处理器在各个领域都大杀四方、一举扭转乾坤。
( ~# ?# w& Z$ K5 _1 j1 x" F  s- I2018年,Zen架构升级增强进化为Zen+,制造工艺也从14nm来到12nm,而到了2019年,我们迎来第三代锐龙3000系列处理器的同时,架构也升级为全新的Zen 2,同时制造工艺也是全新的7nm。
& p, \' {2 e& Q! M$ |
: d/ S% C( c$ \# [- h# p( D( Z! L/ i! e  NZen 2架构到底全新在哪里?7nm工艺到底有何加成?今天我们就来探究一番,当然CPU架构和制造工艺是极深的、极专业的,我们这里也只是浮光掠影地看一些毛皮,感受一下AMD激进的步伐。
5 c5 M0 ~  R0 i0 G- n1 S8 j( N
& T6 R0 d' X2 o/ a* q& y7 W首先介绍一下Mike Clark,AMD Corporate Fellow(企业院士)、Zen首席架构师。能有今天的处理器,这可是首要功臣,当然还有大神级的Jim Keller,以及无数工程师的心血付出。
+ Z' Q/ ?% `3 ?" u8 p( {
7 r# |! ~6 k9 C7 {
+ {$ b4 f' i7 @; m) yZen架构诞生之初,AMD就强调这是其未来多年发展的基石,同时也早早就准备好了长期路线图。14nm Zen打破坚冰、12nm Zen巩固江山之后,7nm Zen 2将在七月份正式出货,7nm+工艺的下一代全新Zen 3也正在按计划进行,如无意外将在2020年以锐龙四代的身份和我们见面。
4 B' M* d$ F4 T" I/ W5 o再往后,AMD还有Zen 4乃至是Zen 5,都正在设计之中。如果每年一代的话,至少到2022年,AMD都会以让人目眩的速度持续提升。牙膏,不存在的……, J' x7 Z8 H, y) g0 e  U
7 x+ I1 S, O) h0 l; M
Zen 2的设计理念或者原则主要有四条,一是结合新工艺成为世界上首个7nm工艺的高性能x86 CPU,二是在核心执行能力方面全方位增强以提升IPC,三是增强硬件安全性,四是新一代Infinity Fabric互连总线实现配置和性能的模块化和灵活性。
2 J3 Q$ c, `4 Z$ g7 T: ~0 m- p. OZen 2架构使用的7nm工艺当然是来自台积电,AMD也与之有着极为深入的合作,从CPU到GPU都在用它。
8 L  o8 `& T. @% K
7 w+ l9 m$ `, r: R7 s6 j! W
" {0 ?3 C  i( t6 q+ S5 J. z7 n* E作为一个重要工艺节点,台积电7nm从高性能到低功耗、从数据中心到桌面到移动都应付自如,实现了晶体管密度的翻番,同等性能下功耗可以降低一半,而同等功耗下性能可提升超过25%。
  L- [4 n' q2 b1 j: ?- {  j0 q) g3 u# A+ C
初代的Zen架构相比于推土机架构实现了几乎恐怖的52%的IPC(每时钟周期指令数可粗糙理解为架构性能或者单线程性能)提升,Zen+在加强了个位数之后,Zen 2又一举提升了多达15%,远远超出了行业平均水平。
6 k! m. X4 t* t. x而到了产品层面,Zen 2相比于Zen+的单线程性能提升了多达21%,其中六成来自IPC架构强化,另外四成来自7nm工艺和频率提升,锐龙处理器单线程、单核心性能稍弱的劣势从此彻底不复存在。+ N! s( A4 A0 z4 {/ p# \

% U8 G' e, V, |/ ^+ h& a9 ^+ ?再进一步,到了实际游戏中,以两代主流旗舰为例,同样是8核心16线程,锐龙7 3800X相比于锐龙7 2700X的游戏性能在主流大作中可以轻松提升少则超过10%,多则达到34%甚至更多,所以今后再说锐龙打游戏不行可就过时了。
0 Q( H! y" A6 F+ w) ]- j; BZen 2架构和锐龙三代能取得如此长足的进步,来源于方方面面的强化,简单来说有架构大幅革新、分支预测改进、整数吞吐提升、浮点模块翻番、内存延迟降低、三级缓存容量翻番、频率大幅提高、系统和软件优化,等等等等。
0 @1 @7 G( e0 X/ U4 g
# g: m' f7 Z! T0 X" Q. R4 D除了底层架构的大变,三代锐龙(以及新一代霄龙)还采用了chiplet多芯片设计。虽然很多人称之为“胶水”,但是在如今摩尔定律前进迟缓、半导体技术提升艰难的情况下,这其实是非常明智的选择。
# ]6 j2 Y" s; l9 E. A. \一方面,它可以减轻架构和工艺压力,不同IP模块可以选择最合适优化的工艺,从而大大降低研发、制造成本,并提高良品率。6 Z) H7 l, ^& N! U4 ^6 J$ z/ G
另一方面,它可以灵活地配置产品规格和特性,针对不同市场提供最合适的产品,也能更好地提升峰值计算性能。
* V/ h- S/ ?5 q3 h! }  }- a* j9 D$ P# @9 R

- v1 S# B/ ?: l& M4 Z# Y" K* W对于多芯片设计,最关键的因素就是提高不同模块之间的通信带宽和效率、降低延迟,AMD为此设计了Infinity Fabric总线,无论AMD CPU还是AMD GPU,互连互通都是基于这种新型总线。3 G; l3 S* l6 p3 G, a: P& o
三代锐龙上,Infinity Fabric总线已经进化到第二代,在扩展性、延迟、能效各个方面都有显著提升。( T- @# z% r' B# c5 W
扩展性上,特别针对消费级客户端应用做了优化调整(之前更多还是数据中心上),并且总线宽度从256-bit翻番到512-bit,以支持PCIe 4.0,能效上则将单位功耗降低了多达27%。
, @- C1 ~1 _: p6 a1 I延迟是多芯片互连的致命所在,一旦处理不好会导致整体效率的低下,包括核心、缓存、内存等各个模块都必须保持最高效率和最低延迟,比如新一代Infinity Fabric采用了总线频率、内存频率分离式设计,保证可以达到更高频率和尽可能低的延迟。- R* O4 q- {" f& ]. s( A9 m0 t

$ Z5 W9 _$ g( e8 S三代锐龙的基础模块仍然是CCX(CPU Complex),每个CCX里有4个物理核心、16MB三级缓存(比二代翻番),同时两个CCX组成一个CCD(CPU Complex Die),也就是我们看到的每一颗CPU芯片。
0 A% R  |4 ^( _; y) U  O单独的I/O Die则集成了输入输出控制中心、一体化内存控制器(直连内存),注意它的制造工艺是12nm。& i$ e8 w  v3 J+ W3 _
每个CCD有各自的Infinity Fabric PHY物理层,通过它和I/O Die芯片内的数据总线(Data Fabric)进行高速互连通信——注意两颗CPU芯片之间没有直接通信,都要经过I/O Die,这样可以保证不同核心、缓存之间的延迟是一致的。
; p3 Z5 J9 ]9 K9 W6 K
* r9 ~0 j! k& K- w3 R9 b7 ?% f得益于新架构和新工艺,三代锐龙的每个CCX模块面积仅为31.3平方毫米,相比二代的60平方毫米缩小了足足47%,这也是同样封装下核心数量可以翻番的主要原因。
+ B1 ^  X. v. T" {2 E- V, S同时AMD也避免了一核有难、多核围观的尴尬局面,从6核心12线程到8核心16线程再到12核心24线程,多线程提升几乎是线性的(每一个核心和线程都充分释放),达到了几乎完美的98%。
# `$ L: a8 s. J3 k7 f. v4 y! |9 y5 H( ]' M9 \) T" k4 p$ J8 a6 e
比性能提升更让人激动的是能效,比如锐龙7 3700X相比锐龙7 2700X,绝对功耗从195W降低到135W,结果就是CineBench R20多核心跑分的能效(每瓦性能)提升了多达75%。1 D; }! M1 \* M: N! [8 c
1 W& R/ C0 L" i  @
能效提升如此之多,新工艺新架构自然功不可没,也大大带动了频率,Zen、Zen+最高可以分别达到4.1GHz、4.35GHz,Zen 2则来到了4.7GHz(16核心的3950X),同时大大降低了达到最高频率所需的最大电压。( v+ W9 D$ L) y1 U+ X
' t! w; ~7 r4 _8 q
Zen架构的内存延迟一直不是很好,但也一直在改进,Zen+就有了明显的变化,Zen 2更是进一步降低最多达33ns,而且支持更高的DDR4内存频率,从2667MHz到3600MHz游戏性能可提升5-10%甚至更多,而翻了一番的三级缓存更是让Zen 2有如神族,游戏性能可提升10-20%。( J9 I( M; c( I& v; J2 N* g
说了半天,Zen 2架构设计呢?鉴于这些内容过于深奥,我们刚才先讲了新架构的效果,接下来就分享新架构的内部设计,只说一些最关键的、最容易理解的地方,感兴趣的可以细细研究架构图,或者等待后续的技术白皮书。" `5 |, [. U; r3 |/ j
( N2 h9 n8 p. |: r7 K! [! {/ {' h/ p
5 r- D1 Q0 h1 A+ `  S. `. F, i/ f( s7 D3 l
Zen 2架构总览图和核心新特性,特别注意新的TAGE分支预测器。AMD这次采用了chiplet都芯片设计,而为了协调分散的不同模块,不但有加强版的Infinity Fabric总线,不但有翻番的三级缓存(提高命中率),还特别强化了分支预测,从而将预测错误率降低了大约30%,使得处理器可以花更少的时间完成前端分派工作,提高效率的同时也能节省功耗。
5 c/ E- T$ m- V3 w' ^# p缓存结构也有极大调整,支持各级缓存一致性,大大降低有效延迟,加入新的缓存指令。
$ `1 [/ y! q; ]) |2 `9 f其中,一级指令缓存从4-way 64KB调整为8-way 32KB,和一级数据缓存保持一致,关联性更强,预取和利用率都得到改进。
( H8 n- k7 C$ Y) S2 V) k+ H二级缓存保持每核心8-way 512KB不变,三级缓存则翻番到了每核心对应4MB,可以很好地提升游戏性能。
" j2 N  Q# P: E) L其他方面:翻番的4K微指令操作缓存、四个整数单元和三个AGU地址生成单元(之前是两个)、每时钟周期三个AGEN/两个载入/一个存储、浮点单元翻倍支持单操作AVX-256、更快的虚拟化安全、硬件增强安全防御,等等。5 L/ H; m( A6 L) ~# o0 ^

& e' x1 I8 q( J) R" q' ~( i8 {+ f6 F
. z1 Z' l, v- x6 @! s

/ N* p+ k( [0 e5 a4 b5 Y; }+ d! v% P8 M& c  Z
+ r* _7 |9 _! F  N: `  A

8 {$ C/ P4 m+ E, c- S, a- g, L1 O
& }, Q" x5 H. Q4 h3 X! }. g' }6 V  J# y& I. E* V! j5 q1 ~
4 {6 H( R# O+ H1 G  x/ ^

8 h: I- H+ `' y以上是Zen 2前端、预取、解码、浮点单元、整数执行、载入存储、缓存、安全等几乎所有模块的改进,可以看到几乎每一处都得到了全面强化和革新。8 L' E+ a7 d- _; ~6 X: Q& y
& N* v3 U) J8 u/ L+ r5 ~, p! t  Q3 m
安全方面,Zen架构诞生后爆发了大量的安全漏洞威胁,幸运的是Zen对于Meltdown熔断等诸多漏洞以及部分Spectre幽灵漏洞天然免疫,补丁都不需要,同时可以通过固件更新、系统补丁等修复受影响的Spectre幽灵漏洞。
  a7 w5 a# r4 u( e. ~Zen 2则在设计之中就从硬件层面防御了Spectre幽灵漏洞,不但绝对保证安全,也不会因为打补丁而导致性能损失。7 k0 \5 S" {5 H" e) x) A
以上就是AMD Zen 2架构在设计上的革新,以及结合7nm工艺带来的众多飞跃,至于实际产品表现,稍后分享官方性能数据,然后7月7日首发评测见!
# W8 X) }# h6 F5 K; ?1 X  Z5 E' i# Y& s8 E$ s( U5 ?
来源:http://www.yidianzixun.com/article/0MFEMhfv( ~" O0 @# T9 ~: D1 {4 a
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /6 下一条

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-7-27 13:47 , Processed in 0.053944 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表