AMD 勢如破竹 7NM 首發 ZEN2 架構 “ROME - 3C

Table of Contents

AMD 勢如破竹 7NM 首發 ZEN2 架構 “ROME” EPYC 64 核心處理器 / 精進 CHIPLET 小
核設計

https://goo.gl/J1Fmg5


AMD 今日舉辦的「Next Horizon」活動中,著重於「資料中心」產品的更新,包含著開放
資源的 ROCm 2.0 開放資源的 GPU 運算語言更新,以及 Amazon aws 加入 EPYC 平台,
提供 R5a / M5a / T3a 等平台,此外還有 7nm 首發的 “ROME” EPYC 處理器、Radeon
Instinct 運算加速卡,以及下一代「Zen 2」新架構設計預覽。

Amazon aws 加入 EPYC 平台

活動由 AMD CEO Lisa Su 親自開場,並揭曉 Amazon aws 加入 EPYC 平台,提供 R5a /
M5a / T3a 等平台,有著更高的核心密度、記憶體頻寬,以及最好的每美元性能比。


誠如今年預告一般,AMD 順利的推出 Zen+ 12nm 處理器,而規劃的 Zen 2 架構更新與
7nm 製程更是如預期一般,已經開始 Sampling 送樣當中,更預期在 2020 年間將有
Zen3 7nm+ 的更新規劃,Zen 4 更在規劃之中。

而 AMD 之所以能如期跨入 7nm 製程產品,則是 AMD 與 TSMC 深度合作,7nm 製程,不
僅可提升 2 倍的晶體密度,並有著將近 1.25 倍的性能提升,更讓功耗僅增加 0.5 倍。

更預期在每瓦效能表現上,於 2019 年即可比對手的 10nm 產品,得到更好的性能與功耗
表現。


有關「Zen 2」架構更新,AMD 也提到將有著 2 倍 Throughput 提升,增強執行緒、加
大 Floating Point 與 Load Store 單元,並提升核心密度。

Zen 2 將有新的前端(Front End)設計,強化分支預測、指令預取,並優化指令快取與
加大 Op 快取。此外,更提升 Floating Point 頻寬至 256-bit,有著更大的
Load/Store、Dispatch / Retire 頻寬。以及強化 Zen 架構安全性,強化記憶體加密預
防旁路攻擊。

更有趣的是 Zen 架構之初,所採用的 CPU Complex(CCX)架構,讓每個 Die 包含 2
組 CCX 單元,換句話說一個 Die 即擁有 8 個核心。而 EPYC 處理器則採用 4 顆 Die
打造 32 核心的處理器,每個核心之間通過 Infinity Fabric 連接。

Zen 2 將採用精進的「Chiplet」設計,將核心所需的 I/O、DRAM、Infinity Fabric 等
控制功能獨立出核心晶片,使得 Zen 2 架構可擁有多顆 7nm CPU Chiplet,以及一顆
14nm I/O Die 組合。

AMD Zen 2 採用精進的 Chiplet 7nm CPU 設計,更可在同功耗下提升 2 倍 Throughput
,更高的指令執行速度與強化安全性。


採用 Zen 2 架構 Chiplet 7nm CPU 設計的 EPYC 處理器 “ROME”,將達到 64 核心
128 執行緒的驚人效能,不僅性能翻倍更有著 4 倍 Floating Point 性能提升;更是首
款支援 PCIe 4.0 的 x86 處理器。

一顆 EPYC ROME 即可與 Intel Xeon Scalable 8180M 雙插槽伺服器對決,AMD 通過
Chiplet 7nm CPU 與獨立 14nm I/O Die,再次強化處理器的擴充彈性與性能。

預計 Zen 2 “ROME” 將在 2019 年推出,而下一代 Zen 3 “MILAN” 則在計畫當中;
運算卡 Radeon Instinct MI60 將在今年 Q4 推出,而下一代 “MI-NEXT” 運算卡亦在
規劃當中。

至於主流的 Ryzen 產品,則會採用相同的 Zen 2 架構,但核心數是否會一樣往上提升,
這就要看 AMD 對主流市場的規劃,以及主流市場是否需要超過 8 核以上的產品而定,這
應該在明年 CES 將會有答案。

--

All Comments

Daph Bay avatarDaph Bay2018-11-08
所以zen2沒有出消費級的cpu ??都伺服器的?
Kumar avatarKumar2018-11-12
首發是伺服器
Odelette avatarOdelette2018-11-16
之前就有說伺服器先啊,消費級的你要香還得等一陣子
Adele avatarAdele2018-11-21
這可以作相對Intel 密度更高的hpc
然後搭nv GPU tray 啊斯
Joseph avatarJoseph2018-11-23
越陳越香 消費級明年Q1Q2
Tristan Cohan avatarTristan Cohan2018-11-27
電蝦最黑暗的一天
Cara avatarCara2018-12-01
太香啦啦啦
Tracy avatarTracy2018-12-02
殺I拔N Amd一統江湖!
Sandy avatarSandy2018-12-04
打算賣多少 多久才能台灣上市
Carolina Franco avatarCarolina Franco2018-12-06
Sieg G翁
Megan avatarMegan2018-12-08
好香
Gary avatarGary2018-12-10
功耗僅增加0.5倍.是 x 1.5還是 x 0.5
Anonymous avatarAnonymous2018-12-11
兩倍的核心 1.5倍功耗
Liam avatarLiam2018-12-14
期待2020 7nm+幹爆牙膏的10nm 連遊戲都輸到脫褲
Caitlin avatarCaitlin2018-12-18
香到不行
Ida avatarIda2018-12-18
真香
Caitlin avatarCaitlin2018-12-21
https://i.imgur.com/5o185Vv.jpg
發表會的投影片
Odelette avatarOdelette2018-12-24
所以我說那個消費級7nm顯卡啥時出
Robert avatarRobert2018-12-28
yes
Brianna avatarBrianna2018-12-30
POWER 0.5x (Same performance)
Gary avatarGary2018-12-30
有看直播的人可以詳述一下那1.25X是在什麼情形下?
Freda avatarFreda2019-01-01
thx
Jack avatarJack2019-01-05
回某樓 7nm消費級顯卡要等到Nova架構了
Rosalind avatarRosalind2019-01-08
之前AMD就有說7nm VEGA只會出在專業GPU領域
Annie avatarAnnie2019-01-13
給你錢,趕快出遊戲卡
Hedwig avatarHedwig2019-01-13
沒差 問的 答的 都不會買
Eartha avatarEartha2019-01-13
給你錢出了直接買
Noah avatarNoah2019-01-15
真香
Carol avatarCarol2019-01-18
伺服器市場搶起來 intel QQ
Liam avatarLiam2019-01-20
災情的開端
Thomas avatarThomas2019-01-23
伺服器果然先行 戰起來戰起來
Edith avatarEdith2019-01-26
借問一下,今天早上花了一個小時了解一下這次的發
表內容,看完後跟女友表示很想買,但她說看這幹嘛,
不准你買,請問我是不是要把她趕出去?
Delia avatarDelia2019-01-27
nova架構是啥?是在說navi嗎?
Damian avatarDamian2019-01-29
4
買個東西還要管趕快把他趕出去
Daniel avatarDaniel2019-02-01
你要買什麼 自組伺服器?
Hazel avatarHazel2019-02-06
買消費級的u呀
Liam avatarLiam2019-02-08
Ryzen 3000 大概也在 Lab了
Christine avatarChristine2019-02-13
一個Zen2 die + 一個小的IO die,就是 Ryzen了
Regina avatarRegina2019-02-14
回樓下跟你女友說帶她出國玩然後就可以偷偷買
Rebecca avatarRebecca2019-02-19
樓上
Noah avatarNoah2019-02-22
女朋友什麼的才沒真香重要 趕出去正解
Agnes avatarAgnes2019-02-25
1.25X是頻率拉高的意思
power0.5大概是同頻的意思
Zanna avatarZanna2019-02-27
等消費級u跟遊戲卡 真香
Charlotte avatarCharlotte2019-03-01
請問數學小老師,那麼頻率拉高到1.25X時,功耗多少?
Brianna avatarBrianna2019-03-06
1.25x perf (at same power)
Edwina avatarEdwina2019-03-09
真的要重返榮耀了
Xanthe avatarXanthe2019-03-14
io chip開3個真的有便宜嗎...還是打算沿用到zen3
Frederica avatarFrederica2019-03-15
女朋友趕出去了嗎?
Megan avatarMegan2019-03-17
阿記錯了是Navi沒錯
Adele avatarAdele2019-03-18
消費級7nm GPU應該Navi上才看得到了
Rosalind avatarRosalind2019-03-19
跟整顆做7nm比便宜太多了
Harry avatarHarry2019-03-23
最差也是開兩顆tr4/sp3跟am4兩種
Wallis avatarWallis2019-03-27
zen2 不知道要不要換板子
Gary avatarGary2019-03-29
消費級趕快出,等著買了
Isla avatarIsla2019-03-31
不用換,AMD保腳位沿用到2020,只是舊板子你只能跑p
Jake avatarJake2019-04-04
cie3.0
Margaret avatarMargaret2019-04-05
把所有IO獨立出去的延遲的問題,不知道AMD會怎麼解
Kumar avatarKumar2019-04-06
用Server的角度來看 這問題基本不存在
Steve avatarSteve2019-04-07
真香2.0
Noah avatarNoah2019-04-08
他搞不好塞很大L4在IO, 延遲反而改善
Regina avatarRegina2019-04-10
不然io這麼大到底塞了什麼
Gilbert avatarGilbert2019-04-10
應該蠻多類比電路的吧
Anthony avatarAnthony2019-04-11
麻煩去看之前isscc的文章,zen一個ccx只有44mm^2,
一顆die大約200,等於off-core 的部分佔了一半以上
,把這些扣掉跟另一個die相聯用的I/O再乘四,差不多
就是你圖上看到的大小了
Ophelia avatarOphelia2019-04-13
所有這IO chip除了拉出來獨立以外沒什麼新東西囉?
Megan avatarMegan2019-04-17
射惹
Hedda avatarHedda2019-04-19
L4用SRAM做成本太高,延遲也高,不切實際,用DRAM做
延遲更高,開一個page就4KB,只讀一個cacheline太浪
費,只適合連續存取的程式,tag array用什麼做也是
個問題
Rebecca avatarRebecca2019-04-21
所以那顆IO chip裡面有什麼新東西可以透露嗎QQ
David avatarDavid2019-04-23
就128條PCIE 8組IMC 四組IF 幾個組U3S6 這樣也夠大
了吧 不過這樣良率不會差嗎 這應該超過300mm^2吧
Lucy avatarLucy2019-04-26
接近400 估算是38X
比Vega10還小 不太需要緊張
Ursula avatarUrsula2019-04-29
...良率堪憂 希望gf14已經克服這種大小
Eartha avatarEartha2019-05-01
EPYC和TR的毛利夠頂 消費級的AM4會小很多吧
Poppy avatarPoppy2019-05-02
而且38X比小霸王還略一些(估算約39X)
GF做這種大小應該良率和產能還算夠穩定了
Olga avatarOlga2019-05-03
300多mm2對GF來說也做得很輕鬆
Quanna avatarQuanna2019-05-08
更大顆的vega也已經是1.5年以前的事
John avatarJohn2019-05-09
AM4的IO/CPU組合應該就是跟那個基板專利的圖一樣,
肯定不是EPYC2那個大小的吧
Isabella avatarIsabella2019-05-11
真香~1700路過
Valerie avatarValerie2019-05-12
gf做大die是沒問題 但這個也只是io die 需要這樣下
重本嗎 大成這樣 會不會跟7nm ccx差不多貴
Mason avatarMason2019-05-16
請記得這是EPYC
Aaliyah avatarAaliyah2019-05-20
把記憶體控制器和IO整個獨立出來,跟上一代ZEN相比
Isla avatarIsla2019-05-22
算是有得有失
Robert avatarRobert2019-05-24
記憶體Latency應該不會比之前嚴重 之前動不動跨die
Rae avatarRae2019-05-25
Anandtech 那邊有人是猜測說為了提升7nm晶片的良率
才把IO和記憶體控制器整個獨立出去
Enid avatarEnid2019-05-28
問題是L3這樣搞看起來是不共用 或者需要交換
Victoria avatarVictoria2019-06-02
理論上CPU->IO晶片延遲一定會比內建還要多
Dora avatarDora2019-06-03
IO和MC獨立出去問題不大吧 這樣搞問題是L3之間交換
Eartha avatarEartha2019-06-04
這是物理限制,除非AMD有找到什麼新的方法
怎麼會不大?
Tristan Cohan avatarTristan Cohan2019-06-06
基於這是Server產品 比較是要跟之前EPYC做法比
Hedda avatarHedda2019-06-09
x86記憶體控制整合進CPU就是AMD先做的
Rebecca avatarRebecca2019-06-12
K8和K10就是靠這點跟P4和控肉對抗的
Ingrid avatarIngrid2019-06-17
之後intel也把記憶體控制器整合進CPU AMD Server就
兵敗如山倒了
Annie avatarAnnie2019-06-21
既然都說有改進延遲 那就等著看下去吧
Michael avatarMichael2019-06-24
如果延遲是退步 應該不敢這樣講
David avatarDavid2019-06-27
當年K8只整合進MC導致北橋性能輸蠻大的
並不是整個進去就好像一定棒 因為之前的做法拉更遠
Ethan avatarEthan2019-06-30
這做法好處很多阿 省7nm成本良率 還能順便填gf產能
解決不平衡的latency
Hedy avatarHedy2019-07-04
物理訊號確實走比較遠 但是可能再整個if架構優化補
回來 我猜大概有機會做到比之前好 但是要打平牙膏
皇直連還是不可能
Agnes avatarAgnes2019-07-04
最後可能是介再一代跟牙膏王中間的表現
Hedwig avatarHedwig2019-07-06
那也夠了 想想i是用什麼大die來做 人家用料奢華
Genevieve avatarGenevieve2019-07-06
這方案能在成本 性能抓個平衡 就很屌了
Mason avatarMason2019-07-09
牙膏直連雙路大概也不會贏啦...
Mason avatarMason2019-07-10
一路跟你雙路打 雙路打你四路
Candice avatarCandice2019-07-11
樓上,不要這樣,一路打雙路是8180,人家一路膠水已
經黏到48c啦
Olivia avatarOlivia2019-07-14
你用黏的就不要說自己是直連有贏了啊( ′_>`)
Edward Lewis avatarEdward Lewis2019-07-17
牙膏之前的QPI就跨Socket打平MCM了 如果要MCM對比
大概就變小輸了
Steve avatarSteve2019-07-21
說錯 如果維持雙Socket打新架構 大概變小輸
這架構最大好處就是交換不會有跨對角線直接Latency
爆炸 傳給誰應該都一樣速度
Quanna avatarQuanna2019-07-26
但還是有小缺點是8C一單位 跨出去就跨Die了
不過8C應該是很夠用了 沒這麼常跨出去
Skylar DavisLinda avatarSkylar DavisLinda2019-07-31
別忘了那個膠水48c也只能雙路96c而已,zen2雙路有12
8c怎麼比
Lauren avatarLauren2019-07-31
而且最重要的還是在價格效能,兩個大die膠水我不信
會便宜到哪
Doris avatarDoris2019-08-02
而且intel一直講的直連優勢在他膠水48c就消失了
Belly avatarBelly2019-08-03
其實我不太懂講到直連為什麼會扯到膠不膠水就是了
直連再講的是ram的讀取 扯膠水架構是l3交換 兩個
明明不同的事情
Poppy avatarPoppy2019-08-03
雖然zen2架構是犧牲ram去換平均的l3
Zora avatarZora2019-08-04
這種搞法會變慢的只有L3啊 RAM又不會
之前大概為了同步 RAM的LATENCY不漂亮
Elma avatarElma2019-08-04
Ram實際走的路徑有比較長 但到底能影響多少也不知道
犧牲的很少的可能性很大 所以是很好的做法
Todd Johnson avatarTodd Johnson2019-08-08
你要考慮到之前RAM動不動就會從其他DIE跨界移動
所以除了良好的狀況下 大致上都是縮減路徑的