中國論壇有居住在法國當地的網友摘要了一些其他文章的內容
http://bbs.saraba1st.com/2b/forum.php?mod=viewthread&tid=1357610&page=4&author
id=111353
縮網址:https://goo.gl/090GlY
內容可能有加入一些翻譯者觀點,建議不要反應過度w
--
架構上180度掉頭,方方面面抄outel
R&D預算不足,所以只能CCX一招鮮吃遍天,移動桌面伺服器全用一個玩意搭積木
功耗頻率方面:
頻率granularity從100mhz降到25mhz,最低頻400/550mhz
TDP則是4核65w,8核95w,32核180w
比起傳統CPU更偏向SoC:
MCM之間通過SDF互聯,片上集成8個SATA3, 3個USB3.0,4個LAN,HDA音效卡
AM4插座處理器32根PCIE3,但只有24根是和外界互聯的,16x給顯卡,4x給SSD,4x給南橋
(南橋雖然可有可無但首發還是有的)
物理插座:AM4,SP3,SP4
AM4版首發只有4c8t和8c16t兩種 (1或2個CCX)
SP3版伺服器用 (LGA),4個DIE組成膠水32c64t,8通道記憶體,雙路就是64c128t
SP4 (BGA)用來對抗Xeon D,最多16c32t,4通道記憶體
APU
AM4桌面版,FP5(BGA)移動版
最多只有4c8t,L3從8MB砍到4MB
獨顯PCIE砍到8x
IGP方面從512SP 1.1GHz升到704SP 1.2GHz,不到2TFLOPS,逼近RX460
號稱outel要用小aa的IGP????
解碼:VP9/H.264/H.265(Main10) 4K60fps
編碼:4K30fps
支援Miracast+WiGig(802.11ad)
--
開篇:比起bulldozer的進化,更像是抄outel
前端:
4路 64kb指令快取(L1-I),intel已經是8路 32kb了。 不再和bulldozer一樣核心間共用
微指令快取:抄2011年的sandy就有的東西,最大容量2000條指令,每週期8條微指令;
outel方面是1500條和每週期6條
解碼:每週期4指令,同outel。 IBQ排隊隊伍16位元組x20條,開啟SMT之後割成2條隊伍
,每條10條
後端:
調度器:沒能和outel一樣用上unified scheduler,整數和浮點是分開的,84整數,36浮
點;kaby lake則是97 unified。 總體上看zen每週期6條整數微指令,4條浮點
微指令
PRF:主要影響亂序執行能力,zen是168整數,160浮點。 Kaby lake是180/168,
bulldozer是192/160
ALU/AGU:Zen有4個ALU,2個AGU;bulldozer則是2個ALU,2個AGU
4個FPU,2個專精乘法,2個專精加法,支援FMA,對AVX2優化很差
快取:
L1-D:32k 8-way write-back。 延時4-5週期,同kabylake。 但每週期只能讀32位元組
,寫16位元組,只能和sandy看齊,從hotwell起outel已經是讀64,寫32了。 這會
大幅削弱zen的avx-256性能
L2:unified I+D,512k,比outel大。 延時12週期,同kaby lake,bulldozer是20週期
。每週期32位元組,只有hotwell的一半,看齊sandy
L3:每核心2MB,每CCX 8MB,不同於outel,是victim cache,延時35週期
--
在anandtech論壇裡翻拍雜誌裡ZEN架構圖
http://i.imgur.com/CdZruDB.jpg
--
http://bbs.saraba1st.com/2b/forum.php?mod=viewthread&tid=1357610&page=4&author
id=111353
縮網址:https://goo.gl/090GlY
內容可能有加入一些翻譯者觀點,建議不要反應過度w
--
架構上180度掉頭,方方面面抄outel
R&D預算不足,所以只能CCX一招鮮吃遍天,移動桌面伺服器全用一個玩意搭積木
功耗頻率方面:
頻率granularity從100mhz降到25mhz,最低頻400/550mhz
TDP則是4核65w,8核95w,32核180w
比起傳統CPU更偏向SoC:
MCM之間通過SDF互聯,片上集成8個SATA3, 3個USB3.0,4個LAN,HDA音效卡
AM4插座處理器32根PCIE3,但只有24根是和外界互聯的,16x給顯卡,4x給SSD,4x給南橋
(南橋雖然可有可無但首發還是有的)
物理插座:AM4,SP3,SP4
AM4版首發只有4c8t和8c16t兩種 (1或2個CCX)
SP3版伺服器用 (LGA),4個DIE組成膠水32c64t,8通道記憶體,雙路就是64c128t
SP4 (BGA)用來對抗Xeon D,最多16c32t,4通道記憶體
APU
AM4桌面版,FP5(BGA)移動版
最多只有4c8t,L3從8MB砍到4MB
獨顯PCIE砍到8x
IGP方面從512SP 1.1GHz升到704SP 1.2GHz,不到2TFLOPS,逼近RX460
號稱outel要用小aa的IGP????
解碼:VP9/H.264/H.265(Main10) 4K60fps
編碼:4K30fps
支援Miracast+WiGig(802.11ad)
--
開篇:比起bulldozer的進化,更像是抄outel
前端:
4路 64kb指令快取(L1-I),intel已經是8路 32kb了。 不再和bulldozer一樣核心間共用
微指令快取:抄2011年的sandy就有的東西,最大容量2000條指令,每週期8條微指令;
outel方面是1500條和每週期6條
解碼:每週期4指令,同outel。 IBQ排隊隊伍16位元組x20條,開啟SMT之後割成2條隊伍
,每條10條
後端:
調度器:沒能和outel一樣用上unified scheduler,整數和浮點是分開的,84整數,36浮
點;kaby lake則是97 unified。 總體上看zen每週期6條整數微指令,4條浮點
微指令
PRF:主要影響亂序執行能力,zen是168整數,160浮點。 Kaby lake是180/168,
bulldozer是192/160
ALU/AGU:Zen有4個ALU,2個AGU;bulldozer則是2個ALU,2個AGU
4個FPU,2個專精乘法,2個專精加法,支援FMA,對AVX2優化很差
快取:
L1-D:32k 8-way write-back。 延時4-5週期,同kabylake。 但每週期只能讀32位元組
,寫16位元組,只能和sandy看齊,從hotwell起outel已經是讀64,寫32了。 這會
大幅削弱zen的avx-256性能
L2:unified I+D,512k,比outel大。 延時12週期,同kaby lake,bulldozer是20週期
。每週期32位元組,只有hotwell的一半,看齊sandy
L3:每核心2MB,每CCX 8MB,不同於outel,是victim cache,延時35週期
--
在anandtech論壇裡翻拍雜誌裡ZEN架構圖
http://i.imgur.com/CdZruDB.jpg
--
All Comments