anandtechs TR2測試:核心數的下個戰場是互連 - 3C

Table of Contents


AMD threadripper2各家測試都有跑分,但看到這個部份覺得比較有趣
補充2:經指正,原文脈絡請見推文K大的描述,以下的說明和原文脈絡有些差異
https://www.anandtech.com/show/13124/the-amd-threadripper-2990wx-and-2950x-review/4
縮網址: https://goo.gl/hzbXjj

在原文第二頁也還有一些前導說明

這部份主要是在說明intel與AMD兩家使用不同的作法連接各個核心與核心,
因此在 "CPU" 吃的電力中有不同比例的被「在核心之間傳資料」消耗掉,
文中有拿兩家CPU比較:
intel的不同CPU連接作法又不同,但消耗的電力都是隨著負載上升而明顯上升
AMD的IF使用電力上升較快,在輕度負載時就吃到很多,但隨著負載上升的上升幅度較小
最後,作者覺得在核心數戰爭後,下個戰場在低能耗、高擴展性、高效能的CPU互連

如果覺得上面解釋不太清楚,點開網頁看一下圖片會好懂很多
或是以農場文風格標題解釋就是:
「驚!AMD CPU竟然有那麼多能源都花在膠水上」
但這句話不代表AMD也要在CPU建造暖爐,只是說不同設計各有不同特色
現在IF看起來是迅速幫AMD站穩腳步,在核心數上取得勝利,也活絡了市場
就看之後AMD能幫IF優化到什麼程度,以及intel要如何應對

補充:
比較簡單直白的結論,除了上面半開玩笑的農場文標題,
就是當AMD CPU在低負載時因為IF設計的關係可能會相較intel耗電,
除此之外是是原文作者結論頁提出的: 有些工作負載會因此不具擴展性,甚至變差
但剛剛掃過去還沒看到直接的例子,回應也有人提出疑問說這些數據是怎麼測量的
因此可以先用比較保留的態度看看
--
レイネシア:「高い水準で誇り高い仕事を遂行するためには、
      心身の疲れを癒やすことも必要だと──」
アイザック:「この屁理屈、クラスティの影響受けけてねぇか?」
レイネシア:「──思うんです」
            -ログ・ホライズンEp13 夜啼鳥の唄

--

All Comments

Isabella avatarIsabella2018-08-15
為什麼還可以用google縮網址?
Skylar DavisLinda avatarSkylar DavisLinda2018-08-20
google縮網址出了什麼包嗎?
Ida avatarIda2018-08-22
感謝解答
Robert avatarRobert2018-08-24
一個中心化 一個各自成為節點的差異八
Connor avatarConnor2018-08-29
AMD就是一開始就燙到發癲隨著超到脫肛還是燙的發狂
intel超智慧省電管理 需要的時候馬力全開不需要的
時候大家一起守護地球不要超抽電力 end
Hardy avatarHardy2018-09-02
低負載都是AMD比較省電
James avatarJames2018-09-07
目標在Server的話 輕載應該也沒那麼重要?
Quintina avatarQuintina2018-09-08
感謝C52為我們帶來真香™的註解
Mason avatarMason2018-09-13
說實話我覺得這代是在擠牙膏啦 晶片本身沒什麼改進
Megan avatarMegan2018-09-15
只是多黏兩顆直接下放 感覺上就直接*2
Carol avatarCarol2018-09-19
可能壓制intel意義較大吧, 畢竟核心數真的很好看
Franklin avatarFranklin2018-09-21
只能說至少2950X便宜$100再加上頻率上拉一點
Lauren avatarLauren2018-09-24
7nm可能才會在功耗上比較有進步
Ivy avatarIvy2018-09-29
我覺得你下的結論怪怪的,Anandtech 是在比較兩邊
Ophelia avatarOphelia2018-10-03
CPU核心的方式,隨著核心用的IF越多,IF所佔的功耗
Daniel avatarDaniel2018-10-08
愈多,在伺服器用的EPYC甚至一半的功耗都花在IF
Todd Johnson avatarTodd Johnson2018-10-11
拿來比較的7980EX的Mesh則大概占了20~30%之間
Sierra Rose avatarSierra Rose2018-10-11
Intel和AMD只要使用的核心數量到某個比例後,所耗的
Todd Johnson avatarTodd Johnson2018-10-11
epyc互聯需要跨die if功耗比較高算正常吧
Steve avatarSteve2018-10-15
功耗就會停在某個範圍了
Eden avatarEden2018-10-18
雙方核心的都滿載使用得情況下,IF還是比Mesh要說
Carol avatarCarol2018-10-23
雙方核心的都滿載使用得情況下,IF還是比Mesh更吃電
Delia avatarDelia2018-10-24
也沒辦法下結論說滿載下AMD有優勢
Una avatarUna2018-10-26
至少在性能和功耗上沒看到明顯的優於Intel目前所使
用的Mesh
Olga avatarOlga2018-10-31
我個人認為IF應該是AMD權衡功耗、性能和成本所認為
當前的最佳解,IF真正優勢可能是在成本
Oliver avatarOliver2018-11-01
*設計晶片的成本
Vanessa avatarVanessa2018-11-02
拿EPYC直接跟7980XE來比結論會很詭異 EPYC那部分一
開始就很高了 大家其實也知道EPYC用起來實際上很接
近多路 這比較恐怕要兩邊都放在雙路版上來看才能得
出比較有意義的資料
Hedy avatarHedy2018-11-05
單塊 EPYC 比較對象應該是 3647 腳位的Xeon
Ula avatarUla2018-11-08
7980XE要對照應該是對2950X吧
Valerie avatarValerie2018-11-13
不過不知道為什麼 Anandtech 沒有一起拿出來測
Steve avatarSteve2018-11-15
覺得2950X對2990WX低載的部分比較有趣
John avatarJohn2018-11-18
同樣是2T loaded在IF部分消耗差距卻很大
Dora avatarDora2018-11-20
因為2990WX用的IF比較多
Kristin avatarKristin2018-11-24
你的每一段不管農不農場 我都看不懂 我一定是跟c52
聊太久被113文組同化惹
Frederica avatarFrederica2018-11-28
我是指這設計針對的目標
Linda avatarLinda2018-12-02
IF比較多不代表每一條IF隨時都要吃電啊
原文就有提這方面的疑問
Susan avatarSusan2018-12-05
2990WX要用IF跟MESH比對手也該是28C的
Ethan avatarEthan2018-12-06
不過我覺得還是都比雙路Server最直接
Yedda avatarYedda2018-12-06
所以筆電APU就只有一個CCX
Bennie avatarBennie2018-12-11
我不覺得IF設計上會比較簡單啦 IF是額外一個HUB
Suhail Hany avatarSuhail Hany2018-12-15
特別處理IO Mesh概念比較像是每個CPU獨立 講難聽一
點就是做好一顆複製貼幾顆都好
Faithe avatarFaithe2018-12-17
不過最後都模組化了 其實也都還好 IF中心思想是個快
Andy avatarAndy2018-12-21
速的IO框架讓這些開發簡單一點
Daph Bay avatarDaph Bay2018-12-25
我突然好奇zen 3會是走mesh化還是繼續ccx模式
Jake avatarJake2018-12-25
某種程度上Zen架構跟Mesh沒差多少啊
只是單一節點從一顆變成一包CCX=而已
但是IF整個還是個黑箱子 也不知道到底幹了啥
Adele avatarAdele2018-12-28
*if模式
Freda avatarFreda2019-01-01
不過我更加有興趣的是intel和amd在快取上變得兩極
Anonymous avatarAnonymous2019-01-04
intel是跑去堆L1,amd繼續維持傳統的cache佈局
Edwina avatarEdwina2019-01-09
我記得好像有測過X299的改動沒什麼好效果
Blanche avatarBlanche2019-01-11
拓樸結構的差異跟晶片layout的難度不曉得有沒有關
Isla avatarIsla2019-01-12
mesh核心少的時候沒什麼優勢
其實兩邊都是為了堆更多核心才這樣玩 只是方向差很
Adele avatarAdele2019-01-14
mesh在虛擬化的性能和靈活度會比IF好不少
Oliver avatarOliver2019-01-18
c521被AMD燙到脫肛還直說:真香
Heather avatarHeather2019-01-19
好燙的屌
Christine avatarChristine2019-01-20
樓上早期鄉民 XD
Hardy avatarHardy2019-01-22
上面兩樓是專業老屁股
Puput avatarPuput2019-01-23
記憶體瓶頸已經被研究很久了
Yedda avatarYedda2019-01-25
mesh的問題在於雖然資料一致性的問題被解決
Adele avatarAdele2019-01-26
但是整體的延遲還是增加~未必會比IF的方式快
Anthony avatarAnthony2019-01-26
但是IF的設計複雜度比mesh高很多
Joseph avatarJoseph2019-01-30
如果四顆互連的難度是2^4八顆互連的難度是2^8
Dorothy avatarDorothy2019-02-03
所以傳言中的IO chip不就為了解決這問題產生的
而且也不太可能無限制跨die互連 太小顆不划算
Frederic avatarFrederic2019-02-05
mesh是同一個die, 延遲比跨ccx小多了
Jack avatarJack2019-02-08
但大Die做不出來的問題比延遲更大
Suhail Hany avatarSuhail Hany2019-02-12
被人家32核打18核....