Core 2 Duo的十年:一場intel與AMD的生死 - 3C

By Daniel
at 2016-09-12T13:34
at 2016-09-12T13:34
Table of Contents
http://www.evolife.cn/html/2016/88925.html
距離intel著名的64bit處理器Core 2 Duo發佈已經整整十年,從普及型的E6400到旗艦級
的Core2 Extreme X6800,這一系列由intel 65nm製程打造的處理器中有太多的經典產品
。 可以說,Core 2 Duo是桌面平臺處理器的轉捩點,引用Anandtech當年的評價就是:「
這是半導體有史以來最振奮人心的產品」。
http://img.evolife.cn/2016-09/d3ae51fe4c41a857.jpg
Core 2 Duo的發佈大幅改變了處理器的版圖,過去Netburst家族以Northwood和Prescott
核心為首的Pentium4和Pentium D處理器一味飆主頻的路線已經走火入魔,半導體的發展
方向一再偏離效率,帶來了巨大的發熱和功耗問題,在90nm遇到嚴重瓶頸後(進入90nm製
程後,業界發現之前摩爾定律一貫的製程提升, 功耗下降的規律失靈了,prescott處理
器因為發熱過大無法按既定路線突破4Ghz,甚至引發了散熱器大規模換代),對手AMD的
Athlon 64X2處理器同時在性能和效率加冕為王。
當時的intel被迫做出重大修正,微架構上拋棄了對主頻飆升有利的超長流水線設計,引
入大量來自Pentium PRO和Pentium M的技術,但並不是僅僅在Yonah的微架構上增加一些
新功能或者解碼器那麼簡單(在十年前盛傳Core 2 Duo僅僅是Yonah的增強版)。 是時候來
回顧一下Core 2 Duo帶來的震撼了。
十年前發佈的Conroe有如下五款產品:
http://img.evolife.cn/2016-09/f74ec940fbb1e400.jpg
旗艦產品X6800主頻高達2.93Ghz,支援更高的前端匯流排頻率,晶片面積143平方mm,比
前代Pentium D的162平方mm更小,由於不集成GPU,十年前的處理器比今天的產品小得多
。
http://img.evolife.cn/2016-09/f74e8fadcead3359.jpg
當年X6800的價格為999美元,跟今天8核的Core i7-5960X相當,而E6400則為224美元,和
Core i5-6600一致,有意思的是,不知道是不是為了快點跟昨天說再見,intel把昨天還
是次旗艦產品的3.4Ghz的Pentium D 945砍到比E6300還低的163美元,這是intel桌面處理
器歷史上獨一無二的事件。
--一切盡在預取 (Prefetch)--
CPU執行的指令來自解碼器,資料取自快取記憶體(Cache),在理想環境中,資料和指令都
可以從底層快取中獲取(一級快取,L1 Cache),延遲極低,不存在瓶頸。 現實環境可沒
那麼樂觀,延遲完全靠猜,核心預測所需資料並且在用到它們之前放入底層快取的能力決
定了現實環境的延遲,這項技術就是預取。
Core 2 Duo微架構增加了多重預取,這是過去在消費級處理器中從沒出現過的,並且改進
了預取演算法,每個核心有兩個數據和一個指令預取,加上二級快取的兩個預取,在雙核
Core 2 Duo中總共有8個預取來維持處理器高效執行。
http://img.evolife.cn/2016-09/9f69d742946d5c9d.jpg
另一方面,預取還是為快取索引做查找標籤,資料預取這麼做是為了避免程式運行的時候
出現高延遲,資料預取是通過存儲埠(store port)進行快取索引,因為原則上載入操作
(Load)的頻度是存儲操作(Store)的兩倍,intel在Core 2 Duo中巧妙的把存儲埠這一相對
空閒給利用起來。
--快取,多多益善--
離開了低延遲資料和指令存取,快速核心將會一文不值,所以最貴的SRAM作為一級快取被
用在離執行單元最近的位置,這裡寸土寸金,限制了一級快取的容量,所以CPU中的快取
記憶體都被設計成嵌套的結構,容量大得多的二級快取(L2 Cache)被放在週邊,一級快取
不命中(Cache Miss)就得到二級快取甚至記憶體中查找資料, 這些操作會帶來延遲,影響
執行速度。 因此,快取容量,多多益善,Core 2 Duo擁有比前代產品以及競爭對手都要多
的快取。
http://img.evolife.cn/2016-09/8cca8cdcde35b465.jpg
Core 2 Duo的快取設計較前代Pentium4的變化體現在一級快取大幅增加到32KB,,延遲降
低到3個時鐘週期,二級快取則為雙核共用的4MB,延遲降低到12~14時鐘週期。 對手AMD
的K8雖然有更大容量的一級快取,內置記憶體控制器的設計相比Pentium4有較大優勢,但
頻寬偏小,二級快取容量也有明顯差距,實測表明,Core 2 Duo一級快取頻寬為K8的2倍
,二級快取則達到2.5倍。
--解碼,四發射與融合--
解碼器的作用是對指令進行解碼,並且將這些長度為1~15位元組不等的指令翻譯成類RISC
的定長指令便於執行,在Core 2 Duo中,稱之為微操作(micro-op)。 預取配合解碼是當
代X86處理器設計的核心,Core 2 Duo中有四組解碼器,其中三組為簡單解碼器,一組是
複雜解碼器,前者能將指令翻譯成一條微操作,功耗更低電晶體更少,而後者則可以轉換
出四條(長指令的利器)。 這就是俗稱的四發射,Core 2 Duo是X86桌面處理器中引領了四
發射的潮流。
此外,Core 2 Duo加入了宏操作融合(Macro-op Fusion),這樣兩條常規X86指令(或者宏
操作)會被同時解碼以增加併發,同時允許一條微指令包含兩條電腦指令,這使得四個解
碼器單週期最多可以解析5條指令,相當於增加了解碼頻寬,這樣也降低了亂序執行(OoO)
所需要的緩衝大小。 在當時,經典的X86程式,20%的宏操作可以被這樣融合,由此可以
帶來11%的性能提升。
http://img.evolife.cn/2016-09/1c2992f6f9ad3068.jpg
另一項特別的技術是指令直接跟記憶體位址融合,在經典的RISC規範中,需要添加寄存器
查找記憶體位址的指令,所以傳統上要用到3條微操作:
http://img.evolife.cn/2016-09/9eed06dce518ca72.jpg
但從Banias核心的Pentium M開始,由於有了新技術,表中的前兩條微操作可以被融合,
這稱為微操作融合(micro-op fusion),在預解碼階段就辨識出可以融合的宏操作能夠提
升併發、降低對緩衝的壓力,提高效能,配合SSE/SSE2效果更佳,這是Core 2 Duo壓倒
AMD K8的主要原因
http://img.evolife.cn/2016-09/5c01799013ebe38d.jpg
AMD也有微操作跟宏操作,不過定義跟intel是不同的,因為AMD的解碼器是三組複雜解碼
器,通過直連路徑(Direct PATH)可以像簡單解碼器那樣快速處理,通過向量路徑
(Vector Path)就是複雜解碼器模式,差距在於,AMD沒有宏操作融合,在執行SSE指令的
時候需要更多的時鐘週期,加上解碼器數量3對4,解碼併發3對5, 在前端曾經風光無限
的AMD K8已經輸了一截。
--亂序執行OOOE--
預取、快取記憶體和解碼上的努力要通過亂序執行來發揮,亂序執行本身的增強靠的是增
加執行單元和亂序記錄快取來實現。
http://img.evolife.cn/2016-09/60f5f13fe684e49b.jpg
對比AMD K8,Core 2 Duo的亂序執行的優勢體現在三點上,一是記錄快取96 ENTRY VS
72 ENTRY,Core 2 Duo的前端有更高的併發,記錄快取也有4:3的優勢。 二是調度管理方
面相比AMD拆分為24-ENTRY整型跟36-entry浮點,Core 2 Duo為統一的32entry保留站,三
是SSE執行單元數量達到三個,能夠最大化利用到宏操作融合的優勢,另外,Core 2 Duo
的SSE執行單元是128bit位寬,AMD只有64bit,在執行128bit SSE指令時候Core 2 Duo有
壓倒性優勢
http://img.evolife.cn/2016-09/b9b1f7a3abfb0c76.jpg
--存取也瘋狂--
Core 2 Duo強大的前端跟亂序執行帶來的是更大的資料吞吐需求,intel發現如果允許下
一次載入(Load)在存儲(Store)之前操作,就可以實現載入提速和降低延遲,其風險在於
,存在需要載入尚待存儲資料的可能(大約1~2%的幾率),這時候就需要浪費20個時鐘週期
等待重新載入,為此,在Core 2 Duo中加入預測器可以避免這一場景出現。
http://img.evolife.cn/2016-09/388e08554607e402.jpg
預測器(Predictor)允許在資料存儲之前載入,同時衝突偵測邏輯(Conflict logic)會掃
描亂序緩衝區(Memory reorder Buffer MOB)查找問題,一旦發現立即執行重載入,在最
壞的情況下性能會有所損失。 根據intel的說法性能提升幅度可以達到40%,實際執行環
境中也能有10~20%的增速,在整型操作中優勢尤為明顯。
--超執行緒不再,也沒有內置記憶體控制器--
十年後的今天,超執行緒(HT)和內置記憶體控制器(IMC)是X86處理器的最基本屬性,
在當時,前任Pentium4引領過超執行緒的潮流,對手AMD則率先將內置記憶體控制器引入
了PC領域,但Core 2 Duo一個都沒有。
同步超執行緒技術(Simultaneous Hyper-Threading SMT)需要在快取記憶體中開出更大的
緩衝區來滿足多出一倍的資源的要求,Core 2 Duo引領時代的前端設計已經是對當時製程
的極限的挑戰,超執行緒實在是心有餘而力不足,內置記憶體控制器AMD靠的是SOI製程的
的先天優勢實現,一旦製程允許,超執行緒自然會回來,內置記憶體控制器也不是問題,
後來的nehalem不就是這麼做的麼? (原文以超執行緒優勢體現在伺服器上和有FB-DIMM
記憶體為由洗地理由並不充分)
--廉頗老矣尚能飯否?--
在2006年,即使是最弱的E6300,都可以在很多測試中輕鬆放倒之前的旗艦產品Pentium
XE 965,中堅產品E6600則成功擊敗AMD最新的旗艦產品FX-62,而旗艦產品X6800更是比
E6300強了近一半。
http://img.evolife.cn/2016-09/73a8eaf57ba498fb.jpg
今天的214美元產品I5-6600 VS當年同價位的E6400,十年來我們的CPU足足快了一倍,就
連入門級產品G1620也輕而易舉的戰勝了E6400,但是不要忘記這是2.13Ghz的E6400跟一群
主頻接近4Ghz的產品作對比,事實上很多Core 2 Duo使用者後來升級到Sandy bridge後就
再也沒有換代過。
http://img.evolife.cn/2016-09/3a6ce6dd56e0e872.jpg
回顧十年前Core 2 Duo發佈後發現,在當今的skylake處理器中依舊延續了Core 2 Duo的
框架:四發射、操作融合、大容量共用快取記憶體等,當然,隨著製程的進步,intel在
nehalem加入了記憶體控制器、北橋功能和三級快取記憶體,在Sandy Bridge中引入了微
操作融合快取(micro-op cache)和eDRAM,Core 2 Duo的故事仍然沒有結束。
而那個在Core 2 Duo時代被一舉拿下的對手AMD在十年間一蹶不振,K10和bulldozer麻煩
不斷,幾乎完全退出了中高端領域的競爭,直到最近才借著新核心Zen喊出「我回來了」
,然而仔細看Zen的PPT,仍然沒有看到類似當年Core 2 Duo那樣石破驚天的變化,所以,
AMD也許能重返中端,但論挑戰似乎還很遠。
--展望未來 後10至15年的半導體路線圖--
在conroe十周年紀念的日子裡正值國際半導體技術路線圖報告(International
Technology Roadmap for Semiconductors ITRS)出爐,這份由全球各大洲的半導體工業
的專家共同起草的長達500頁的雙年報告,是廣大從業者的重要參考。 報告從設備調試、
製程集成、射頻(RF)、微機電(MEMS)、光刻、封裝測試、改善良品率等多方面深入探討半
導體工業的未來。
在過去,報告準確的預測過現在流行的finfet技術的流行,但也忽視過半導體的很多瓶頸
,比如以下這份1993年的報告(也就是最早的報告):
http://img.evolife.cn/2016-09/bc7fb5f7646657da.jpg
實際的特徵線寬的發展表面超越了1993年的預測,2001年就開始的130納米製程在預測中
被放到了2004年,而這時候正是intel撞上了90nm大牆。 互連層則落後不少,預測中2004
年將採用6層互連,實際上2002年AMD消費級的Thoroughbred B處理器就用到了9層銅互連
。 功率問題恐怕是整個業界的始料未及,2001年40瓦的功耗早已被主頻大戰拋在腦後,
正如本文開頭所述,半導體偏離了正軌,讓高功耗時代提早到來,經歷過那個時代的玩家
都知道,2001年的高端散熱器放在2004年根本小菜一碟,因為根據長期預測,散熱大規模
引入熱管可以等到2004年,這就是偏離的後果。
至於晶片大小方面,如果用熟知的CPU、GPU來判斷的話1250平方mm可能是天方夜譚了,畢
竟就算到了今天,14/16nm時代,150億電晶體,610平方mm的NVIDIA P100處理器幾乎到了
認知極限。 但這畢竟是整個行業的報告,就拿圖像感應器來說,全幅CIS的尺寸大致是
864平方mm,業界量產的時間也正好是2000~2001年,如今,索尼已經能夠量產33x44幅面
的感應器(面積接近1500平方mm),所以面積一說相當準確。
http://img.evolife.cn/2016-09/dd55b3eda38dab9b.jpg
廢話了這麼一長串只是想表達,每一期的報告,都是相當有技術含量的存在,值得參考,
那麼,未來10年~15年會是怎麼一個狀況呢?
--450mm晶圓和2nm制程--
450mm晶圓(18寸)是十年前就在討論的概念,然而由於這十年間半導體世界被各種障礙搞
得團團轉,以至於更大的晶圓都被人遺忘了,此次ITRS給出了新的時程表, 2021年的
DRAM製程上會用到450mm大晶圓,還要等五年。
http://img.evolife.cn/2016-09/8a992ff2ac9eb6bd.jpg
到了2021年,DRAM的核心面積將縮小到780平方納米,當今的數位為3480,2021將是最後
的finfet(鰭式場效應電晶體),在2030年會看到2nm製程。
http://img.evolife.cn/2016-09/fcc7b156e64bdada.jpg
今天的當紅小生Finfet還有5年的發展期,進入7nm的時程表是2019年,2021年在5nm上終
結。 讓Athlon64大紅大紫的SOI製程(絕緣體上矽)則會在2017年終結,末代皇帝將是
10nm FDSOI,取代Finfet的將是VGAA(vertical gate all-around),2021年登場,預計會
在2030年進入2nm制程,這時候的核心電壓僅為0.4V。 制程的未來之路是坎坷的,5nm以
後會怎樣仍然有很大變數。
NAND快閃記憶體,大家不要慌,不會有什麼QLC了,前些年在剛引入TLC NAND(3bit)的時
候業界還在預測QLC(4bit)的存在,經過這些年的發展可能業界自己對QLC的可行性已經失
去信心,畢竟TLC已經是毒瘤般的表現,於是ITRS的預測中完全沒有看到QLC的存在,萬幸
。
http://img.evolife.cn/2016-09/7825402874816d28.jpg
未來NAND仍然得靠3D堆疊來實現擴容,當前單封裝密度為三星850EVO上48層堆疊的
256Gbit,到了2022年可以達到128層1Tbit,2030年到512層4Tbit,這時候就會看到64TB
的SSD了。
--手持平臺32核8K顯示是未來?--
ITRS對手持平臺的預測是基於當前手機SOC蓬勃發展的,2016年6核CPU 12核GPU,
26.9Gbps記憶體頻寬,4.42瓦功耗的資料實際已經開始偏離效率,從2014年開始手機SOC
對先進製程的渴望就趕上了桌上型電腦CPU,以至於近年台積電不斷表示10nm要比intel早
,intel也毫不在乎。 到2019年也許還能看到18核3.2Ghz,49GPU核心的怪物,但2024年
真能看到3.8Ghz 32核CPU 189核GPU輕鬆實現8K應用的怪物麼? 值得懷疑,畢竟今天的表
現都已經是對當前製程的深度榨取。
http://img.evolife.cn/2016-09/21b5dbde31cda68e.jpg
傳統意義上的摩爾定律早已消亡,但在今年的ITRS報告中依舊可以清楚的看到摩爾定律的
影子,尤其是那張移動SOC的發展路線圖,樂觀程度堪比沒有撞上90nm大牆時候的intel,
這就是所謂的永生吧。
http://img.evolife.cn/2016-09/22fffffb54eafbd8.jpg
--
Core 2 Duo = 擠爆牙膏的intel
--
距離intel著名的64bit處理器Core 2 Duo發佈已經整整十年,從普及型的E6400到旗艦級
的Core2 Extreme X6800,這一系列由intel 65nm製程打造的處理器中有太多的經典產品
。 可以說,Core 2 Duo是桌面平臺處理器的轉捩點,引用Anandtech當年的評價就是:「
這是半導體有史以來最振奮人心的產品」。
http://img.evolife.cn/2016-09/d3ae51fe4c41a857.jpg

Core 2 Duo的發佈大幅改變了處理器的版圖,過去Netburst家族以Northwood和Prescott
核心為首的Pentium4和Pentium D處理器一味飆主頻的路線已經走火入魔,半導體的發展
方向一再偏離效率,帶來了巨大的發熱和功耗問題,在90nm遇到嚴重瓶頸後(進入90nm製
程後,業界發現之前摩爾定律一貫的製程提升, 功耗下降的規律失靈了,prescott處理
器因為發熱過大無法按既定路線突破4Ghz,甚至引發了散熱器大規模換代),對手AMD的
Athlon 64X2處理器同時在性能和效率加冕為王。
當時的intel被迫做出重大修正,微架構上拋棄了對主頻飆升有利的超長流水線設計,引
入大量來自Pentium PRO和Pentium M的技術,但並不是僅僅在Yonah的微架構上增加一些
新功能或者解碼器那麼簡單(在十年前盛傳Core 2 Duo僅僅是Yonah的增強版)。 是時候來
回顧一下Core 2 Duo帶來的震撼了。
十年前發佈的Conroe有如下五款產品:
http://img.evolife.cn/2016-09/f74ec940fbb1e400.jpg

旗艦產品X6800主頻高達2.93Ghz,支援更高的前端匯流排頻率,晶片面積143平方mm,比
前代Pentium D的162平方mm更小,由於不集成GPU,十年前的處理器比今天的產品小得多
。
http://img.evolife.cn/2016-09/f74e8fadcead3359.jpg

當年X6800的價格為999美元,跟今天8核的Core i7-5960X相當,而E6400則為224美元,和
Core i5-6600一致,有意思的是,不知道是不是為了快點跟昨天說再見,intel把昨天還
是次旗艦產品的3.4Ghz的Pentium D 945砍到比E6300還低的163美元,這是intel桌面處理
器歷史上獨一無二的事件。
--一切盡在預取 (Prefetch)--
CPU執行的指令來自解碼器,資料取自快取記憶體(Cache),在理想環境中,資料和指令都
可以從底層快取中獲取(一級快取,L1 Cache),延遲極低,不存在瓶頸。 現實環境可沒
那麼樂觀,延遲完全靠猜,核心預測所需資料並且在用到它們之前放入底層快取的能力決
定了現實環境的延遲,這項技術就是預取。
Core 2 Duo微架構增加了多重預取,這是過去在消費級處理器中從沒出現過的,並且改進
了預取演算法,每個核心有兩個數據和一個指令預取,加上二級快取的兩個預取,在雙核
Core 2 Duo中總共有8個預取來維持處理器高效執行。
http://img.evolife.cn/2016-09/9f69d742946d5c9d.jpg

另一方面,預取還是為快取索引做查找標籤,資料預取這麼做是為了避免程式運行的時候
出現高延遲,資料預取是通過存儲埠(store port)進行快取索引,因為原則上載入操作
(Load)的頻度是存儲操作(Store)的兩倍,intel在Core 2 Duo中巧妙的把存儲埠這一相對
空閒給利用起來。
--快取,多多益善--
離開了低延遲資料和指令存取,快速核心將會一文不值,所以最貴的SRAM作為一級快取被
用在離執行單元最近的位置,這裡寸土寸金,限制了一級快取的容量,所以CPU中的快取
記憶體都被設計成嵌套的結構,容量大得多的二級快取(L2 Cache)被放在週邊,一級快取
不命中(Cache Miss)就得到二級快取甚至記憶體中查找資料, 這些操作會帶來延遲,影響
執行速度。 因此,快取容量,多多益善,Core 2 Duo擁有比前代產品以及競爭對手都要多
的快取。
http://img.evolife.cn/2016-09/8cca8cdcde35b465.jpg

Core 2 Duo的快取設計較前代Pentium4的變化體現在一級快取大幅增加到32KB,,延遲降
低到3個時鐘週期,二級快取則為雙核共用的4MB,延遲降低到12~14時鐘週期。 對手AMD
的K8雖然有更大容量的一級快取,內置記憶體控制器的設計相比Pentium4有較大優勢,但
頻寬偏小,二級快取容量也有明顯差距,實測表明,Core 2 Duo一級快取頻寬為K8的2倍
,二級快取則達到2.5倍。
--解碼,四發射與融合--
解碼器的作用是對指令進行解碼,並且將這些長度為1~15位元組不等的指令翻譯成類RISC
的定長指令便於執行,在Core 2 Duo中,稱之為微操作(micro-op)。 預取配合解碼是當
代X86處理器設計的核心,Core 2 Duo中有四組解碼器,其中三組為簡單解碼器,一組是
複雜解碼器,前者能將指令翻譯成一條微操作,功耗更低電晶體更少,而後者則可以轉換
出四條(長指令的利器)。 這就是俗稱的四發射,Core 2 Duo是X86桌面處理器中引領了四
發射的潮流。
此外,Core 2 Duo加入了宏操作融合(Macro-op Fusion),這樣兩條常規X86指令(或者宏
操作)會被同時解碼以增加併發,同時允許一條微指令包含兩條電腦指令,這使得四個解
碼器單週期最多可以解析5條指令,相當於增加了解碼頻寬,這樣也降低了亂序執行(OoO)
所需要的緩衝大小。 在當時,經典的X86程式,20%的宏操作可以被這樣融合,由此可以
帶來11%的性能提升。
http://img.evolife.cn/2016-09/1c2992f6f9ad3068.jpg

另一項特別的技術是指令直接跟記憶體位址融合,在經典的RISC規範中,需要添加寄存器
查找記憶體位址的指令,所以傳統上要用到3條微操作:
http://img.evolife.cn/2016-09/9eed06dce518ca72.jpg

但從Banias核心的Pentium M開始,由於有了新技術,表中的前兩條微操作可以被融合,
這稱為微操作融合(micro-op fusion),在預解碼階段就辨識出可以融合的宏操作能夠提
升併發、降低對緩衝的壓力,提高效能,配合SSE/SSE2效果更佳,這是Core 2 Duo壓倒
AMD K8的主要原因
http://img.evolife.cn/2016-09/5c01799013ebe38d.jpg

AMD也有微操作跟宏操作,不過定義跟intel是不同的,因為AMD的解碼器是三組複雜解碼
器,通過直連路徑(Direct PATH)可以像簡單解碼器那樣快速處理,通過向量路徑
(Vector Path)就是複雜解碼器模式,差距在於,AMD沒有宏操作融合,在執行SSE指令的
時候需要更多的時鐘週期,加上解碼器數量3對4,解碼併發3對5, 在前端曾經風光無限
的AMD K8已經輸了一截。
--亂序執行OOOE--
預取、快取記憶體和解碼上的努力要通過亂序執行來發揮,亂序執行本身的增強靠的是增
加執行單元和亂序記錄快取來實現。
http://img.evolife.cn/2016-09/60f5f13fe684e49b.jpg

對比AMD K8,Core 2 Duo的亂序執行的優勢體現在三點上,一是記錄快取96 ENTRY VS
72 ENTRY,Core 2 Duo的前端有更高的併發,記錄快取也有4:3的優勢。 二是調度管理方
面相比AMD拆分為24-ENTRY整型跟36-entry浮點,Core 2 Duo為統一的32entry保留站,三
是SSE執行單元數量達到三個,能夠最大化利用到宏操作融合的優勢,另外,Core 2 Duo
的SSE執行單元是128bit位寬,AMD只有64bit,在執行128bit SSE指令時候Core 2 Duo有
壓倒性優勢
http://img.evolife.cn/2016-09/b9b1f7a3abfb0c76.jpg

--存取也瘋狂--
Core 2 Duo強大的前端跟亂序執行帶來的是更大的資料吞吐需求,intel發現如果允許下
一次載入(Load)在存儲(Store)之前操作,就可以實現載入提速和降低延遲,其風險在於
,存在需要載入尚待存儲資料的可能(大約1~2%的幾率),這時候就需要浪費20個時鐘週期
等待重新載入,為此,在Core 2 Duo中加入預測器可以避免這一場景出現。
http://img.evolife.cn/2016-09/388e08554607e402.jpg

預測器(Predictor)允許在資料存儲之前載入,同時衝突偵測邏輯(Conflict logic)會掃
描亂序緩衝區(Memory reorder Buffer MOB)查找問題,一旦發現立即執行重載入,在最
壞的情況下性能會有所損失。 根據intel的說法性能提升幅度可以達到40%,實際執行環
境中也能有10~20%的增速,在整型操作中優勢尤為明顯。
--超執行緒不再,也沒有內置記憶體控制器--
十年後的今天,超執行緒(HT)和內置記憶體控制器(IMC)是X86處理器的最基本屬性,
在當時,前任Pentium4引領過超執行緒的潮流,對手AMD則率先將內置記憶體控制器引入
了PC領域,但Core 2 Duo一個都沒有。
同步超執行緒技術(Simultaneous Hyper-Threading SMT)需要在快取記憶體中開出更大的
緩衝區來滿足多出一倍的資源的要求,Core 2 Duo引領時代的前端設計已經是對當時製程
的極限的挑戰,超執行緒實在是心有餘而力不足,內置記憶體控制器AMD靠的是SOI製程的
的先天優勢實現,一旦製程允許,超執行緒自然會回來,內置記憶體控制器也不是問題,
後來的nehalem不就是這麼做的麼? (原文以超執行緒優勢體現在伺服器上和有FB-DIMM
記憶體為由洗地理由並不充分)
--廉頗老矣尚能飯否?--
在2006年,即使是最弱的E6300,都可以在很多測試中輕鬆放倒之前的旗艦產品Pentium
XE 965,中堅產品E6600則成功擊敗AMD最新的旗艦產品FX-62,而旗艦產品X6800更是比
E6300強了近一半。
http://img.evolife.cn/2016-09/73a8eaf57ba498fb.jpg

今天的214美元產品I5-6600 VS當年同價位的E6400,十年來我們的CPU足足快了一倍,就
連入門級產品G1620也輕而易舉的戰勝了E6400,但是不要忘記這是2.13Ghz的E6400跟一群
主頻接近4Ghz的產品作對比,事實上很多Core 2 Duo使用者後來升級到Sandy bridge後就
再也沒有換代過。
http://img.evolife.cn/2016-09/3a6ce6dd56e0e872.jpg

回顧十年前Core 2 Duo發佈後發現,在當今的skylake處理器中依舊延續了Core 2 Duo的
框架:四發射、操作融合、大容量共用快取記憶體等,當然,隨著製程的進步,intel在
nehalem加入了記憶體控制器、北橋功能和三級快取記憶體,在Sandy Bridge中引入了微
操作融合快取(micro-op cache)和eDRAM,Core 2 Duo的故事仍然沒有結束。
而那個在Core 2 Duo時代被一舉拿下的對手AMD在十年間一蹶不振,K10和bulldozer麻煩
不斷,幾乎完全退出了中高端領域的競爭,直到最近才借著新核心Zen喊出「我回來了」
,然而仔細看Zen的PPT,仍然沒有看到類似當年Core 2 Duo那樣石破驚天的變化,所以,
AMD也許能重返中端,但論挑戰似乎還很遠。
--展望未來 後10至15年的半導體路線圖--
在conroe十周年紀念的日子裡正值國際半導體技術路線圖報告(International
Technology Roadmap for Semiconductors ITRS)出爐,這份由全球各大洲的半導體工業
的專家共同起草的長達500頁的雙年報告,是廣大從業者的重要參考。 報告從設備調試、
製程集成、射頻(RF)、微機電(MEMS)、光刻、封裝測試、改善良品率等多方面深入探討半
導體工業的未來。
在過去,報告準確的預測過現在流行的finfet技術的流行,但也忽視過半導體的很多瓶頸
,比如以下這份1993年的報告(也就是最早的報告):
http://img.evolife.cn/2016-09/bc7fb5f7646657da.jpg

實際的特徵線寬的發展表面超越了1993年的預測,2001年就開始的130納米製程在預測中
被放到了2004年,而這時候正是intel撞上了90nm大牆。 互連層則落後不少,預測中2004
年將採用6層互連,實際上2002年AMD消費級的Thoroughbred B處理器就用到了9層銅互連
。 功率問題恐怕是整個業界的始料未及,2001年40瓦的功耗早已被主頻大戰拋在腦後,
正如本文開頭所述,半導體偏離了正軌,讓高功耗時代提早到來,經歷過那個時代的玩家
都知道,2001年的高端散熱器放在2004年根本小菜一碟,因為根據長期預測,散熱大規模
引入熱管可以等到2004年,這就是偏離的後果。
至於晶片大小方面,如果用熟知的CPU、GPU來判斷的話1250平方mm可能是天方夜譚了,畢
竟就算到了今天,14/16nm時代,150億電晶體,610平方mm的NVIDIA P100處理器幾乎到了
認知極限。 但這畢竟是整個行業的報告,就拿圖像感應器來說,全幅CIS的尺寸大致是
864平方mm,業界量產的時間也正好是2000~2001年,如今,索尼已經能夠量產33x44幅面
的感應器(面積接近1500平方mm),所以面積一說相當準確。
http://img.evolife.cn/2016-09/dd55b3eda38dab9b.jpg

廢話了這麼一長串只是想表達,每一期的報告,都是相當有技術含量的存在,值得參考,
那麼,未來10年~15年會是怎麼一個狀況呢?
--450mm晶圓和2nm制程--
450mm晶圓(18寸)是十年前就在討論的概念,然而由於這十年間半導體世界被各種障礙搞
得團團轉,以至於更大的晶圓都被人遺忘了,此次ITRS給出了新的時程表, 2021年的
DRAM製程上會用到450mm大晶圓,還要等五年。
http://img.evolife.cn/2016-09/8a992ff2ac9eb6bd.jpg

到了2021年,DRAM的核心面積將縮小到780平方納米,當今的數位為3480,2021將是最後
的finfet(鰭式場效應電晶體),在2030年會看到2nm製程。
http://img.evolife.cn/2016-09/fcc7b156e64bdada.jpg

今天的當紅小生Finfet還有5年的發展期,進入7nm的時程表是2019年,2021年在5nm上終
結。 讓Athlon64大紅大紫的SOI製程(絕緣體上矽)則會在2017年終結,末代皇帝將是
10nm FDSOI,取代Finfet的將是VGAA(vertical gate all-around),2021年登場,預計會
在2030年進入2nm制程,這時候的核心電壓僅為0.4V。 制程的未來之路是坎坷的,5nm以
後會怎樣仍然有很大變數。
NAND快閃記憶體,大家不要慌,不會有什麼QLC了,前些年在剛引入TLC NAND(3bit)的時
候業界還在預測QLC(4bit)的存在,經過這些年的發展可能業界自己對QLC的可行性已經失
去信心,畢竟TLC已經是毒瘤般的表現,於是ITRS的預測中完全沒有看到QLC的存在,萬幸
。
http://img.evolife.cn/2016-09/7825402874816d28.jpg

未來NAND仍然得靠3D堆疊來實現擴容,當前單封裝密度為三星850EVO上48層堆疊的
256Gbit,到了2022年可以達到128層1Tbit,2030年到512層4Tbit,這時候就會看到64TB
的SSD了。
--手持平臺32核8K顯示是未來?--
ITRS對手持平臺的預測是基於當前手機SOC蓬勃發展的,2016年6核CPU 12核GPU,
26.9Gbps記憶體頻寬,4.42瓦功耗的資料實際已經開始偏離效率,從2014年開始手機SOC
對先進製程的渴望就趕上了桌上型電腦CPU,以至於近年台積電不斷表示10nm要比intel早
,intel也毫不在乎。 到2019年也許還能看到18核3.2Ghz,49GPU核心的怪物,但2024年
真能看到3.8Ghz 32核CPU 189核GPU輕鬆實現8K應用的怪物麼? 值得懷疑,畢竟今天的表
現都已經是對當前製程的深度榨取。
http://img.evolife.cn/2016-09/21b5dbde31cda68e.jpg

傳統意義上的摩爾定律早已消亡,但在今年的ITRS報告中依舊可以清楚的看到摩爾定律的
影子,尤其是那張移動SOC的發展路線圖,樂觀程度堪比沒有撞上90nm大牆時候的intel,
這就是所謂的永生吧。
http://img.evolife.cn/2016-09/22fffffb54eafbd8.jpg

--
Core 2 Duo = 擠爆牙膏的intel
--
Tags:
3C
All Comments

By Blanche
at 2016-09-12T20:41
at 2016-09-12T20:41

By Regina
at 2016-09-15T18:27
at 2016-09-15T18:27

By Blanche
at 2016-09-19T22:26
at 2016-09-19T22:26

By Megan
at 2016-09-23T07:14
at 2016-09-23T07:14

By Rosalind
at 2016-09-26T14:23
at 2016-09-26T14:23

By Carolina Franco
at 2016-09-28T04:41
at 2016-09-28T04:41

By Puput
at 2016-10-02T17:08
at 2016-10-02T17:08

By Linda
at 2016-10-02T22:17
at 2016-10-02T22:17

By Selena
at 2016-10-07T03:02
at 2016-10-07T03:02

By Madame
at 2016-10-08T01:01
at 2016-10-08T01:01

By Emily
at 2016-10-10T00:54
at 2016-10-10T00:54

By Elma
at 2016-10-10T17:28
at 2016-10-10T17:28

By Selena
at 2016-10-13T16:32
at 2016-10-13T16:32

By Selena
at 2016-10-15T05:59
at 2016-10-15T05:59

By Dorothy
at 2016-10-16T06:25
at 2016-10-16T06:25

By Margaret
at 2016-10-18T04:31
at 2016-10-18T04:31

By Kama
at 2016-10-21T11:52
at 2016-10-21T11:52

By Agatha
at 2016-10-26T07:04
at 2016-10-26T07:04

By Lydia
at 2016-10-26T11:17
at 2016-10-26T11:17

By Rae
at 2016-10-26T19:47
at 2016-10-26T19:47

By Rachel
at 2016-10-28T07:01
at 2016-10-28T07:01

By Rachel
at 2016-10-28T20:37
at 2016-10-28T20:37

By Anonymous
at 2016-10-31T15:45
at 2016-10-31T15:45

By Poppy
at 2016-11-05T05:43
at 2016-11-05T05:43

By George
at 2016-11-06T13:03
at 2016-11-06T13:03

By Carol
at 2016-11-07T11:04
at 2016-11-07T11:04

By Ina
at 2016-11-11T14:27
at 2016-11-11T14:27

By Lauren
at 2016-11-13T03:07
at 2016-11-13T03:07

By Anthony
at 2016-11-17T09:46
at 2016-11-17T09:46

By Heather
at 2016-11-19T00:26
at 2016-11-19T00:26

By Lauren
at 2016-11-21T08:27
at 2016-11-21T08:27

By Ursula
at 2016-11-25T19:56
at 2016-11-25T19:56

By Delia
at 2016-11-29T08:02
at 2016-11-29T08:02

By Olivia
at 2016-12-03T05:35
at 2016-12-03T05:35

By Ingrid
at 2016-12-07T06:55
at 2016-12-07T06:55

By Eartha
at 2016-12-09T03:46
at 2016-12-09T03:46

By Donna
at 2016-12-11T16:33
at 2016-12-11T16:33

By Leila
at 2016-12-14T04:39
at 2016-12-14T04:39

By Olga
at 2016-12-15T13:44
at 2016-12-15T13:44

By Regina
at 2016-12-19T22:05
at 2016-12-19T22:05

By David
at 2016-12-22T16:12
at 2016-12-22T16:12

By Jessica
at 2016-12-26T05:55
at 2016-12-26T05:55

By Suhail Hany
at 2016-12-26T15:28
at 2016-12-26T15:28

By Damian
at 2016-12-28T10:05
at 2016-12-28T10:05

By Dinah
at 2016-12-30T12:10
at 2016-12-30T12:10

By Yedda
at 2017-01-03T10:06
at 2017-01-03T10:06

By Dora
at 2017-01-06T23:37
at 2017-01-06T23:37

By Elvira
at 2017-01-09T03:51
at 2017-01-09T03:51

By Skylar Davis
at 2017-01-09T21:28
at 2017-01-09T21:28

By George
at 2017-01-12T09:55
at 2017-01-12T09:55

By Kyle
at 2017-01-16T12:18
at 2017-01-16T12:18

By Gary
at 2017-01-20T18:06
at 2017-01-20T18:06

By Irma
at 2017-01-25T06:53
at 2017-01-25T06:53

By Jack
at 2017-01-27T00:41
at 2017-01-27T00:41

By Oscar
at 2017-01-31T20:02
at 2017-01-31T20:02

By Blanche
at 2017-02-03T05:48
at 2017-02-03T05:48

By Gilbert
at 2017-02-06T22:23
at 2017-02-06T22:23

By Sarah
at 2017-02-11T18:14
at 2017-02-11T18:14

By Catherine
at 2017-02-12T16:05
at 2017-02-12T16:05

By Carolina Franco
at 2017-02-15T16:06
at 2017-02-15T16:06

By Rosalind
at 2017-02-16T05:52
at 2017-02-16T05:52

By Kumar
at 2017-02-21T00:58
at 2017-02-21T00:58

By Edwina
at 2017-02-22T09:40
at 2017-02-22T09:40

By Mia
at 2017-02-24T06:34
at 2017-02-24T06:34

By Hedwig
at 2017-02-28T22:51
at 2017-02-28T22:51

By Agnes
at 2017-03-01T09:10
at 2017-03-01T09:10

By Agatha
at 2017-03-03T21:20
at 2017-03-03T21:20

By Wallis
at 2017-03-04T19:27
at 2017-03-04T19:27

By Liam
at 2017-03-09T04:15
at 2017-03-09T04:15

By Aaliyah
at 2017-03-13T10:07
at 2017-03-13T10:07

By Quanna
at 2017-03-14T15:43
at 2017-03-14T15:43

By Gary
at 2017-03-18T02:35
at 2017-03-18T02:35

By Yedda
at 2017-03-20T12:23
at 2017-03-20T12:23

By Suhail Hany
at 2017-03-24T00:09
at 2017-03-24T00:09

By Elvira
at 2017-03-27T23:17
at 2017-03-27T23:17

By Hazel
at 2017-04-01T05:50
at 2017-04-01T05:50

By Hazel
at 2017-04-01T11:48
at 2017-04-01T11:48

By Cara
at 2017-04-03T11:53
at 2017-04-03T11:53

By Queena
at 2017-04-08T05:34
at 2017-04-08T05:34

By Elma
at 2017-04-11T18:48
at 2017-04-11T18:48

By Oscar
at 2017-04-14T21:31
at 2017-04-14T21:31

By Regina
at 2017-04-16T11:01
at 2017-04-16T11:01

By Quintina
at 2017-04-21T05:22
at 2017-04-21T05:22

By Sarah
at 2017-04-23T10:30
at 2017-04-23T10:30

By George
at 2017-04-26T09:00
at 2017-04-26T09:00

By Rebecca
at 2017-04-30T13:02
at 2017-04-30T13:02

By Necoo
at 2017-05-03T23:09
at 2017-05-03T23:09

By Lauren
at 2017-05-08T00:08
at 2017-05-08T00:08

By Ursula
at 2017-05-10T01:27
at 2017-05-10T01:27

By Puput
at 2017-05-11T22:47
at 2017-05-11T22:47

By Caroline
at 2017-05-13T08:29
at 2017-05-13T08:29

By Joseph
at 2017-05-18T08:18
at 2017-05-18T08:18

By Wallis
at 2017-05-21T09:23
at 2017-05-21T09:23

By Jake
at 2017-05-23T17:04
at 2017-05-23T17:04

By Michael
at 2017-05-24T16:05
at 2017-05-24T16:05

By Christine
at 2017-05-27T13:57
at 2017-05-27T13:57

By Olivia
at 2017-05-29T08:14
at 2017-05-29T08:14

By James
at 2017-05-30T03:19
at 2017-05-30T03:19

By Ingrid
at 2017-05-31T21:50
at 2017-05-31T21:50

By Emily
at 2017-06-02T00:07
at 2017-06-02T00:07

By Enid
at 2017-06-03T23:53
at 2017-06-03T23:53

By Necoo
at 2017-06-08T18:46
at 2017-06-08T18:46

By Joseph
at 2017-06-09T10:53
at 2017-06-09T10:53

By Jessica
at 2017-06-12T01:39
at 2017-06-12T01:39

By Edwina
at 2017-06-14T22:12
at 2017-06-14T22:12

By Ivy
at 2017-06-15T05:26
at 2017-06-15T05:26

By Lauren
at 2017-06-19T03:42
at 2017-06-19T03:42

By Frederic
at 2017-06-23T17:41
at 2017-06-23T17:41

By Mary
at 2017-06-28T03:27
at 2017-06-28T03:27

By Bennie
at 2017-06-29T03:16
at 2017-06-29T03:16

By Andy
at 2017-07-03T07:00
at 2017-07-03T07:00

By Zanna
at 2017-07-07T07:54
at 2017-07-07T07:54

By Rachel
at 2017-07-08T21:27
at 2017-07-08T21:27

By Brianna
at 2017-07-11T23:33
at 2017-07-11T23:33

By Anonymous
at 2017-07-15T09:03
at 2017-07-15T09:03

By Hedda
at 2017-07-19T10:31
at 2017-07-19T10:31

By Charlie
at 2017-07-23T21:09
at 2017-07-23T21:09

By Erin
at 2017-07-27T15:06
at 2017-07-27T15:06

By Dorothy
at 2017-08-01T03:28
at 2017-08-01T03:28

By Odelette
at 2017-08-01T22:42
at 2017-08-01T22:42

By Zora
at 2017-08-05T02:27
at 2017-08-05T02:27

By Lucy
at 2017-08-07T02:45
at 2017-08-07T02:45

By Iris
at 2017-08-09T15:10
at 2017-08-09T15:10

By Jacky
at 2017-08-14T11:23
at 2017-08-14T11:23

By Kristin
at 2017-08-17T13:06
at 2017-08-17T13:06

By Kristin
at 2017-08-19T22:28
at 2017-08-19T22:28

By Selena
at 2017-08-20T03:49
at 2017-08-20T03:49

By Olive
at 2017-08-24T19:17
at 2017-08-24T19:17

By Vanessa
at 2017-08-27T14:41
at 2017-08-27T14:41

By Ingrid
at 2017-09-01T08:44
at 2017-09-01T08:44

By Sandy
at 2017-09-03T02:25
at 2017-09-03T02:25

By Liam
at 2017-09-06T04:42
at 2017-09-06T04:42

By Dorothy
at 2017-09-10T23:21
at 2017-09-10T23:21

By Dinah
at 2017-09-12T00:20
at 2017-09-12T00:20

By Barb Cronin
at 2017-09-13T02:49
at 2017-09-13T02:49

By David
at 2017-09-16T08:17
at 2017-09-16T08:17

By Xanthe
at 2017-09-18T04:24
at 2017-09-18T04:24

By Aaliyah
at 2017-09-21T17:31
at 2017-09-21T17:31

By Mason
at 2017-09-25T00:20
at 2017-09-25T00:20

By Irma
at 2017-09-26T00:14
at 2017-09-26T00:14

By Kumar
at 2017-09-26T20:45
at 2017-09-26T20:45

By Jack
at 2017-09-29T20:07
at 2017-09-29T20:07

By Cara
at 2017-09-30T18:13
at 2017-09-30T18:13

By Yedda
at 2017-10-04T00:23
at 2017-10-04T00:23

By Erin
at 2017-10-06T07:56
at 2017-10-06T07:56

By George
at 2017-10-09T12:46
at 2017-10-09T12:46

By Carol
at 2017-10-11T13:32
at 2017-10-11T13:32

By Olga
at 2017-10-16T08:17
at 2017-10-16T08:17

By Edwina
at 2017-10-19T02:23
at 2017-10-19T02:23

By Lucy
at 2017-10-23T05:33
at 2017-10-23T05:33

By Valerie
at 2017-10-27T04:40
at 2017-10-27T04:40

By Yuri
at 2017-10-31T16:27
at 2017-10-31T16:27

By Ina
at 2017-11-04T04:02
at 2017-11-04T04:02

By Todd Johnson
at 2017-11-06T22:26
at 2017-11-06T22:26

By Sarah
at 2017-11-08T01:50
at 2017-11-08T01:50

By Kristin
at 2017-11-12T11:12
at 2017-11-12T11:12

By Zora
at 2017-11-14T19:43
at 2017-11-14T19:43

By Zora
at 2017-11-15T08:39
at 2017-11-15T08:39

By Olive
at 2017-11-20T04:47
at 2017-11-20T04:47
Related Posts
NV Pascal顯卡需求太旺,供貨面臨吃緊

By Blanche
at 2016-09-12T13:33
at 2016-09-12T13:33
In Win推出 SIII-1065W 透明發光Power

By William
at 2016-09-12T13:33
at 2016-09-12T13:33
In Win推出 D-Frame 2.0 限量版機殼

By Dora
at 2016-09-12T13:32
at 2016-09-12T13:32
華碩發布24吋 75Hz FreeSync VG245系列

By Emma
at 2016-09-12T13:32
at 2016-09-12T13:32
裸視3D螢幕?

By Oliver
at 2016-09-12T11:57
at 2016-09-12T11:57