英特爾的全新網格架構:數據中心的“超 - 3C
By Jake
at 2017-06-16T22:26
at 2017-06-16T22:26
Table of Contents
英特爾至強可擴展處理器平台,代表這十年中數據中心平台領域最大技術進步。在它發布
前夕,Skylake-SP CPU架構師Akhilesh Kumar分享了自己對於英特爾滿足數據中心需求的
架構方案及其如何通過可擴展處理器系列最新的“網格”片上互聯來體現這一方案的見解。
數據中心架構的一個重點就是提高效率,以便獲得最佳資本回報並在有限的空間和電
力下最大程度提高數據中心的輸出。處理器在數據中心優化中起著根本性作用,處理器架
構的選擇對可擴展性和效率有著巨大的影響。要想在這些因素之間達到理想的平衡,就需
要遠見、創造性和創新,而這些並不能一蹴而就。
英特爾廣泛的產品組合中體現了其數十年設計專用數據中心CPU和平台的豐富經驗。
一代又一代,英特爾不斷創新核心計算功能,以期提高處理器性能。但是我們的工作並未
止步於此。所有內核的連接和可擴展性的改進、對內存層次結構進行微調、增強I/O也同
樣重要,這些因素將確保組成數據中心主要構建模塊的計算、網絡和存儲系統的可擴展性
和效率。
成長的煩惱:規模所帶來的挑戰
添加更多內核並將其連接,以便創建一個多核數據中心處理器,這個任務聽上去可能
很簡單,但是CPU內核、內存層次結構和I/O子系統在這些需要周密架構子系統的連接提供
了關鍵路徑。這些互聯就像一個精心設計的高速公路一樣,在關鍵位置設有合適數量的車
道和坡道,以便讓交通一路暢通,而不是讓人們和貨物閒坐在路上浪費時間。
增加處理器內核的數量並提高內存和每個處理器的I/O帶寬,以滿足大量數據中心負
載的需求-- 這構成了一些必須通過創造性架構技術才能解決的挑戰。這些挑戰包括:
提高內存、片上緩存層級架構、內存控制器和I/O控制器之間的帶寬。如果可用互聯帶寬
並不能隨處理器上的其它資源適當擴展,那麼互聯就會像令人沮喪的高峰期交通擁堵一樣
,成為限制系統效率的瓶頸。降低訪問來自芯片緩存、主內存或其它內核數據時的延遲。
訪問延遲取決於芯片實體之間的距離、發送請求和響應的路徑,以及互聯操作的速度。這
相當於在擴張型城市vs緊湊型城市的通勤時間、可用路徑的數量,以及高速公路上的限速
。創造高能效的方式,把數據從芯片緩存和內存提供到內核和I/O。由於每個組件之間更
遠的距離和更高的帶寬,當添加更多內核時,完成
相同任務的數據遷移所需的能量就會相應地增加。以交通為例,隨著城市成長和通勤距離
的增加,通勤期間所浪費的時間和能量會讓用於生產工作的可用資源變得更少。
英特爾致力於創新架構解決方案,以便在創建更強大、高效的處理器時走在挑戰的前
面,從而滿足現有和新興工作負載-- 例如人工智能和深度學習的需求。
架構未來的數據中心處理器
英特爾運用其經驗和創新技術,為即將推出的英特爾至強可擴展處理器開發了新架構
,以便為現代數據中心奠定可擴展的基礎。這些新架構提供一種新的方式來互聯片上組件
,以便提高多核處理器的效率和擴展性。
英特爾至強可擴展處理器採用一個創新的“網格”片上互聯拓撲結構(Mesh),可在
內核、內存和I/O控制器之間提供低延遲和高帶寬。下圖顯示了該網格架構的示意圖,內
核、芯胬片緩存庫、內存控制器和I/O控制器是按照行和列而組織的,在每個交叉口通?
過線和交換機而把它們連接在一起,以便允許轉彎。通過提供一個比之前環形架構更加直
接的路徑,以及更多通道來盡量減少瓶頸,網格可在更低的頻率和電壓下工作,並仍能實
現非常高的帶寬和低延遲。這使性能得以提高、能效得以增強,就像一個精心設計的高速
公路系統,讓交通能夠在不擁堵的前提下以最佳速
度流通。
除了改進片上互聯的連接和拓撲,英特爾至強可擴展處理器還採用一個帶有可擴展資
源的模塊化架構,以便訪問片上緩存、內存、IO和遠程CPU。這些資源分佈在整個芯片上
,這樣就能最大程度減少“熱點”或其它子系統的資源限制。該架構的模塊化和分佈式特
性讓可用資源能夠隨處理器內核數量的增加而擴展。
這些可擴展和低延遲的片上互聯框架也對共享的最後一級緩存架構非常重要。這些大
型共享緩存對於復雜的多線程服務器應用,例如數據庫、複雜的物理模擬、高吞吐量網絡
應用,以及託管多個虛擬機--
非常寶貴。訪問不同緩存庫時可忽略的延遲差異讓軟件能夠把分佈式緩存庫當作一個大型
、統一的最後一級緩存。因此,應用開發者不必擔心訪問不同緩存庫時不同的延遲,他們
也不需要優化或重新編譯代碼即可使其應用的性能得到大幅提升。統一低延遲訪問的好處
也能惠及內存和IO訪問,多線程或分佈式應用(涉及不同內核上的執行之間的互動,以及
來自IO設備的數據)不需要仔細映射一個插槽內的內核上的協作線程即可獲得最佳性能。
因此,這種應用可充分利用大量內核,並且仍能實現良好的可擴展性。
總結
採用Mesh的片上互聯的新架構提供非常強大的框架來集成英特爾至強可擴展處理器的
各種組件-- 內核、緩存、內存和I/O子系統。這種創新架構能夠在最廣泛的使用場景中提
高性能和效率,並為英特爾及其無與倫比的全球生態系統所帶來的持續改進奠定基礎,從
而交付可提供數據中心客戶所期待的計算能力和效率的解決方案。
資料來源:https://goo.gl/kSo19H
心得:阿大家有沒有覺得這個技術,聽起來..似曾相識?難道i皇膠水王也要搶嗎?
有沒有人能說說這跟另一家技術有什麼特別不同?
--
前夕,Skylake-SP CPU架構師Akhilesh Kumar分享了自己對於英特爾滿足數據中心需求的
架構方案及其如何通過可擴展處理器系列最新的“網格”片上互聯來體現這一方案的見解。
數據中心架構的一個重點就是提高效率,以便獲得最佳資本回報並在有限的空間和電
力下最大程度提高數據中心的輸出。處理器在數據中心優化中起著根本性作用,處理器架
構的選擇對可擴展性和效率有著巨大的影響。要想在這些因素之間達到理想的平衡,就需
要遠見、創造性和創新,而這些並不能一蹴而就。
英特爾廣泛的產品組合中體現了其數十年設計專用數據中心CPU和平台的豐富經驗。
一代又一代,英特爾不斷創新核心計算功能,以期提高處理器性能。但是我們的工作並未
止步於此。所有內核的連接和可擴展性的改進、對內存層次結構進行微調、增強I/O也同
樣重要,這些因素將確保組成數據中心主要構建模塊的計算、網絡和存儲系統的可擴展性
和效率。
成長的煩惱:規模所帶來的挑戰
添加更多內核並將其連接,以便創建一個多核數據中心處理器,這個任務聽上去可能
很簡單,但是CPU內核、內存層次結構和I/O子系統在這些需要周密架構子系統的連接提供
了關鍵路徑。這些互聯就像一個精心設計的高速公路一樣,在關鍵位置設有合適數量的車
道和坡道,以便讓交通一路暢通,而不是讓人們和貨物閒坐在路上浪費時間。
增加處理器內核的數量並提高內存和每個處理器的I/O帶寬,以滿足大量數據中心負
載的需求-- 這構成了一些必須通過創造性架構技術才能解決的挑戰。這些挑戰包括:
提高內存、片上緩存層級架構、內存控制器和I/O控制器之間的帶寬。如果可用互聯帶寬
並不能隨處理器上的其它資源適當擴展,那麼互聯就會像令人沮喪的高峰期交通擁堵一樣
,成為限制系統效率的瓶頸。降低訪問來自芯片緩存、主內存或其它內核數據時的延遲。
訪問延遲取決於芯片實體之間的距離、發送請求和響應的路徑,以及互聯操作的速度。這
相當於在擴張型城市vs緊湊型城市的通勤時間、可用路徑的數量,以及高速公路上的限速
。創造高能效的方式,把數據從芯片緩存和內存提供到內核和I/O。由於每個組件之間更
遠的距離和更高的帶寬,當添加更多內核時,完成
相同任務的數據遷移所需的能量就會相應地增加。以交通為例,隨著城市成長和通勤距離
的增加,通勤期間所浪費的時間和能量會讓用於生產工作的可用資源變得更少。
英特爾致力於創新架構解決方案,以便在創建更強大、高效的處理器時走在挑戰的前
面,從而滿足現有和新興工作負載-- 例如人工智能和深度學習的需求。
架構未來的數據中心處理器
英特爾運用其經驗和創新技術,為即將推出的英特爾至強可擴展處理器開發了新架構
,以便為現代數據中心奠定可擴展的基礎。這些新架構提供一種新的方式來互聯片上組件
,以便提高多核處理器的效率和擴展性。
英特爾至強可擴展處理器採用一個創新的“網格”片上互聯拓撲結構(Mesh),可在
內核、內存和I/O控制器之間提供低延遲和高帶寬。下圖顯示了該網格架構的示意圖,內
核、芯胬片緩存庫、內存控制器和I/O控制器是按照行和列而組織的,在每個交叉口通?
過線和交換機而把它們連接在一起,以便允許轉彎。通過提供一個比之前環形架構更加直
接的路徑,以及更多通道來盡量減少瓶頸,網格可在更低的頻率和電壓下工作,並仍能實
現非常高的帶寬和低延遲。這使性能得以提高、能效得以增強,就像一個精心設計的高速
公路系統,讓交通能夠在不擁堵的前提下以最佳速
度流通。
除了改進片上互聯的連接和拓撲,英特爾至強可擴展處理器還採用一個帶有可擴展資
源的模塊化架構,以便訪問片上緩存、內存、IO和遠程CPU。這些資源分佈在整個芯片上
,這樣就能最大程度減少“熱點”或其它子系統的資源限制。該架構的模塊化和分佈式特
性讓可用資源能夠隨處理器內核數量的增加而擴展。
這些可擴展和低延遲的片上互聯框架也對共享的最後一級緩存架構非常重要。這些大
型共享緩存對於復雜的多線程服務器應用,例如數據庫、複雜的物理模擬、高吞吐量網絡
應用,以及託管多個虛擬機--
非常寶貴。訪問不同緩存庫時可忽略的延遲差異讓軟件能夠把分佈式緩存庫當作一個大型
、統一的最後一級緩存。因此,應用開發者不必擔心訪問不同緩存庫時不同的延遲,他們
也不需要優化或重新編譯代碼即可使其應用的性能得到大幅提升。統一低延遲訪問的好處
也能惠及內存和IO訪問,多線程或分佈式應用(涉及不同內核上的執行之間的互動,以及
來自IO設備的數據)不需要仔細映射一個插槽內的內核上的協作線程即可獲得最佳性能。
因此,這種應用可充分利用大量內核,並且仍能實現良好的可擴展性。
總結
採用Mesh的片上互聯的新架構提供非常強大的框架來集成英特爾至強可擴展處理器的
各種組件-- 內核、緩存、內存和I/O子系統。這種創新架構能夠在最廣泛的使用場景中提
高性能和效率,並為英特爾及其無與倫比的全球生態系統所帶來的持續改進奠定基礎,從
而交付可提供數據中心客戶所期待的計算能力和效率的解決方案。
資料來源:https://goo.gl/kSo19H
心得:阿大家有沒有覺得這個技術,聽起來..似曾相識?難道i皇膠水王也要搶嗎?
有沒有人能說說這跟另一家技術有什麼特別不同?
--
Tags:
3C
All Comments
By Ethan
at 2017-06-17T10:23
at 2017-06-17T10:23
By Lucy
at 2017-06-19T03:40
at 2017-06-19T03:40
By Frederic
at 2017-06-23T22:52
at 2017-06-23T22:52
By Edith
at 2017-06-28T02:49
at 2017-06-28T02:49
By Quanna
at 2017-07-02T16:16
at 2017-07-02T16:16
By Yuri
at 2017-07-03T23:57
at 2017-07-03T23:57
By Valerie
at 2017-07-04T22:42
at 2017-07-04T22:42
By Eden
at 2017-07-06T23:09
at 2017-07-06T23:09
By Hazel
at 2017-07-11T13:02
at 2017-07-11T13:02
By Sarah
at 2017-07-13T04:00
at 2017-07-13T04:00
By Mary
at 2017-07-13T14:55
at 2017-07-13T14:55
By Sierra Rose
at 2017-07-16T14:24
at 2017-07-16T14:24
By Tristan Cohan
at 2017-07-20T03:33
at 2017-07-20T03:33
By Andy
at 2017-07-22T15:51
at 2017-07-22T15:51
By Frederic
at 2017-07-25T07:08
at 2017-07-25T07:08
By Hedda
at 2017-07-29T17:54
at 2017-07-29T17:54
By Charlie
at 2017-08-03T06:03
at 2017-08-03T06:03
By Lauren
at 2017-08-03T17:59
at 2017-08-03T17:59
By Anonymous
at 2017-08-03T22:41
at 2017-08-03T22:41
Related Posts
關於腳踏墊的選擇與感想
By Heather
at 2017-06-16T22:09
at 2017-06-16T22:09
MX518替代品
By Daniel
at 2017-06-16T21:41
at 2017-06-16T21:41
50K 模擬 FDS 雙螢幕
By David
at 2017-06-16T21:40
at 2017-06-16T21:40
ASUS 顯卡保固有跟沒有一樣
By Todd Johnson
at 2017-06-16T20:19
at 2017-06-16T20:19
Pchome 快睿全館85折
By Robert
at 2017-06-16T20:09
at 2017-06-16T20:09