NV公佈帕斯卡架構白皮書:GP100完全曝光 - 3C

Table of Contents



關於下代架構“帕斯卡”(Pascal)的產品,NVIDIA目前只宣布了一款大核心的高性能計算
卡Tesla P100
其他各種GeForce遊戲卡都還得等一段時間,不過近日,NVIDIA很慷慨地公佈了一份帕斯
卡架構白皮書
幾乎完全公開了GP100核心與Tesla P100的各種規格。

GP100是帕斯卡家族的旗艦核心,預計桌面上的GTX 1080 Ti、新版GTX Titan X也會使用
它。
它採用台積電16nm FinFET工藝製造,集成了153億個晶體管,比麥克斯韋GM200多了超過
90%
核心面積達610平方毫米,只比28nm工藝的GM200大了區區9平方毫米。

完整的GP100核心擁有60個SM(流式多處理器)單元,Tesla P100只開啟了其中的56個。
每個SM單元內有64個FP32單精度CUDA核心 (麥克斯韋、開普勒架構分別有128個、192個)
,總計3840個。

每個SM單元分為兩部分,每部分有32個FP32 CUDA核心、一個指令緩衝器、一個Warp調度
器、兩個分派單元。

GP100核心每個SM單元的CUDA核心數量雖然只有麥克斯韋架構的一半
但是擁有相同的寄存器文件尺寸(256KB),支持類似的Warp和線程模塊。

GP100核心的每個SM單元內還有32個FP64雙精度CUDA核心,總計1920個,是單精度的1/2
這種比例可以更好地配合GP100核心新的數據路徑配置,更高效地處理雙精度負載。

GP100核心還有統一的4096KB二級緩存,超過開普勒GK110 1536KB、麥克GM200 3702KB
可以減少對GPU DRAM的請求,從而降低整體功耗、內存帶寬,提升性能。整個核心還配備
了240個紋理單元。

Tesla P100計算卡擁有3584個FP32單精度、1792個FP64雙精度CUDA核心,核心基礎頻率
1328MHz
加速頻率高達1480MHz,峰值單精度性能10600GFlops,比起上代提升了足足55%
而雙精度性能也達到了5300GFlops,是開普勒架構的3.2倍,更是麥克斯韋架構的25.2倍


它搭配了4096-bit HBM2高帶寬顯存,容量16GB,熱設計功耗300W。

來源︰http://news.mydrivers.com/1/479/479502.htm

完全公開,等待上市

--

All Comments

Edwina avatarEdwina2016-04-26
970要跳水惹~
Isla avatarIsla2016-04-28
transistor翻成晶體管到底是什麼邏輯
Ula avatarUla2016-04-28
新聞標題下的很怪,明明只是完全公開"專業卡"的晶片
規格,而且都是閹割過的,GP100幾時有公開過?
Dorothy avatarDorothy2016-05-02
GP104以下的型號感覺雙精度效能會砍 晶片面積都不大
Tom avatarTom2016-05-05
雙精度打遊戲用不到吧
Ula avatarUla2016-05-06
DX12會於雙精度的需求大量提升
對於
Audriana avatarAudriana2016-05-07
這次雙精度都沒有要砍阿
Zora avatarZora2016-05-12
電晶體就電晶體在那邊晶體管
Eden avatarEden2016-05-14
不知道跑4K-VR如何