NV公佈帕斯卡架構白皮書:GP100完全曝光 - 3C

By Elvira
at 2016-04-25T09:21
at 2016-04-25T09:21
Table of Contents
關於下代架構“帕斯卡”(Pascal)的產品,NVIDIA目前只宣布了一款大核心的高性能計算
卡Tesla P100
其他各種GeForce遊戲卡都還得等一段時間,不過近日,NVIDIA很慷慨地公佈了一份帕斯
卡架構白皮書
幾乎完全公開了GP100核心與Tesla P100的各種規格。
GP100是帕斯卡家族的旗艦核心,預計桌面上的GTX 1080 Ti、新版GTX Titan X也會使用
它。
它採用台積電16nm FinFET工藝製造,集成了153億個晶體管,比麥克斯韋GM200多了超過
90%
核心面積達610平方毫米,只比28nm工藝的GM200大了區區9平方毫米。
完整的GP100核心擁有60個SM(流式多處理器)單元,Tesla P100只開啟了其中的56個。
每個SM單元內有64個FP32單精度CUDA核心 (麥克斯韋、開普勒架構分別有128個、192個)
,總計3840個。
每個SM單元分為兩部分,每部分有32個FP32 CUDA核心、一個指令緩衝器、一個Warp調度
器、兩個分派單元。
GP100核心每個SM單元的CUDA核心數量雖然只有麥克斯韋架構的一半
但是擁有相同的寄存器文件尺寸(256KB),支持類似的Warp和線程模塊。
GP100核心的每個SM單元內還有32個FP64雙精度CUDA核心,總計1920個,是單精度的1/2
這種比例可以更好地配合GP100核心新的數據路徑配置,更高效地處理雙精度負載。
GP100核心還有統一的4096KB二級緩存,超過開普勒GK110 1536KB、麥克GM200 3702KB
可以減少對GPU DRAM的請求,從而降低整體功耗、內存帶寬,提升性能。整個核心還配備
了240個紋理單元。
Tesla P100計算卡擁有3584個FP32單精度、1792個FP64雙精度CUDA核心,核心基礎頻率
1328MHz
加速頻率高達1480MHz,峰值單精度性能10600GFlops,比起上代提升了足足55%
而雙精度性能也達到了5300GFlops,是開普勒架構的3.2倍,更是麥克斯韋架構的25.2倍
。
它搭配了4096-bit HBM2高帶寬顯存,容量16GB,熱設計功耗300W。
來源︰http://news.mydrivers.com/1/479/479502.htm
完全公開,等待上市
--
Tags:
3C
All Comments

By Edwina
at 2016-04-26T14:12
at 2016-04-26T14:12

By Isla
at 2016-04-28T11:43
at 2016-04-28T11:43

By Ula
at 2016-04-28T15:10
at 2016-04-28T15:10

By Dorothy
at 2016-05-02T20:33
at 2016-05-02T20:33

By Tom
at 2016-05-05T13:46
at 2016-05-05T13:46

By Ula
at 2016-05-06T17:48
at 2016-05-06T17:48

By Audriana
at 2016-05-07T15:10
at 2016-05-07T15:10

By Zora
at 2016-05-12T08:11
at 2016-05-12T08:11

By Eden
at 2016-05-14T00:13
at 2016-05-14T00:13
Related Posts
技嘉GTX950免插電版N950D5-2GD開賣

By Ivy
at 2016-04-25T09:21
at 2016-04-25T09:21
NVIDIA 官方顯卡新活動

By Edith
at 2016-04-25T09:21
at 2016-04-25T09:21
AHQ聲明文

By Daph Bay
at 2016-04-25T09:04
at 2016-04-25T09:04
10k內 電腦椅 求推薦

By Daniel
at 2016-04-25T09:03
at 2016-04-25T09:03
為什麼伺服器級的主機板用料那麼差?

By Ina
at 2016-04-25T08:32
at 2016-04-25T08:32