※ 引述《tank9 (飛星)》之銘言:
: 標題: [情報] GTX1080比TITAN X效能提升30% !
: 時間: Fri May 13 14:57:51 2016
: 30%效能提升
: 感覺很猛
: 未來會有GTX1080TI嗎
: 9系列又會出現拋售潮吧
Videocardz網站揭露了GTX 1080的完整規格
http://goo.gl/BvhyaH
GP104晶片面積314mm2,比GM204的398mm2小了一些
電晶體數量為72億個,GM204則為52億個
有趣的是,SM數量是20組
從2560個CUDA去算的話
可以發現GP104維持Maxwell架構的每SM(M)有128個CUDA
而非先前傳聞的Pascal架構每SM將改良為64個CUDA
從該文章上貼出的 GP104 Block Diagram也可以觀察到
每組SM總共為128個CUDA
結構和Maxwell的Block Diagram很類似
文章提到要到GP100時才會改良為每組SM是64個CUDA
過往從Fermi開始採用SM單元的設計以來
每代SM中CUDA數量的變化都是明顯的
Fermi(每SM有32SP)->Kepler(每SMX有192SP)->Maxwell(每SMM有128SP)
但這次Pascal架構的GP104仍維持每SM是128個CUDA
比較這次GP104的改變
1.雙精度浮點效能的提昇?
(電晶體數量比GM204增加了20億個,CUDA只增加512個)
2.ROP數維持GM204的64個,但引入新的圖像壓縮技術
文章中提到比GM204能提高1.7倍的等效記憶體頻寬
3.硬體解碼線路的提昇
https://en.wikipedia.org/wiki/Nvidia_PureVideo
PureVideo的版本看來會比GM206(GTX960)還新
-----
之前網友的討論有提到
GP104的每CUDA同時脈下其實並沒有比GM204快
從這篇跑分來看
http://tinyurl.com/gn8gmth
如果GTX980的晶片時脈從1216MHz->1733MHz
CUDA數目從2048個->2560個
換算後可得到約23000分,還比GTX1080約22000分還快一些
如同板上這篇Khadgar大提到的
https://www.ptt.cc/bbs/VideoCard/M.1462589286.A.501.html
如果不靠時脈提昇效能的話
同時脈下GP104的CUDA效能是和前代Maxwell差不多
必須算上時脈的提昇,每CUDA效能才有增長
我覺得這樣子
也許GP104使用的Pascal架構(GP100或許會在改良)
其實是Maxwell架構的新製程高頻改良版而已!?
再加上支援新技術(圖像壓縮技術)、新功能(硬解規格)
(或者也有補回雙精度效能)
如這篇討論
http://bbs.pceva.com.cn/thread-131069-1-1.html
GP104在DX12的Asynchronous Compute效能
可能就是靠高時脈來硬上了?
在PC_Shopping板也有網友提到這部份
之前看一些討論
Pascal架構是2014年才突然在Nvidia的路線上插入的
之前的路線圖Maxwell架構後就是接著Volta
Pascal架構可能像是墊檔用的改良架構
或許16nm製程的真正全新架構要等到Volta
如同Mxwell之於Kepler在同製程下的改進一樣(970能打到780)
obov大的推文
DX12效能暴增可能要等到Volta
https://www.ptt.cc/bbs/PC_Shopping/M.1462861708.A.9D0.html
平心而論
這次GP104用新製程時脈大幅提昇衝高效能也算是有提昇
1080/1070目前公佈的價格沒有比前代980/970貴太多
接下來就看AMD能拿出怎樣的產品和怎樣的價格來對打了
--
: 標題: [情報] GTX1080比TITAN X效能提升30% !
: 時間: Fri May 13 14:57:51 2016
: 30%效能提升
: 感覺很猛
: 未來會有GTX1080TI嗎
: 9系列又會出現拋售潮吧
Videocardz網站揭露了GTX 1080的完整規格
http://goo.gl/BvhyaH
GP104晶片面積314mm2,比GM204的398mm2小了一些
電晶體數量為72億個,GM204則為52億個
有趣的是,SM數量是20組
從2560個CUDA去算的話
可以發現GP104維持Maxwell架構的每SM(M)有128個CUDA
而非先前傳聞的Pascal架構每SM將改良為64個CUDA
從該文章上貼出的 GP104 Block Diagram也可以觀察到
每組SM總共為128個CUDA
結構和Maxwell的Block Diagram很類似
文章提到要到GP100時才會改良為每組SM是64個CUDA
過往從Fermi開始採用SM單元的設計以來
每代SM中CUDA數量的變化都是明顯的
Fermi(每SM有32SP)->Kepler(每SMX有192SP)->Maxwell(每SMM有128SP)
但這次Pascal架構的GP104仍維持每SM是128個CUDA
比較這次GP104的改變
1.雙精度浮點效能的提昇?
(電晶體數量比GM204增加了20億個,CUDA只增加512個)
2.ROP數維持GM204的64個,但引入新的圖像壓縮技術
文章中提到比GM204能提高1.7倍的等效記憶體頻寬
3.硬體解碼線路的提昇
https://en.wikipedia.org/wiki/Nvidia_PureVideo
PureVideo的版本看來會比GM206(GTX960)還新
-----
之前網友的討論有提到
GP104的每CUDA同時脈下其實並沒有比GM204快
從這篇跑分來看
http://tinyurl.com/gn8gmth
如果GTX980的晶片時脈從1216MHz->1733MHz
CUDA數目從2048個->2560個
換算後可得到約23000分,還比GTX1080約22000分還快一些
如同板上這篇Khadgar大提到的
https://www.ptt.cc/bbs/VideoCard/M.1462589286.A.501.html
如果不靠時脈提昇效能的話
同時脈下GP104的CUDA效能是和前代Maxwell差不多
必須算上時脈的提昇,每CUDA效能才有增長
我覺得這樣子
也許GP104使用的Pascal架構(GP100或許會在改良)
其實是Maxwell架構的新製程高頻改良版而已!?
再加上支援新技術(圖像壓縮技術)、新功能(硬解規格)
(或者也有補回雙精度效能)
如這篇討論
http://bbs.pceva.com.cn/thread-131069-1-1.html
GP104在DX12的Asynchronous Compute效能
可能就是靠高時脈來硬上了?
在PC_Shopping板也有網友提到這部份
之前看一些討論
Pascal架構是2014年才突然在Nvidia的路線上插入的
之前的路線圖Maxwell架構後就是接著Volta
Pascal架構可能像是墊檔用的改良架構
或許16nm製程的真正全新架構要等到Volta
如同Mxwell之於Kepler在同製程下的改進一樣(970能打到780)
obov大的推文
DX12效能暴增可能要等到Volta
https://www.ptt.cc/bbs/PC_Shopping/M.1462861708.A.9D0.html
平心而論
這次GP104用新製程時脈大幅提昇衝高效能也算是有提昇
1080/1070目前公佈的價格沒有比前代980/970貴太多
接下來就看AMD能拿出怎樣的產品和怎樣的價格來對打了
--
All Comments