關於30系列的cuda core? - 3C
![Hedy avatar](/img/girl1.jpg)
By Hedy
at 2020-09-11T20:15
at 2020-09-11T20:15
Table of Contents
※ 引述《leon19790602 (())》之銘言:
: 逛了一下對岸nga,有些文章提到:
: 1.這個cuda數量是等效數量,實際物理上只有一半,只是現在安培架構吞吐指令數翻倍了
: ,並不是所有的指令都能合並吞吐,所以這麽寫其實是不合適的。
: 2.這次列出3090有一萬個,3080有8000+個
: 其實是不是有點類似於超線程的意思?
: 每個物理core有兩個fp32計算單元
: 所以算力大約提升兩倍?
: 實際上die里真正的物理核心只有/2這麽多?
: 是的,所以70的CUDA/2的話,傳統性能可能還是打不過80ti,加上RTX才能達到老黃ppt
: 寫的性能。
: 以上,
: 分享一下不同的看法,
: 我也不是對這塊專業領域的,如果最後有錯請勿見怪。
:
前幾天NV公佈了詳細的Ampere繪圖/遊戲卡架構資料
參考:https://tinyurl.com/y4luadcm
對於30系列遊戲卡新架構的設計明瞭許多
NV這次對於Ampere繪圖架構(GA102之後晶片)的改進
我覺得可以說相當高明,新架構FP32運算效能比上代大幅度提昇
不過NV這次新定義的CUDA數量也有引起一些討論
從過往近代NV的GPU來看,每一個CUDA流處理器
通常會包含一個FP32運算單元和一個INT32運算單元
https://i.imgur.com/EjVHF1r.jpg
上圖是Turing架構TU102的SM結構圖
一共有64個FP32單元和64個INT32單元
以及8個Tensor Core和1組RT Core
共用96KB的L1快取
https://i.imgur.com/tc4e5p3.jpg
這次Ampere架構GA102的SM結構圖
總共有64個FP32單元和64個改良的INT32單元
以及4個改良的第3代Tensor Core和1組第2代RT Core
共用的L1快取加大至128KB
這次架構奧妙之處在於加大規模改良的INT32單元
在執行INT32運算時,也能夠穿插同時執行FP32運算
有點類似像Intel CPU的超執行序調度設計
也有點像AMD過往推土機架構一模雙核(NV反過來增加浮點單元)
統計近年普遍的新3D遊戲
使用INT32的運算指令平均約佔FP32指令的1/3~1/4而已
與其讓INT32單元閒置,改良後讓它也能處理FP32運算
能夠進一步來提昇電晶體線路利用效率
這次的新架構設計,電晶體數只需增加約50%,功耗提高約40%
就能換來帳面理論值2倍的FP32運算效能
所以GA102的SM結構
若以過往一個FP32單元搭配一個INT32單元來看
和Turing一樣是每組SM有64個"CUDA"
但以FP32單元數量來看,因為INT32單元也具有FP32運算能力
NV認為可看作是128個FP32單元
也就是NV目前公佈30系列的CUDA數量了
這也解釋為何之前一些爆料者標出的CUDA規格數
實際上NV公佈30系列後的規格CUDA數卻是翻倍的
https://i.imgur.com/4C4FH8r.jpg
5248→10496 RTX3090
4352→8704 RTX3080
2944→5888 RTX3070
因為AIC板卡廠在初期拿到的資料也是用傳統CUDA數定義去計算
實際NV之後公佈的規格則用FP32單元數量來計算CUDA數
這次的設計
如果一款遊戲是大量使用FP32指令運算
那30系列相對於20系列顯卡提昇的幅度就非常大
如同NV發佈會上的效能數據
https://i.imgur.com/f0QBvZY.png
因30系列每SM的FP32處理能力理論值是20系列的二倍
但如果遊戲中使用INT32指令的比例愈高
那麼30系列領先20系列的幅度可能會被拉近
因為30系列每組SM中仍然是64個INT32單元
從之前B站偷跑的遊戲測試影片也能觀察到這現象
https://i.imgur.com/DuipsDM.png
有些遊戲領先的幅度較大,有些遊戲領先幅度相對較少
我覺得這次NV新架構是很有效率的設計
AMD和Intel未來的顯示卡
可能也可參考這樣的設計方向
--
: 逛了一下對岸nga,有些文章提到:
: 1.這個cuda數量是等效數量,實際物理上只有一半,只是現在安培架構吞吐指令數翻倍了
: ,並不是所有的指令都能合並吞吐,所以這麽寫其實是不合適的。
: 2.這次列出3090有一萬個,3080有8000+個
: 其實是不是有點類似於超線程的意思?
: 每個物理core有兩個fp32計算單元
: 所以算力大約提升兩倍?
: 實際上die里真正的物理核心只有/2這麽多?
: 是的,所以70的CUDA/2的話,傳統性能可能還是打不過80ti,加上RTX才能達到老黃ppt
: 寫的性能。
: 以上,
: 分享一下不同的看法,
: 我也不是對這塊專業領域的,如果最後有錯請勿見怪。
:
前幾天NV公佈了詳細的Ampere繪圖/遊戲卡架構資料
參考:https://tinyurl.com/y4luadcm
對於30系列遊戲卡新架構的設計明瞭許多
NV這次對於Ampere繪圖架構(GA102之後晶片)的改進
我覺得可以說相當高明,新架構FP32運算效能比上代大幅度提昇
不過NV這次新定義的CUDA數量也有引起一些討論
從過往近代NV的GPU來看,每一個CUDA流處理器
通常會包含一個FP32運算單元和一個INT32運算單元
https://i.imgur.com/EjVHF1r.jpg
上圖是Turing架構TU102的SM結構圖
一共有64個FP32單元和64個INT32單元
以及8個Tensor Core和1組RT Core
共用96KB的L1快取
https://i.imgur.com/tc4e5p3.jpg
這次Ampere架構GA102的SM結構圖
總共有64個FP32單元和64個改良的INT32單元
以及4個改良的第3代Tensor Core和1組第2代RT Core
共用的L1快取加大至128KB
這次架構奧妙之處在於加大規模改良的INT32單元
在執行INT32運算時,也能夠穿插同時執行FP32運算
有點類似像Intel CPU的超執行序調度設計
也有點像AMD過往推土機架構一模雙核(NV反過來增加浮點單元)
統計近年普遍的新3D遊戲
使用INT32的運算指令平均約佔FP32指令的1/3~1/4而已
與其讓INT32單元閒置,改良後讓它也能處理FP32運算
能夠進一步來提昇電晶體線路利用效率
這次的新架構設計,電晶體數只需增加約50%,功耗提高約40%
就能換來帳面理論值2倍的FP32運算效能
所以GA102的SM結構
若以過往一個FP32單元搭配一個INT32單元來看
和Turing一樣是每組SM有64個"CUDA"
但以FP32單元數量來看,因為INT32單元也具有FP32運算能力
NV認為可看作是128個FP32單元
也就是NV目前公佈30系列的CUDA數量了
這也解釋為何之前一些爆料者標出的CUDA規格數
實際上NV公佈30系列後的規格CUDA數卻是翻倍的
https://i.imgur.com/4C4FH8r.jpg
5248→10496 RTX3090
4352→8704 RTX3080
2944→5888 RTX3070
因為AIC板卡廠在初期拿到的資料也是用傳統CUDA數定義去計算
實際NV之後公佈的規格則用FP32單元數量來計算CUDA數
這次的設計
如果一款遊戲是大量使用FP32指令運算
那30系列相對於20系列顯卡提昇的幅度就非常大
如同NV發佈會上的效能數據
https://i.imgur.com/f0QBvZY.png
因30系列每SM的FP32處理能力理論值是20系列的二倍
但如果遊戲中使用INT32指令的比例愈高
那麼30系列領先20系列的幅度可能會被拉近
因為30系列每組SM中仍然是64個INT32單元
從之前B站偷跑的遊戲測試影片也能觀察到這現象
https://i.imgur.com/DuipsDM.png
有些遊戲領先的幅度較大,有些遊戲領先幅度相對較少
我覺得這次NV新架構是很有效率的設計
AMD和Intel未來的顯示卡
可能也可參考這樣的設計方向
--
Tags:
3C
All Comments
![Kama avatar](/img/girl2.jpg)
By Kama
at 2020-09-13T10:29
at 2020-09-13T10:29
![Edith avatar](/img/girl3.jpg)
By Edith
at 2020-09-16T09:31
at 2020-09-16T09:31
![Dinah avatar](/img/girl4.jpg)
By Dinah
at 2020-09-20T09:31
at 2020-09-20T09:31
![Olive avatar](/img/beret.jpg)
By Olive
at 2020-09-24T01:16
at 2020-09-24T01:16
![Oscar avatar](/img/boy1.jpg)
By Oscar
at 2020-09-26T07:13
at 2020-09-26T07:13
![Dora avatar](/img/girl5.jpg)
By Dora
at 2020-09-29T02:03
at 2020-09-29T02:03
![Victoria avatar](/img/woman.jpg)
By Victoria
at 2020-09-30T12:23
at 2020-09-30T12:23
![Edwina avatar](/img/woman-biz.jpg)
By Edwina
at 2020-10-01T03:10
at 2020-10-01T03:10
![Elizabeth avatar](/img/woman-glasses.jpg)
By Elizabeth
at 2020-10-02T08:15
at 2020-10-02T08:15
![Dorothy avatar](/img/woman-ring.jpg)
By Dorothy
at 2020-10-06T23:27
at 2020-10-06T23:27
![Skylar DavisLinda avatar](/img/boy2.jpg)
By Skylar DavisLinda
at 2020-10-10T11:42
at 2020-10-10T11:42
![Yedda avatar](/img/cat1.jpg)
By Yedda
at 2020-10-13T22:46
at 2020-10-13T22:46
![Zora avatar](/img/cat2.jpg)
By Zora
at 2020-10-15T17:58
at 2020-10-15T17:58
![Edith avatar](/img/cat3.jpg)
By Edith
at 2020-10-16T06:11
at 2020-10-16T06:11
![George avatar](/img/cat1.jpg)
By George
at 2020-10-17T13:50
at 2020-10-17T13:50
![Zenobia avatar](/img/cat4.jpg)
By Zenobia
at 2020-10-18T00:48
at 2020-10-18T00:48
![Hardy avatar](/img/cat2.jpg)
By Hardy
at 2020-10-20T20:13
at 2020-10-20T20:13
![Bennie avatar](/img/cat5.jpg)
By Bennie
at 2020-10-23T23:21
at 2020-10-23T23:21
![Tristan Cohan avatar](/img/cat3.jpg)
By Tristan Cohan
at 2020-10-24T22:00
at 2020-10-24T22:00
![Donna avatar](/img/girl.jpg)
By Donna
at 2020-10-29T09:04
at 2020-10-29T09:04
![Jack avatar](/img/cat4.jpg)
By Jack
at 2020-10-30T15:36
at 2020-10-30T15:36
![Gilbert avatar](/img/cat5.jpg)
By Gilbert
at 2020-11-04T10:00
at 2020-11-04T10:00
![Tom avatar](/img/dog1.jpg)
By Tom
at 2020-11-06T15:00
at 2020-11-06T15:00
![Yedda avatar](/img/girl1.jpg)
By Yedda
at 2020-11-11T01:26
at 2020-11-11T01:26
Related Posts
EVGA顯卡註冊保固後有無到府收送服務?
![Ethan avatar](/img/cat3.jpg)
By Ethan
at 2020-09-11T19:54
at 2020-09-11T19:54
Asus & Zotac RTX2000系列對折下殺
![Kristin avatar](/img/cat4.jpg)
By Kristin
at 2020-09-11T18:01
at 2020-09-11T18:01
30k左右 Autocad文書機
![Valerie avatar](/img/girl5.jpg)
By Valerie
at 2020-09-11T17:30
at 2020-09-11T17:30
兩顆電源抉擇
![Anonymous avatar](/img/bee.jpg)
By Anonymous
at 2020-09-11T16:40
at 2020-09-11T16:40
影片編輯預算2萬五
![Dorothy avatar](/img/girl3.jpg)
By Dorothy
at 2020-09-11T16:19
at 2020-09-11T16:19