關於30系列的cuda core? - 3C

By George
at 2020-09-02T08:44
at 2020-09-02T08:44
Table of Contents
補充:
國外也有些文章在討論,大致上有些脈絡了
https://i.imgur.com/rklGqze.jpg
Nvdia先前使用Float 64 Shaders,可執行一個 Float 64或一個 Float 32
Ampere架構的Float 64 Shaders, 可執行一個 Float 64或"兩"個 Float 32
Tweakers.net也有分析這個架構:
https://tinyurl.com/yy5o8pop
https://i.imgur.com/Kj0UTEC.jpg
從圖片來看就很清楚,FP32被劃成兩份,所以說類似超線程的說法其實也蠻正確的
先說不是來打臉或看衰的,只是剛好看到不同見解的說法,分享參考。
逛了一下對岸nga,有些文章提到:
1.這個cuda數量是等效數量,實際物理上只有一半,只是現在安培架構吞吐指令數翻倍了
,並不是所有的指令都能合並吞吐,所以這麽寫其實是不合適的。
2.這次列出3090有一萬個,3080有8000+個
其實是不是有點類似於超線程的意思?
每個物理core有兩個fp32計算單元
所以算力大約提升兩倍?
實際上die里真正的物理核心只有/2這麽多?
是的,所以70的CUDA/2的話,傳統性能可能還是打不過80ti,加上RTX才能達到老黃ppt
寫的性能。
以上,
分享一下不同的看法,
我也不是對這塊專業領域的,如果最後有錯請勿見怪。
--
國外也有些文章在討論,大致上有些脈絡了
https://i.imgur.com/rklGqze.jpg
Nvdia先前使用Float 64 Shaders,可執行一個 Float 64或一個 Float 32
Ampere架構的Float 64 Shaders, 可執行一個 Float 64或"兩"個 Float 32
Tweakers.net也有分析這個架構:
https://tinyurl.com/yy5o8pop
https://i.imgur.com/Kj0UTEC.jpg
從圖片來看就很清楚,FP32被劃成兩份,所以說類似超線程的說法其實也蠻正確的
先說不是來打臉或看衰的,只是剛好看到不同見解的說法,分享參考。
逛了一下對岸nga,有些文章提到:
1.這個cuda數量是等效數量,實際物理上只有一半,只是現在安培架構吞吐指令數翻倍了
,並不是所有的指令都能合並吞吐,所以這麽寫其實是不合適的。
2.這次列出3090有一萬個,3080有8000+個
其實是不是有點類似於超線程的意思?
每個物理core有兩個fp32計算單元
所以算力大約提升兩倍?
實際上die里真正的物理核心只有/2這麽多?
是的,所以70的CUDA/2的話,傳統性能可能還是打不過80ti,加上RTX才能達到老黃ppt
寫的性能。
以上,
分享一下不同的看法,
我也不是對這塊專業領域的,如果最後有錯請勿見怪。
--
Tags:
3C
All Comments

By Suhail Hany
at 2020-09-02T20:52
at 2020-09-02T20:52

By Genevieve
at 2020-09-07T07:47
at 2020-09-07T07:47

By Margaret
at 2020-09-09T17:28
at 2020-09-09T17:28

By Barb Cronin
at 2020-09-10T22:03
at 2020-09-10T22:03

By Susan
at 2020-09-11T14:10
at 2020-09-11T14:10

By Eden
at 2020-09-14T17:15
at 2020-09-14T17:15

By Faithe
at 2020-09-15T22:44
at 2020-09-15T22:44

By Bethany
at 2020-09-20T11:34
at 2020-09-20T11:34

By Ina
at 2020-09-21T13:19
at 2020-09-21T13:19

By Hedda
at 2020-09-21T15:50
at 2020-09-21T15:50

By Sierra Rose
at 2020-09-25T06:45
at 2020-09-25T06:45

By Victoria
at 2020-09-30T05:11
at 2020-09-30T05:11

By David
at 2020-10-01T18:04
at 2020-10-01T18:04

By Kumar
at 2020-10-02T07:16
at 2020-10-02T07:16

By Vanessa
at 2020-10-07T05:40
at 2020-10-07T05:40

By Tom
at 2020-10-08T03:51
at 2020-10-08T03:51

By Tom
at 2020-10-08T11:01
at 2020-10-08T11:01

By Odelette
at 2020-10-13T04:57
at 2020-10-13T04:57

By Anthony
at 2020-10-16T10:29
at 2020-10-16T10:29

By Ula
at 2020-10-20T00:57
at 2020-10-20T00:57

By Queena
at 2020-10-22T07:04
at 2020-10-22T07:04

By Elizabeth
at 2020-10-23T17:21
at 2020-10-23T17:21

By David
at 2020-10-24T03:04
at 2020-10-24T03:04

By Dorothy
at 2020-10-27T16:33
at 2020-10-27T16:33

By Brianna
at 2020-10-30T20:19
at 2020-10-30T20:19

By Megan
at 2020-11-01T22:05
at 2020-11-01T22:05

By Ophelia
at 2020-11-05T21:04
at 2020-11-05T21:04

By Joseph
at 2020-11-10T13:37
at 2020-11-10T13:37

By Puput
at 2020-11-12T20:34
at 2020-11-12T20:34
Related Posts
從那些數據知道pcie*16不夠

By Sandy
at 2020-09-02T06:48
at 2020-09-02T06:48
從那些數據知道pcie*16不夠

By Daph Bay
at 2020-09-02T04:40
at 2020-09-02T04:40
老黃直播開始啦 *** 8nm 3080 699起

By Callum
at 2020-09-02T04:16
at 2020-09-02T04:16
老黃直播開始啦 *** 8nm 3080 699起

By Kama
at 2020-09-02T02:16
at 2020-09-02T02:16
RTX3080對比RTX2080效能實測影片

By Candice
at 2020-09-02T02:11
at 2020-09-02T02:11