關於30系列的cuda core? - 3C
By George
at 2020-09-02T08:44
at 2020-09-02T08:44
Table of Contents
補充:
國外也有些文章在討論,大致上有些脈絡了
https://i.imgur.com/rklGqze.jpg
Nvdia先前使用Float 64 Shaders,可執行一個 Float 64或一個 Float 32
Ampere架構的Float 64 Shaders, 可執行一個 Float 64或"兩"個 Float 32
Tweakers.net也有分析這個架構:
https://tinyurl.com/yy5o8pop
https://i.imgur.com/Kj0UTEC.jpg
從圖片來看就很清楚,FP32被劃成兩份,所以說類似超線程的說法其實也蠻正確的
先說不是來打臉或看衰的,只是剛好看到不同見解的說法,分享參考。
逛了一下對岸nga,有些文章提到:
1.這個cuda數量是等效數量,實際物理上只有一半,只是現在安培架構吞吐指令數翻倍了
,並不是所有的指令都能合並吞吐,所以這麽寫其實是不合適的。
2.這次列出3090有一萬個,3080有8000+個
其實是不是有點類似於超線程的意思?
每個物理core有兩個fp32計算單元
所以算力大約提升兩倍?
實際上die里真正的物理核心只有/2這麽多?
是的,所以70的CUDA/2的話,傳統性能可能還是打不過80ti,加上RTX才能達到老黃ppt
寫的性能。
以上,
分享一下不同的看法,
我也不是對這塊專業領域的,如果最後有錯請勿見怪。
--
國外也有些文章在討論,大致上有些脈絡了
https://i.imgur.com/rklGqze.jpg
Nvdia先前使用Float 64 Shaders,可執行一個 Float 64或一個 Float 32
Ampere架構的Float 64 Shaders, 可執行一個 Float 64或"兩"個 Float 32
Tweakers.net也有分析這個架構:
https://tinyurl.com/yy5o8pop
https://i.imgur.com/Kj0UTEC.jpg
從圖片來看就很清楚,FP32被劃成兩份,所以說類似超線程的說法其實也蠻正確的
先說不是來打臉或看衰的,只是剛好看到不同見解的說法,分享參考。
逛了一下對岸nga,有些文章提到:
1.這個cuda數量是等效數量,實際物理上只有一半,只是現在安培架構吞吐指令數翻倍了
,並不是所有的指令都能合並吞吐,所以這麽寫其實是不合適的。
2.這次列出3090有一萬個,3080有8000+個
其實是不是有點類似於超線程的意思?
每個物理core有兩個fp32計算單元
所以算力大約提升兩倍?
實際上die里真正的物理核心只有/2這麽多?
是的,所以70的CUDA/2的話,傳統性能可能還是打不過80ti,加上RTX才能達到老黃ppt
寫的性能。
以上,
分享一下不同的看法,
我也不是對這塊專業領域的,如果最後有錯請勿見怪。
--
Tags:
3C
All Comments
By Suhail Hany
at 2020-09-02T20:52
at 2020-09-02T20:52
By Genevieve
at 2020-09-07T07:47
at 2020-09-07T07:47
By Margaret
at 2020-09-09T17:28
at 2020-09-09T17:28
By Barb Cronin
at 2020-09-10T22:03
at 2020-09-10T22:03
By Susan
at 2020-09-11T14:10
at 2020-09-11T14:10
By Eden
at 2020-09-14T17:15
at 2020-09-14T17:15
By Faithe
at 2020-09-15T22:44
at 2020-09-15T22:44
By Bethany
at 2020-09-20T11:34
at 2020-09-20T11:34
By Ina
at 2020-09-21T13:19
at 2020-09-21T13:19
By Hedda
at 2020-09-21T15:50
at 2020-09-21T15:50
By Sierra Rose
at 2020-09-25T06:45
at 2020-09-25T06:45
By Victoria
at 2020-09-30T05:11
at 2020-09-30T05:11
By David
at 2020-10-01T18:04
at 2020-10-01T18:04
By Kumar
at 2020-10-02T07:16
at 2020-10-02T07:16
By Vanessa
at 2020-10-07T05:40
at 2020-10-07T05:40
By Tom
at 2020-10-08T03:51
at 2020-10-08T03:51
By Tom
at 2020-10-08T11:01
at 2020-10-08T11:01
By Odelette
at 2020-10-13T04:57
at 2020-10-13T04:57
By Anthony
at 2020-10-16T10:29
at 2020-10-16T10:29
By Ula
at 2020-10-20T00:57
at 2020-10-20T00:57
By Queena
at 2020-10-22T07:04
at 2020-10-22T07:04
By Elizabeth
at 2020-10-23T17:21
at 2020-10-23T17:21
By David
at 2020-10-24T03:04
at 2020-10-24T03:04
By Dorothy
at 2020-10-27T16:33
at 2020-10-27T16:33
By Brianna
at 2020-10-30T20:19
at 2020-10-30T20:19
By Megan
at 2020-11-01T22:05
at 2020-11-01T22:05
By Ophelia
at 2020-11-05T21:04
at 2020-11-05T21:04
By Joseph
at 2020-11-10T13:37
at 2020-11-10T13:37
By Puput
at 2020-11-12T20:34
at 2020-11-12T20:34
Related Posts
從那些數據知道pcie*16不夠
By Sandy
at 2020-09-02T06:48
at 2020-09-02T06:48
從那些數據知道pcie*16不夠
By Daph Bay
at 2020-09-02T04:40
at 2020-09-02T04:40
老黃直播開始啦 *** 8nm 3080 699起
By Callum
at 2020-09-02T04:16
at 2020-09-02T04:16
老黃直播開始啦 *** 8nm 3080 699起
By Kama
at 2020-09-02T02:16
at 2020-09-02T02:16
RTX3080對比RTX2080效能實測影片
By Candice
at 2020-09-02T02:11
at 2020-09-02T02:11