AMD GPU 跑 tensorflow 順暢嗎? - 3C

By Brianna
at 2019-01-07T02:16
at 2019-01-07T02:16
Table of Contents
※ 引述《geminitw (geminitw)》之銘言:
: 目前有在考慮購置第二台機器跑 DL/ML,
: 但因為... 2080ti 價格偏高, 也不知道哪個硬體版本穩定,
: 加上 7nm GG 盛名, 想說 GG 7nm 產能會被爛蘋果影響,
: 乾脆幫 AMD GPU 7nm 捧個場.
: 只是不知道 tensorflow based on AMD RoCm 目前跑起來的狀況/效能如何?
: 請各位前輩指點迷津... 或者 推薦 2080ti 的版本也很可以
: (啥雪花? 金平? 太陽花? Turbo? 很亂... 我只是要跑 ML/DL)
: 感謝!
http://blog.gpueater.com/en/2018/04/23/00011_tech_cifar10_bench_on_tf13/
https://imgur.com/JMx1csU
雖然這資料有點舊,單就效能論,是有資格和nvidia一戰啦。
但我覺得,要買vega來跑你還要加上debug的風險和時間。
划不划算就看你認為這時間佔多少成本。
有的人就喜歡嘗試研究,時間不佔成本。那vega就划算
有的人就喜歡穩,不喜歡花時間在這種沒意義的除錯上。那就nvidia划算。
以下真香評論:
nvidia要保持領先也不是那麼容易的事情
若要問AMD的ROCm在做啥
基本上就是把nvidia cuda的API照抄一遍
cuda有什麼function我就改個名字,設計一個一毛一樣的function
然後再收錄進我大ROCm的Library中
最後再設計一個自動更名程式,把原本寫給cuda的程式,自動改編為ROCm的程式
(https://github.com/ROCm-Developer-Tools/HIP )
現在這個ROCm版的tensorflow,就是這樣搞出來的。
以上面的測試報告看來,Vega 12nm 的效能是有達到能與nvidia一戰的水準
就只差可靠度,以及軟體支援速度(什麼時候才會有官方pytorch??)。
如果這年度Vega 7nm發售,且可靠度、支援速度能有所提升的話,那是挺值得買的。
再搭配上AMD的HBCC記憶體技術,拿內存當顯存用,直接讓你突破16GB顯存容量限制。
這點簡直令所有做AI的人垂涎三尺。
但目前HBCC+ROCm應該還沒成熟
(https://github.com/RadeonOpenCompute/ROCm/issues/525 )
註:
我是有一張Vega 56啦,之前買來挖礦,但目前拿來打電動比較實在。
跑實驗還是用1080ti
--
: 目前有在考慮購置第二台機器跑 DL/ML,
: 但因為... 2080ti 價格偏高, 也不知道哪個硬體版本穩定,
: 加上 7nm GG 盛名, 想說 GG 7nm 產能會被爛蘋果影響,
: 乾脆幫 AMD GPU 7nm 捧個場.
: 只是不知道 tensorflow based on AMD RoCm 目前跑起來的狀況/效能如何?
: 請各位前輩指點迷津... 或者 推薦 2080ti 的版本也很可以
: (啥雪花? 金平? 太陽花? Turbo? 很亂... 我只是要跑 ML/DL)
: 感謝!
http://blog.gpueater.com/en/2018/04/23/00011_tech_cifar10_bench_on_tf13/
https://imgur.com/JMx1csU
雖然這資料有點舊,單就效能論,是有資格和nvidia一戰啦。
但我覺得,要買vega來跑你還要加上debug的風險和時間。
划不划算就看你認為這時間佔多少成本。
有的人就喜歡嘗試研究,時間不佔成本。那vega就划算
有的人就喜歡穩,不喜歡花時間在這種沒意義的除錯上。那就nvidia划算。
以下真香評論:
nvidia要保持領先也不是那麼容易的事情
若要問AMD的ROCm在做啥
基本上就是把nvidia cuda的API照抄一遍
cuda有什麼function我就改個名字,設計一個一毛一樣的function
然後再收錄進我大ROCm的Library中
最後再設計一個自動更名程式,把原本寫給cuda的程式,自動改編為ROCm的程式
(https://github.com/ROCm-Developer-Tools/HIP )
現在這個ROCm版的tensorflow,就是這樣搞出來的。
以上面的測試報告看來,Vega 12nm 的效能是有達到能與nvidia一戰的水準
就只差可靠度,以及軟體支援速度(什麼時候才會有官方pytorch??)。
如果這年度Vega 7nm發售,且可靠度、支援速度能有所提升的話,那是挺值得買的。
再搭配上AMD的HBCC記憶體技術,拿內存當顯存用,直接讓你突破16GB顯存容量限制。
這點簡直令所有做AI的人垂涎三尺。
但目前HBCC+ROCm應該還沒成熟
(https://github.com/RadeonOpenCompute/ROCm/issues/525 )
註:
我是有一張Vega 56啦,之前買來挖礦,但目前拿來打電動比較實在。
跑實驗還是用1080ti
--
Tags:
3C
All Comments

By Audriana
at 2019-01-08T09:44
at 2019-01-08T09:44

By Mason
at 2019-01-10T02:21
at 2019-01-10T02:21

By Megan
at 2019-01-14T21:12
at 2019-01-14T21:12

By Ophelia
at 2019-01-16T08:55
at 2019-01-16T08:55

By Emily
at 2019-01-18T09:49
at 2019-01-18T09:49

By Jake
at 2019-01-21T17:37
at 2019-01-21T17:37

By Gary
at 2019-01-22T07:34
at 2019-01-22T07:34

By Ula
at 2019-01-27T00:36
at 2019-01-27T00:36

By Caitlin
at 2019-01-31T08:14
at 2019-01-31T08:14

By Ida
at 2019-02-02T07:03
at 2019-02-02T07:03

By Oliver
at 2019-02-04T05:42
at 2019-02-04T05:42

By Dorothy
at 2019-02-07T05:46
at 2019-02-07T05:46

By Agatha
at 2019-02-10T02:51
at 2019-02-10T02:51

By Elizabeth
at 2019-02-12T18:44
at 2019-02-12T18:44

By Tristan Cohan
at 2019-02-16T07:55
at 2019-02-16T07:55

By Rae
at 2019-02-19T08:54
at 2019-02-19T08:54
Related Posts
Corsair SPEC-03 機殼 $1090出清中

By Iris
at 2019-01-07T00:58
at 2019-01-07T00:58
60K影音娛樂文書機

By Olga
at 2019-01-07T00:45
at 2019-01-07T00:45
3k 老電腦升級玩天堂m 單開

By Jacky
at 2019-01-07T00:15
at 2019-01-07T00:15
造型略浮誇的3槽混合式散熱器2080Ti酷蛋

By Suhail Hany
at 2019-01-07T00:02
at 2019-01-07T00:02
LG出UltraGear 27GL850G電競顯示器160Hz

By Rosalind
at 2019-01-07T00:02
at 2019-01-07T00:02