AMD GPU 跑 tensorflow 順暢嗎? - 3C

Table of Contents


是說現在 AMD RoCm 的原始碼已經被合併進 TensorFlow 官方的 codebase 裡

雖然說還是被稱為 community support build

https://github.com/tensorflow/tensorflow#community-supported-builds

不過穩定性會不會已經有所提昇了 (?)

不知版上有沒有勇者嘗試過呢

這年頭做 Deep Learning 時 GPUs 用的越來越兇

真希望多點競爭趕快降價 XD


※ 引述《exeex (人非腎鹹)》之銘言:
: ※ 引述《geminitw (geminitw)》之銘言:
: : 目前有在考慮購置第二台機器跑 DL/ML,
: : 但因為... 2080ti 價格偏高, 也不知道哪個硬體版本穩定,
: : 加上 7nm GG 盛名, 想說 GG 7nm 產能會被爛蘋果影響,
: : 乾脆幫 AMD GPU 7nm 捧個場.
: : 只是不知道 tensorflow based on AMD RoCm 目前跑起來的狀況/效能如何?
: : 請各位前輩指點迷津... 或者 推薦 2080ti 的版本也很可以
: : (啥雪花? 金平? 太陽花? Turbo? 很亂... 我只是要跑 ML/DL)
: : 感謝!
: http://blog.gpueater.com/en/2018/04/23/00011_tech_cifar10_bench_on_tf13/
: https://imgur.com/JMx1csU
: 雖然這資料有點舊,單就效能論,是有資格和nvidia一戰啦。
: 但我覺得,要買vega來跑你還要加上debug的風險和時間。
: 划不划算就看你認為這時間佔多少成本。
: 有的人就喜歡嘗試研究,時間不佔成本。那vega就划算
: 有的人就喜歡穩,不喜歡花時間在這種沒意義的除錯上。那就nvidia划算。
: 以下真香評論:
: nvidia要保持領先也不是那麼容易的事情
: 若要問AMD的ROCm在做啥
: 基本上就是把nvidia cuda的API照抄一遍
: cuda有什麼function我就改個名字,設計一個一毛一樣的function
: 然後再收錄進我大ROCm的Library中
: 最後再設計一個自動更名程式,把原本寫給cuda的程式,自動改編為ROCm的程式
: (https://github.com/ROCm-Developer-Tools/HIP )
: 現在這個ROCm版的tensorflow,就是這樣搞出來的。
: 以上面的測試報告看來,Vega 12nm 的效能是有達到能與nvidia一戰的水準
: 就只差可靠度,以及軟體支援速度(什麼時候才會有官方pytorch??)。
: 如果這年度Vega 7nm發售,且可靠度、支援速度能有所提升的話,那是挺值得買的。
: 再搭配上AMD的HBCC記憶體技術,拿內存當顯存用,直接讓你突破16GB顯存容量限制。
: 這點簡直令所有做AI的人垂涎三尺。
: 但目前HBCC+ROCm應該還沒成熟
: (https://github.com/RadeonOpenCompute/ROCm/issues/525 )
: 註:
: 我是有一張Vega 56啦,之前買來挖礦,但目前拿來打電動比較實在。
: 跑實驗還是用1080ti

--

All Comments

Frederica avatarFrederica2019-10-09
之前也是有疑問,不過後來查資料
N家有tensor core還是差蠻多的(?
Yuri avatarYuri2019-10-09
現在測的都勇者,debug到死
Ursula avatarUrsula2019-10-10
不會浪費時間在搞這個吧 而且早在玩的都n卡在跑了
Caroline avatarCaroline2019-10-10
現在2.0 bug已經夠多了 去亂pytorch拉
Eartha avatarEartha2019-10-14
tensor core那也要半精度才有用吧 真實很少用到
Brianna avatarBrianna2019-10-16
之前在跟廠商洽談伺服器的時候 也問到amd這一塊 結
果廠商直接氣到跳起來
Lucy avatarLucy2019-10-17
說只有台大無聊才都買來測效能,另一個中央的買來
結果出包讓兩邊都很臭
看了一下ip還真的112
Necoo avatarNecoo2019-10-21
memory bound kernel 的 instruction scheduling
還有進步空間
Bennie avatarBennie2019-10-26
AMD 的GPU Rocm 還很弱,你還是乖乖的用N家的
Rosalind avatarRosalind2019-10-29
先讓AMD和大廠debug完,再去用 AMD GPU
Annie avatarAnnie2019-11-01
5樓XDDDD
Una avatarUna2019-11-02
我應該是還不會自己跳下去試 XDD
Todd Johnson avatarTodd Johnson2019-11-06
只是想看看有沒有試過的人經驗分享