AMD GPU 跑 tensorflow 順暢嗎? - 3C

Hazel avatar
By Hazel
at 2020-05-14T16:35

Table of Contents

更新:

這幾天用plaidml+ngraph+tensorflow的方式

效能慘不忍睹

後來又回去試rocm 認真看了一遍官網的教學

才發現要用docker的環境@@

少了這個步驟直接用tensorflow-rocm也可以跑

但效能會讓你哭出來

不過最後結果還不錯啦

至少在我目前訓練的速度上跟1060都可以打平

有想要用amd跑tensorflow的也歡迎討論XD
---------------------------------

最近在做gan的專題

剛好手邊有一張amd rx580

想說就來玩一下linux+rocm

不得不說 用amd顯卡做深度學習 真的在搞自己XD

光裝系統+驅動 就耗了快一天...

更別提後來又重裝好幾次XD

而重點是裝好後跑training的效率

大概只有 gtx 1060的1/3...

這邊沒有詳細數據 因為測完當下真的太生氣

直接把linux砍了XD

我自己感覺是優化的問題

跑model的當下使用率很低

大家有興趣可以玩玩看

但amd的深度學習之路離nv還是有蠻大一段距離

順帶一提 放棄rocm後

發現可以用 plaidml+ngraph+tensoflow

不過這也是一條不歸路...

※ 引述《shaform (Shaform)》之銘言:
: 是說現在 AMD RoCm 的原始碼已經被合併進 TensorFlow 官方的 codebase 裡
: 雖然說還是被稱為 community support build
: https://github.com/tensorflow/tensorflow#community-supported-builds
: 不過穩定性會不會已經有所提昇了 (?)
: 不知版上有沒有勇者嘗試過呢
: 這年頭做 Deep Learning 時 GPUs 用的越來越兇
: 真希望多點競爭趕快降價 XD
: ※ 引述《exeex (人非腎鹹)》之銘言:
: : ※ 引述《geminitw (geminitw)》之銘言:
: : : 目前有在考慮購置第二台機器跑 DL/ML,
: : : 但因為... 2080ti 價格偏高, 也不知道哪個硬體版本穩定,
: : : 加上 7nm GG 盛名, 想說 GG 7nm 產能會被爛蘋果影響,
: : : 乾脆幫 AMD GPU 7nm 捧個場.
: : : 只是不知道 tensorflow based on AMD RoCm 目前跑起來的狀況/效能如何?
: : : 請各位前輩指點迷津... 或者 推薦 2080ti 的版本也很可以
: : : (啥雪花? 金平? 太陽花? Turbo? 很亂... 我只是要跑 ML/DL)
: : : 感謝!
: : http://blog.gpueater.com/en/2018/04/23/00011_tech_cifar10_bench_on_tf13/
: : https://imgur.com/JMx1csU
: : 雖然這資料有點舊,單就效能論,是有資格和nvidia一戰啦。
: : 但我覺得,要買vega來跑你還要加上debug的風險和時間。
: : 划不划算就看你認為這時間佔多少成本。
: : 有的人就喜歡嘗試研究,時間不佔成本。那vega就划算
: : 有的人就喜歡穩,不喜歡花時間在這種沒意義的除錯上。那就nvidia划算。
: : 以下真香評論:
: : nvidia要保持領先也不是那麼容易的事情
: : 若要問AMD的ROCm在做啥
: : 基本上就是把nvidia cuda的API照抄一遍
: : cuda有什麼function我就改個名字,設計一個一毛一樣的function
: : 然後再收錄進我大ROCm的Library中
: : 最後再設計一個自動更名程式,把原本寫給cuda的程式,自動改編為ROCm的程式
: : (https://github.com/ROCm-Developer-Tools/HIP )
: : 現在這個ROCm版的tensorflow,就是這樣搞出來的。
: : 以上面的測試報告看來,Vega 12nm 的效能是有達到能與nvidia一戰的水準
: : 就只差可靠度,以及軟體支援速度(什麼時候才會有官方pytorch??)。
: : 如果這年度Vega 7nm發售,且可靠度、支援速度能有所提升的話,那是挺值得買的。
: : 再搭配上AMD的HBCC記憶體技術,拿內存當顯存用,直接讓你突破16GB顯存容量限制。
: : 這點簡直令所有做AI的人垂涎三尺。
: : 但目前HBCC+ROCm應該還沒成熟
: : (https://github.com/RadeonOpenCompute/ROCm/issues/525 )
: : 註:
: : 我是有一張Vega 56啦,之前買來挖礦,但目前拿來打電動比較實在。
: : 跑實驗還是用1080ti


-----
Sent from JPTT on my OnePlus GM1910.

--
Tags: 3C

All Comments

Tom avatar
By Tom
at 2020-05-16T10:23
用rocm乾脆用colab算了...不想花一堆時間去搞AMD的
環境
Faithe avatar
By Faithe
at 2020-05-18T20:28
train好再把model拉回來
Linda avatar
By Linda
at 2020-05-20T13:04
試著搞了一整天之後我的感想只有幹他媽的rocm
Cara avatar
By Cara
at 2020-05-24T18:17
AMD這方面真的輸太多了...
Linda avatar
By Linda
at 2020-05-28T21:14
也可能是tensorflow支持度差
聽說跑CNN比N卡效率還高
Daph Bay avatar
By Daph Bay
at 2020-06-01T12:48
另外還有更深坑的,在黑頻果上面用XDD~
Joseph avatar
By Joseph
at 2020-06-03T12:50
雙精度通常是跑什麼啊?我記得N卡半精度強 A卡雙精
度強
Regina avatar
By Regina
at 2020-06-05T17:49
搞這個還用AMD的GPU是抖M吧
Kelly avatar
By Kelly
at 2020-06-07T18:02
買一張N卡 解決!ODO
Brianna avatar
By Brianna
at 2020-06-10T05:15
學校實驗室10幾張2080在跑又快又穩
Erin avatar
By Erin
at 2020-06-13T07:18
拉基amd
Dorothy avatar
By Dorothy
at 2020-06-15T19:18
ipc提升15% ,顯卡跑分和2060平手
一定是app問題
Connor avatar
By Connor
at 2020-06-18T21:21
沒有cudnn跟cuda用應該是差很多吧

windows 10 2004新增支援處理器

Andy avatar
By Andy
at 2020-05-14T14:30
MSDN已經發布了~可以發現 新增支援Ryzen 4000系列和i皇10代CPU, 網傳家用版預計2周內上市,剛好在10代CPU發售前 - ...

量測設備使用電腦41k

Freda avatar
By Freda
at 2020-05-14T14:17
我之前有幫實驗室電腦弄一個9代intel的電腦 主機板:技嘉 H310M S2P 2.0 有兩個PCI 在Windows XP 下 使用 PCI-GPIB 沒問題 https://hibest.tw/windowsxp/ 我相信Windows 10 應該更沒問題 驅動程式 通常你軟體的安裝光碟都 ...

unreal engine 5 展示

Daniel avatar
By Daniel
at 2020-05-14T13:26
https://youtu.be/qC5KtatMcUw ue5展示了下世代遊戲引擎水平 ue引擎大概就代表 未來這幾年的畫面水平 展示是用ps5跑的 大家覺得2070跑的出來嗎? ----- Sent from JPTT on my Asus ASUS_Z017DA. - ...

預算12K顯卡升級請益

Eartha avatar
By Eartha
at 2020-05-14T12:30
最近升級完電腦硬體規格,也添購了一顆2K 144Hz的螢幕,顯卡是沿用原來的1060 6g, 手上有約12K的預算,想升級顯卡,目前考慮的選擇有 1. ASUS DUAL-RX5700-O8G-EVO $7,990 2. AXRX 5700XT 8GBD6-3HDR/OC 紅龍 $11,990 ...

華碩PA329C簡易心得文

Ingrid avatar
By Ingrid
at 2020-05-14T10:53
前言: 現役兩台華碩 PA246Q 兩台都無亮暗點, (當初一台網購運氣非常好) (一台彩河開了三台,但彩河那台有陰陽臉) AdobeRGB 98%廣色域CCFL背光實在是非常不錯, 可惜現在買不到CCFL的產品了。 上一台入手4K螢幕華碩PA329Q因為正中 ...