機器學習 Nvidia Tesla T4 or Quadro RTX - 3C

Delia avatar
By Delia
at 2020-04-26T15:18

Table of Contents

目前確實打算等GTC 2020後再打算,因為只有一個月左右時間可能還能等

說一下目前做的功課

1. 參考 fo40225 大的文章決定除GPU部分的配置

#1SxhRJ80 (PC_Shopping)

2. Nvidia vGPU認證資料
要挑機器直接從當中挑就好了
https://www.nvidia.com/en-us/data-center/resources/vgpu-certified-servers/

Asus 不知道臺灣本部的情況如何,國外事業部的服務水準很鳥,客服根本聽不懂我們在說什麼

Cisco 價格太貴了,而且服務支援太麻煩了

Dell EMC 不理會我們,似乎是之前被放鳥太多次了,可以NVLink的只有1U機型

Huawei 不能出貨了

HPE 4U外的機器估價很慢,出貨太少的緣故吧。GPU一定要裝4塊才能出貨

Lenovo 機器是很便宜,但是全部都只能上Tesal T4也沒有NVLink

Supermicro 可以凸一下只安裝2 GPUs出貨


3. 數個效能評估文章
https://blog.exxactcorp.com/whats-the-best-gpu-for-deep-learning-rtx-2080-ti-vs-titan-rtx-vs-rtx-8000-vs-rtx-6000/
https://lambdalabs.com/blog/choosing-a-gpu-for-deep-learning/

得出來的結論就是,論單一GPU,不考慮double precision(因為很少有用)
GPU Memory > Tensor core

4. NVLink
目前只有SXM form fator(板卡尺寸)才支援NVLink Hybrid Cube Mesh
也就是單個CPU上的GPUs之間都是用NVLink互相連接的,兩個CPUs上的GPUs是可以通過
有限通路的NVLink相互連接

而普通的NVLink只能兩個GPUs之間互相連接

至於能否變成Memory Pool或者利用複數GPUs的tensor core進行運算,我不確定效果
因為之前的機器配置的連接模式有問題

根據nVidia方面的說明,nccl能幫你完成這方面的工作,OpenMP也已經提供了相應的支援
不過具體使用方式,取決於你的training framework,例如Horovod 表示是可以支援多GPUs
分發,但是我還是不確定這部分的效果


5. Tesla VS Quadro VS Titan
其實沒有什麼可選的,只有那幾款Tesla才有採用SXM form factor
Titan系列的都不支援SR-IOV,如果想要VMware 下無修正使用(會損失效能),只能考慮
Tesla或Quadro

價格上來講,Tesla會比Quadro較優,Titan是CP值最高

: → hizuki : 但是Titan要三槽位很難插,只能找美超微定機器了? 04/18 14:36
: 推 atrix : Titan rtx 只占用雙槽,不會卡到第三槽。 04/19 00:20
: 散熱器會突來一點
: → atrix : 我晚點裝看看,我記得是不會卡到阿? 04/21 10:20
: → atrix : 是裝的下拉,不過多卡時,散熱就很緊 04/21 10:45
: → atrix : http://i.imgur.com/SY1vtWZ.jpg 04/21 10:45
更麻煩的是比如4U托架伺服器的槽位,估計只能勉強塞下,要拆掉散熱塑膠,
然後沒有地方給你安裝NVLink bridge


6. 結論
目前 US$ 20,000的預算是沒有辦法選支援NVLink hybrid cube mesh的機型的,
托架式的可能無法安裝NVLink bridge

--
你比較喜歡哪一個?
當年不是黨國大老但是被江浙財團捧紅的中國帥哥
跟同樣擁兵一方的諸侯約會裁軍結果半途諸侯們爽約,平常有在寫日記的莊嚴男人開始發飆
在旁邊讀著荒漠甘泉冷眼旁觀看著薔薇戰爭的人,為了中國的事情爭吵
別國調侃是不是中國總統,義正詞嚴的說著我是民族的燈塔的威嚴老先生

--
Tags: 3C

All Comments

Yedda avatar
By Yedda
at 2020-04-27T23:51
現在用雲端運算服務會不會比較便宜啊?
Brianna avatar
By Brianna
at 2020-04-30T03:45
雲端如果沒敏感資料的話 應該可行 只是熟悉要花點
前置工夫
Michael avatar
By Michael
at 2020-05-04T09:39
如果是突然的一次性預算核銷問題就比較麻煩

異物造成電源供應器一次側短路原因

Anonymous avatar
By Anonymous
at 2020-04-26T13:38
狼窩好讀版: https://wolflsi.pixnet.net/blog/post/68867171 目前電源供應器,一次側(包含APFC)區域,常用的功率元件有兩種封裝,一種是TO-220, 一種是TO-220FP(FullPAK),如下圖所示,最左邊的TO-220因為外露金屬部分與下方其中 一個接腳 ...

主機板插不同廠牌的記憶體

Delia avatar
By Delia
at 2020-04-26T12:24
想組台新電腦 店家現在有個小套餐是 主機板跟8GB*2記憶體與power搭載一起賣 華碩 ROG STRIX X570-F GAMING+科賦 KLEVV 16G(8GB*2) DDR4 3200 BOLT X系列 +艾維克EVGA 650 GT 650W 金牌全模 我是想再買 ...

AMD R5-3500X 主機板選擇?

Joseph avatar
By Joseph
at 2020-04-26T11:31
不曉得主機板該選哪一種..... CPU是R5 3500X 顯卡是ZOTAC RTX2070super AIR 8G 小張的 組這台就純粹拿來打遊戲的... 預算只有36000左右 現在卡在主機板不曉得要怎麼選.... 我猶豫了這四張: 華碩 TUF-B450-PRO-GAMING $3590 華碩 S ...

替代WD紅標NAS碟4TB的選擇

Yedda avatar
By Yedda
at 2020-04-26T11:29
各位好,最近WD釋出了RED NAS更改成疊瓦式(SMR)設計的消息,因為本身工作的單位會將病患每天受檢驗的raw data放在NAS裡(QNAP TS219P),使用的是WD RED 4TB ,由於最近又要採購新的硬碟了,想問有沒有推薦能維持正常寫入速度(這個會影響工作)和儲存安全型比較高的替代產品,價位可 ...

35k遊戲影音機

Quintina avatar
By Quintina
at 2020-04-26T11:24
*.因應新冠期間部分零組件過高,若無必要可暫時觀望。 可參考本板菜單(20200226) https://www.ptt.cc/bbs/PC_Shopping/M.1481269090.A.A10.html *.安裝作業系統若無法安裝請先更新BIOS。 **AMD CPU相對問題較多,購買時需有除錯後送修之準 ...