深度學習機[300K](更新需求) - 3C

Table of Contents

樓主應該已經買了,
但我還是簡短的回一下文給之後有需要的朋友參考.

一台拆成多台有好有壞,
好的是如果大家的job都很簡單,
可以拆成很多台獨立的機器用,
不會互相干擾,
另外也會有比較多的CPU資源可以用(承上一篇).
但壞處就是管理很麻煩,
還有萬一要訓練很大的模型的時候,
沒有什麼簡單高效的方法可以把所有的GPU聚合在一起用,
彈性受到限制.

我們一直都是組八張GPU的機器,
使用後也慶幸沒有拆成兩台四張GPU (當初有在考慮這個選項),
目前在找有沒有可以在合理價位可以插16張的機器 (預算大約600-800K左右),
因為預算很有限, 所以還沒有找到...

另外之前實測Titan V,
只比Titan X快一些些而已,
我猜是因為tensor core的支援還沒有成熟,
現在的情況不清楚,
如果情況沒太大變化的話,
不太建議攻Titan V,
不過我是打算買一張Titan V插在Local電腦上,
負責做快速的實驗與迭代,
但主要的機器還是走平價GPU路線比較實在.

※ 引述《lover790222 (fighter)》之銘言:
: 謝謝版友回文:D
: 目前確認了一些需求:
: 要組"一台"伺服器
: 要買的有:
: 顯卡、硬碟、主機板、機殼、POWER、散熱裝置、CPU、記憶體
: 目前顯卡考慮有Nvidia Titan V、1080Ti
: 選1080Ti 可以買四張,
: 而Titan V 就選兩張不知道剩下來的預算夠不夠。
: 硬碟的部分,目前考量的點是要容量夠大、夠快以及穩定
: 會自動備份看到有人推薦所以考慮使用NAS,只是沒有使用NAS的經驗
: 不曉得NAS和其他設備要怎麼做連結,
: 只知道裡面可以裝HDD以及SSD,但不確定哪個要用來儲存運算資料,
: 通常會選擇SSD拿來做資料存取對吧?
: POWER建議要上1000W對吧? 要使用UPS系統
: 散熱裝置就要看機殼的選用了吧?不知道有沒有推薦的機殼?
: CPU的部分看到有人推i9可是售價滿高,
: 還是選擇i7為主吧,
: 而搭配主機板看到有人推X399
: 這樣CPU的搭配用AMD Ryzen9比較合適吧?
: 記憶體部分就是128G了,應該已經很夠用了吧
: 謝謝大家的建議!!

--

▂▃▄▃▂
˙
˙
▉▃ /喵喵~~~~
◣╲ˍ ╱

--

All Comments

Zora avatarZora2018-05-25
感謝提供資訊
Steve avatarSteve2018-05-27
雖然用不到,不過幫推
Kelly avatarKelly2018-05-30
推 比底下廢文海好多了
Rae avatarRae2018-06-01
不是因為tensor core只支持半精度 你換成tf.flaot16
下去跑應該就有用了
Jacky avatarJacky2018-06-05
推 不至於廢文海啦 不少資訊我是看打手文才知道Orz
Tracy avatarTracy2018-06-08
Candice avatarCandice2018-06-11
titan v 的科學運算可能有些問題
Adele avatarAdele2018-06-14
不一定每次算出來的結果都一樣,因為沒有 ECC
Cara avatarCara2018-06-15
老黃說想要算科學運算,請買森森的 tesla
https://goo.gl/QvbJCR
Xanthe avatarXanthe2018-06-16
我覺得打手文就當新聞看不錯啊
Hazel avatarHazel2018-06-19
沒加最後一段是新聞 加了是廢文
Necoo avatarNecoo2018-06-20
沒想到titan V有這麼致命的問題