打造高階工作站(4)-Xeon E5-2650 x2 - 3C

Caitlin avatar
By Caitlin
at 2013-08-12T01:48

Table of Contents

我也是做理論計算的Group

主要都是跑DFT

如果有接觸的人 應該都知道他的計算量非常龐大

底下開了個話題 那我也一起加入討論好了XD

順便供後人參考

最近老闆也是買了5台這樣的機器

我是負責將這些電腦叢集串起來

我的規格跟h大幾乎相同

機器規格:
CPU Intel Xeon Processor E5-2650 * 2
MB SuperMicro X9DRi-LN4F+ * 1
RAM SuperMicro 16GB DDR3-1600 2Rx4 ECC REG * 8
HD WD 500G 64MB RE4 5003ABYX * 1
HD WD 2TBMB RE4 2003FYYS * 1
CHASSIS SuperMicro 825TQ-563LPB *1
OS用 SuSE Linux Enterprise Server 11 SP2
使用OpenMPI-1.6.5 MPI Library
使用Intel Fortran Composer XE 2013 for Linux (2013.5.192)
有使用Composer XE 2013內的 Intel Math Kernel Library
主要是BLAS LAPACK FFT
我有關掉HT 因為對於計算來說HT沒任何幫助 反而還會變慢
預留記憶體插槽之後要擴充用
之前job太大 使用的記憶體超過御風者fat node的上限(256GB) 就死掉了
用2個node才解決此問題...

NFS的主要規格:
Adaptec 6805 8-port PCIe SAS 2.0 RAID Kit
Seagate ST3300657SS SAS 15000RPM, 300GB (HD & Kit) * 8 做RAID0
為何不用SSD?
因為當file system多人讀寫 SSD的緩衝一定不夠撐
SCSI硬碟支援多人讀寫 因此多人多工的環境加上SSD壽命問題 完全不用考慮SSD


主要的軟體是VASP5.2和Gaussian09 這些軟體都是用Fortran寫的

Makefile 編譯參數 OFLAG 御風者用-O2 -ip 效能最好
Xeon用 -O3 -ip -axAVX 效能最好

AMD機器 用他們的編譯器 效能沒比較好 連GotoBLAS效能也比MKL差
結果AMD機器用intel的編譯器和MKL效能最好...

我們也是御風者的用戶 御風者的是使用AMD的CPU

浮點運算效能頗弱(以DFT計算來說)

御風者是強在使用InfiniBand的網路架構

所以還是要看程式怎麼寫 程式寫得不好 平行效率就非常差

這裡的平行主要是MPI架構 不討論SMP架構

所以Code還是很重要 因此影響到體系

以VASP來說 單純算結構Opt的話 御風者單機24core效率最佳
或是一台12core 走InfiniBand跨2個node 效率也不錯
如果使用超過12core 只會變慢 不會變快
用越多core 會越慢

如果VASP是做找過渡狀態 使用NEB方法 平行效率非常好
core越多 計算越快 御風者96core(2個node)是極限了 效率這裡最好
Xoen的話5個node(共80core)效率最好 我們也只有五台這樣的機器 所以沒辦法測下去

所以還是看你的體系決定用什麼電腦

以結構Opt來說 同一個job(學長從以前測到現在 所以就以他的標準)
Xeon E5-2650 *2 共16core 只需要8分鐘
御風者 24core 需要32分鐘
以上是單機跑

跨node 我以NEB計算為基準的job
Xeon E5-2650 *2 用5個node 80core 只要7小時
御風者 用2個node 共96core 將近7小時(不到7小時)
可能原因是1Gbps和InfiniBand的速度比起來根本是天壤之別...
所以這個比較 沒啥意義...

新的CPU強是強在新的AVX指令集
Xeon的Cache也比較大
跟廠商借了ivy的i7的頂級款 用AVX2 還是一樣被sandy的Xeon E5 打假的....
所以時脈似乎不是重點
也難怪Xeon的CPU特別貴(廢話XD)

所以還是看你要算什麼體系而定...

Gaussian09的話 是使用OpenMP架構 所以單機跑效能比較好
Linda那個跨node的library效能超差的 所以就不裝了
不過i7就夠用了

如果用新的CPU 程式沒有重新編譯過 效能是一定跑不出來的

還有我不是資訊相關科系的人 如果我專業術語有錯誤 煩請糾正...

附上機房機器的兩張圖:http://ppt.cc/R9YV
http://ppt.cc/pAYW

獻醜了...

--
Tags: 3C

All Comments

Rachel avatar
By Rachel
at 2013-08-16T15:54
快推 雖然我真的看不懂
Mary avatar
By Mary
at 2013-08-20T20:20
專業!!
Damian avatar
By Damian
at 2013-08-24T21:20
同理論計算淚推
Faithe avatar
By Faithe
at 2013-08-26T03:37
想到這個... 因為自己工作上遭遇挫折, 所以只能...
Dora avatar
By Dora
at 2013-08-29T07:55
眼睜睜看別人已經在玩多機器了,多機一定要碰上 MPI.
Daniel avatar
By Daniel
at 2013-09-01T16:07
至於 openmp 只能單機使用... (默)
Skylar Davis avatar
By Skylar Davis
at 2013-09-06T09:38
以前弄伺服器曾經很想買個機櫃回家用,現在回頭想想
我這種想法真是太智障了
Necoo avatar
By Necoo
at 2013-09-06T10:49
推~
Gilbert avatar
By Gilbert
at 2013-09-09T08:29
化學 或生化嗎? 御風者不是在新竹的國家高速網路與
Daph Bay avatar
By Daph Bay
at 2013-09-10T00:05
計算中心 所以原po是交大的囉XD?
Steve avatar
By Steve
at 2013-09-13T02:34
BTW 你們有試過更換I/O嗎,同樣的預算下跑SSD raid0
Faithe avatar
By Faithe
at 2013-09-16T09:26
或丟ramdisk 時間/JOB的提升效果很明顯喔!
Andy avatar
By Andy
at 2013-09-16T11:04
另外請問 御風者7小時 是算什麼樣的JOB呢@@?
Caitlin avatar
By Caitlin
at 2013-09-18T07:46
SSD不適合多人多工 buffer不夠大
同時間 有人讀 有人寫 I/O一下就塞爆了
Candice avatar
By Candice
at 2013-09-22T23:05
七小時就用NEB Method 找TS的JOB
Necoo avatar
By Necoo
at 2013-09-23T19:53
Soga 了解:D
我們實驗室人少 一個人大約可以分到一台工作站一 一
Adele avatar
By Adele
at 2013-09-27T00:12
御風者在新竹科學園區沒錯 但遠端過去就可以送JOB了
Anthony avatar
By Anthony
at 2013-10-01T05:36
不過工作站大概就原po那台的一半而已orz...虛弱
Iris avatar
By Iris
at 2013-10-03T18:43
只能說實驗室有那麼多預算真好.. 我們lab買不起..
Margaret avatar
By Margaret
at 2013-10-04T22:50
By the way, 在這種應用下DFS會不會比NFS適合呢?
Hardy avatar
By Hardy
at 2013-10-09T21:26
可是軟體安裝這些我都是自己來 很累...
請廠商弄還需要多個50萬吧
David avatar
By David
at 2013-10-13T12:34
DFS有考慮要架了 目前正在看相關的文章 :-)
Agnes avatar
By Agnes
at 2013-10-15T06:42
不過DFT比起CSD, CCSD來說, 計算量算是很小了.. XD
Faithe avatar
By Faithe
at 2013-10-20T05:24
應該不會哦 一個晶胞 500多個原子 一次就要一個禮拜
丟fat node的long queue還算不完= =
Agatha avatar
By Agatha
at 2013-10-22T13:14
因為御風者有設wall time 所以時間到就把你砍掉
Hedy avatar
By Hedy
at 2013-10-26T01:15
完全看不懂 先推 QQ
Sarah avatar
By Sarah
at 2013-10-27T00:05
有神快拜 ....
Sandy avatar
By Sandy
at 2013-10-28T12:28
快推
Oliver avatar
By Oliver
at 2013-10-30T14:59
咦 我想問的是~現在SCSI不都已經轉為SAS了?
James avatar
By James
at 2013-11-01T13:15
是 所以用的是SAS 只是我拿SCSI來舉例
Steve avatar
By Steve
at 2013-11-06T02:26
樓主有講SAS 先呀,只是說真的還是習慣稱之為SCSI
Barb Cronin avatar
By Barb Cronin
at 2013-11-07T15:41
而且 SAS 的第二個 S ,也還是 SCSI 沒有錯.... ^_^
Oscar avatar
By Oscar
at 2013-11-08T04:49
Serial Attached SCSI!
Kelly avatar
By Kelly
at 2013-11-08T13:12
Cool!
Barb Cronin avatar
By Barb Cronin
at 2013-11-12T08:48
感覺超屌的 我推

新買套裝電腦~機殼有前置U3 接法怪怪的..

Adele avatar
By Adele
at 2013-08-12T00:30
機殼是 樹昌 N2(前置有一個2.0 一個3.0) 主機板是 ASUS P8B75-M LX PLUS(原價屋看說明有前置USB3.0接腳) 想請問這樣配的前置USB3.0接線,是直接接到主機板上, 還是拉一條延長線接到後面的UBS接口(如圖)....? http://ppt.cc/-Pw2 htt ...

關於常見的菜單選購請教和提問

Daph Bay avatar
By Daph Bay
at 2013-08-11T23:57
目前配的菜單 處理器 : Intel Haswell Xeon E3-1230V3 $7750 主機板 : 技嘉 B85M-D3H/M-ATX/1A1D1H/U3S6/4*DDR3/前置19Pin U3 $2790 記憶體 : RAM 金士頓 HyperX blu 1600單條8GB x 2 $3600 S ...

DDR3的8G、4G又在跳水了……

Caroline avatar
By Caroline
at 2013-08-11T23:54
固定利潤, 這個前提太假了 哪個老板定價是用固定利潤的? (謎之音: 順發?) 根本就不值得討論 1.市場並不是完全競爭市場, 而是由幾個中盤商所壟斷 另外, 商人又有很多手法, 維持自己的利潤 ex:聯合定價、壟斷貨源、資訊不透明等 例如聯合定價的行為, 就是為了獲取最大利益 大家沒 ...

20K含螢幕,輕度遊戲文書機(已有顯卡)

Agatha avatar
By Agatha
at 2013-08-11T23:46
已買/未買/已付訂金(元):20K 預算/用途:不含顯卡,20K含螢幕、喇叭的輕度遊戲文書機!! CPU (中央處理器):Intel 第三代Core I5-3470 $5800 MB (主機板):技嘉 B75M-D3H/M-ATX/1A1D1H ...

舊電腦升級 10k左右

Vanessa avatar
By Vanessa
at 2013-08-11T22:56
沿用的部分 電源: 蛇吞象 96 500W 大概服役4年 記憶體: DDR3 1333 4Gx2 大概2年 硬碟: WD 綠標 1TB 換過一次...剛好是南亞海嘯硬碟價格飛漲的時候 VGA: 技嘉GTS450 1G 使用1年半 希望更新 CPU: Intel 第三代Core I5-3470四核 ...