cluster的cpu用量監測系統壞掉,替代? - Linux

By Megan
at 2016-10-28T17:48
at 2016-10-28T17:48
Table of Contents
學校的cluster system本來有一個Ganglia的cpu用量監測系統
但Ganglia最近壞掉無法即時監測遠端電腦的cpu使用狀況
cluster是使用"PBS"來派送任務
不知道有沒有替代的指令 可以監測node01~node20,
哪一個node的任務還沒跑完?
因為有的node可能硬體有些問題, 跑得比別人慢
我以前用Ganglia去監測很容易就知道是哪顆node特別慢
然後下次在script指定node的時候就會刻意跳過他
不知道除了Ganglia外 有哪些是不需要root也能執行的指令
讓我知道哪個node執行特別慢 導致整個計算任務倍那個node給拖累
感謝~~~~~
--
Tags:
Linux
All Comments

By Rosalind
at 2016-10-31T00:00
at 2016-10-31T00:00

By Eartha
at 2016-11-04T08:38
at 2016-11-04T08:38

By Queena
at 2016-11-04T13:35
at 2016-11-04T13:35

By Elizabeth
at 2016-11-06T18:10
at 2016-11-06T18:10

By Selena
at 2016-11-07T18:46
at 2016-11-07T18:46
Related Posts
被CENTOS的GRUB弄到崩潰....

By Ula
at 2016-10-28T00:16
at 2016-10-28T00:16
請求各位前輩指點一條明路

By Margaret
at 2016-10-26T10:41
at 2016-10-26T10:41
請求各位前輩指點一條明路

By Hamiltion
at 2016-10-25T21:36
at 2016-10-25T21:36
cygwin 中的 tmux 或

By Edwina
at 2016-10-25T17:18
at 2016-10-25T17:18
Ubuntu 16.04右側數字鍵不能用?

By Olga
at 2016-10-25T17:09
at 2016-10-25T17:09