硬碟常常會有讀取錯誤產生 - Linux

Table of Contents


學校的計算電腦叢集的硬碟常常會卡住和產生錯誤

比方說 我用df指令時, 顯示計算硬碟掛載的目錄部分就會當住

dmesg 也會產生很多相關的錯誤



LustreError: Skipped 16 previous similar messages
Lustre: 4440:0:(import.c:517:import_select_connection())
wk2-OST0000-osc-ffff81042ee37000: trie d all
connections, increasing latency to 25s
Lustre: 4440:0:(import.c:517:import_select_connection()) Skipped 9 previous
similar messages
LustreError: 11-0: an error occurred while communicating with
192.168.170.233@o2ib. The ost_con nect operation
failed with -30



這類硬碟讀取問題要怎麼自動排除和檢測呢?

有一套sop流程嗎?

感謝~~~~~




--

All Comments

Franklin avatarFranklin2016-09-17
fsck
Joseph avatarJoseph2016-09-21
上面似乎不是硬碟的訊號。 卡住先確認網路是否正常
Necoo avatarNecoo2016-09-24
連問題都不會問,這是lustre
Rebecca avatarRebecca2016-09-25
直接回報管理單位吧
Charlotte avatarCharlotte2016-09-30
交給專業的就好,還是你想自己扛屎?
Ida avatarIda2016-10-03
應該是流量太大暫時搞掛 NFS ,暫存本機別直接存 NFS
結果跑完再一台一台各自拉回去
Belly avatarBelly2016-10-07
可是他是Lustre,如果實驗的資料量太大就沒辦法這樣玩