JOB會停在server上不動也沒錯誤 - Linux

Table of Contents


各位好

我用Mpif90 編譯產生一個執行檔a.out

然後這個a.out再跑一段時間之後就停頓在那邊

也沒有錯誤訊息,就只是閒置那邊

我目前因為無法從任何訊息文件得知job是在哪個地方出問題

我自己猜測是I/O 不同步 或其他原因

有人知道要怎麼去檢測這個job閒置的原因為何?

我有想過

1. 在mpif90 那邊加一些除錯的選項 -debug 之類

2. 用stat 之類的指令去偵測a.out正在等待哪個子程序的回應或檔案的讀取,..等


能否請版友給我一些方向讓我可以順利解決此問題?

萬分感謝~~~~




--

All Comments

Rae avatarRae2016-05-02
在程式裡面加些print看看是不是卡在某一段吧
Franklin avatarFranklin2016-05-07
gdb attach 後中斷它然後 bt
Caroline avatarCaroline2016-05-11
直覺是你的程式被blocking message passing函式卡住
Andy avatarAndy2016-05-15
如同樓上所提 用debugger或加printf去查