使用condor系統如何submit平行運算 - Linux

Table of Contents

在unix中管理job的分配有一套叫做condor的系統
如果要丟job到server讓它找你分配cpu來運算,
通常都是使用condor_submit condor.sh
condor.sh是一個shell script大致如下:

universe = vanilla
initialdir = /home/u8/users/burkardt/phoenix_test
executable = foo.sh
log = foo.log
output = foo.output
queue

如果今天在我要跑的job裡面,如上面的foo.sh
有執行了一個套裝軟體(gromacs)內好幾個不同的指令,
只有其中一行是要做平行運算的:

grompp_d xxxxxx
mpirun -np 8 mdrun_mpi_d xxxxxxx
trjconv_d xxxxxxxxx

如上面三行,只有中間一行的指令是做平行運算
這樣子要丟job到condor系統
我把condor.sh改成

universe = MPI
initialdir = /home/u8/users/burkardt/phoenix_test
executable = foo.sh
log = foo.log
output = foo.output
machine_count = 8
queue

然後用condor_submit condor.sh去執行,得不到輸出檔
我也上網去查一些範例,關於MPI的submit,看到的都是單一執行檔
如C語言的xxx.c 或fortran的 xxx.f

可是我要submit的是shell script而且裡面都是commend不是code,
這些commend還是單機還平行的各佔一部份
請問有人知道怎麼樣submit這種shell script到condor系統中呢?

--

All Comments

Kama avatarKama2010-03-02
condor 貴單位應該有不少高手吧...怎麼會在這邊問呢? :p
Agatha avatarAgatha2010-03-04
找不到人問,大家使用需求不同 = =
Poppy avatarPoppy2010-03-09
foo.sh檔案的執行權限?
Mason avatarMason2010-03-10
-rwxr-xr-x 應該不是這個東西的問題,是嗎 @@
John avatarJohn2010-03-12
那把foo.sh裡的指令全都寫成絕對路徑?
Jessica avatarJessica2010-03-15
可參考看看這篇 http://0rz.tw/Lc3mf
Ophelia avatarOphelia2010-03-19
試了,無效....不過還是謝了
Isla avatarIsla2010-03-24
也許你要看看state,說不定一直pending
Sandy avatarSandy2010-03-29
輸出err看看
Mason avatarMason2010-04-01
輸出err一直是空白 XD out也是一樣