CentOS fortran平行計算問題 - Linux

Table of Contents

https://www.slothparadise.com/running-mpi-common-mpi-troubleshooting-problems/


https://i.imgur.com/pKWdhds.jpg

也遇到這個網站貼一個問題
已經照他的建議操作
但是還是有一樣的error
我懷疑是library沒辦法在各個nodes 共用

想請問有人有類似經驗 很需要幫忙 謝謝
可以再私訊詳述問題 麻煩了

--

All Comments

Joseph avatarJoseph2022-03-22
總共有6個nodes 但是只能利用其中一個 也就是指令只能
是#PBS -l nodes=1:ppn=40 最多
Mia avatarMia2022-03-26
每個節點彼此都要能免密碼登入,這點確定了嗎?
Adele avatarAdele2022-03-22
有的 感謝提醒 還有什麼要注意的嗎
Anonymous avatarAnonymous2022-03-26
每個節點防火牆、selinux都關掉,可以輸出PBS的log
Zenobia avatarZenobia2022-03-22
可以試試看在每個節點跑mpirun確認是不是submit問題
Ursula avatarUrsula2022-03-26
再來把.ssh/known_hosts節點清掉排除hosts key問題
Adele avatarAdele2022-03-22
沒有 InfiniBand 多節點也只是無用的技術。
Margaret avatarMargaret2022-03-26
跨節點建議 /home 及 /opt 用 NFS 分享,ssh key放/home
Iris avatarIris2022-03-22
另外建議用 PIC 編譯所有的程式碼。
John avatarJohn2022-03-26
因為 PIC 會影響分支預測的準確率。
Ivy avatarIvy2022-03-22
一般建立mpi時,會用nis在每個節點建立相同的使用者
代號。若要用ssh方式,要使用ssh_keygen做出金鑰對放
到各節點
Mason avatarMason2022-03-26
其實nis+nfs共享home就不用每個節點丟key了
放到head node自己的auth key就每個節點通用
不然很多台每個使用者每台都要做一次真的累
Audriana avatarAudriana2022-03-22
但就是平行時比較吃網路