openpbs

計算ノードで pbs_mom を起動すると SSH で入れなくなっちゃうよー。… しかし、NFS は動いてるみたいで、ちゃんと log のファイルなんかは吐いている。

朝3時くらいまで OpenPBS/torque をいじってた。
計算ノードで pbs_mom を起動すると SSH で入れなくなっちゃうよー。
rup とかにも反応しないから、ネットワーク関係が全体的に駄目になってる感じ。
しかし、NFS は動いてるみたいで、ちゃんと log のファイルなんかは吐いている。
謎。
うむむむむむむむむ。
とりあえず機器室いって reboot してくるかー。
で、原因がわかったのだが、つまり、NFS の lock が、FreeBSD 6.1 では壊れちゃってるようで、rpc.lockd を使わないようにしたらちゃんと動くようになった。しかし、これだと pbs_mom がロックファイルを flock() しようとして失敗するので、そこをコメントアウトしてコンパイルする必要がある。

コメントを残す