クラスターの試験

ようやく構築できたクラスターシステム。
今日はこいつのテスト。
利用法の要約とあわせてメモ

SCOUT

http://www.pccluster.org/score/dist/score/html/ja/installation/scout-test.html
基本的にはここに全て書いてあるが、一部わかりづらいので編集。
 

環境変数の設定

$ export SCBDSERV='hostname'
$ export PATH=$PATH:/opt/score/bin
この二つを設定することで他のホストもSCoreデータベース(管理情報)にアクセス可能となるらしい。が、管理サーバー以外で利用する場合の詳細についてはまだ不明。

scoreboard

scoreboadはSCoreクラスターシステムのシステムモニターのようなソフト。

とりあえず登録されたデータベースの確認から。
$ scorehosts -l -g pcc
このコマンドで登録されたホストが一覧表示される。 -lが多分一覧表示のオプション。-g pccはグループ名の設定。pccは設定に会わせて随時読み替えること。
 
つづいてクラスタホストの試験
$ sceptic -v -g pcc
このコマンドで各ホストの状態がわかる。OKなら問題なし。
問題があった場合の対処法は不明。ケースバイケースでがんばれ。
 

scoutコマンド

$ msgb -group pcc &
これでメッセージボードが起動する。ただしGUIでのみ。
 
$ scout -g pcc
このコマンドでクラスターにコマンドを投げる環境が起動する。
 
$ scout
のような単体起動ではSCOUT環境の状態を表示する。

$ scout command
これで各ホストにcommandを投げる。
ただし全部に同じコマンドを投げるだけなので用途は少ないw
 
ちなみに抜けるときはexitで。
 

PM

 http://www.pccluster.org/score/dist/score/html/ja/installation/pm-testethernet.html
 特にわかりにくいところもないのでここ参照。
 以下一応要約。

起動

# /etc/rc.d/init.d/pm_ethernet start

Point to Point テスト

hostXからhostYへの通信試験
サーバーから
$ rpmtest hostY ethernet -reply
別のウィンドウで
$ rpmtest hostX ethernet -dest Y -ping
なお、dest Y は宛先ホストのノード番号を指定

総合テスト

全ホストにランダムなメッセージを送るストレステスト。

$ scout -g pcc
$ scstest -network ethernet

SCORE D

マルチユーザー環境
# msgb -group pcc &
# scored

これで別のシェルからも計算を投げられるようになる。
つまりルート以外のユーザーがtelnetでログインして利用可能になる。

プログラムのコンパイルと実行

コンパイルにはmpcc,mpc++,mpif77,mpif90等を用いる。
実行はシングルユーザーの場合
scrun -nodes=ノード数 実行バイナリ
とすればOK
また、
mpirun -np ノード数 実行バイナリ
でも動く。
なお、SCoreDでマルチユーザー環境を使っている場合はSCoreDが動いているホストを指定してやる必要がある。