unix:slurmusage
差分
このページの2つのバージョン間の差分を表示します。
| unix:slurmusage [2025/08/24 11:13] – 作成 editor | unix:slurmusage [2025/08/24 12:12] (現在) – 削除 editor | ||
|---|---|---|---|
| 行 1: | 行 1: | ||
| - | ====== Slurm ====== | ||
| - | ===== 使い方 ===== | ||
| - | ==== ユーザー編 | ||
| - | === デフォルト設定値 === | ||
| - | ^job partion/ | ||
| - | |tenMin|10分以内| | ||
| - | |oneHour|1時間以内| | ||
| - | |threeDay|3日以内| | ||
| - | |oneWeek|一週間以内| | ||
| - | 期限を超えた場合、その job は強制終了となる。 | ||
| - | |||
| - | === job が投入される partition/ | ||
| - | デフォルト値: | ||
| - | 変更する場合: | ||
| - | |||
| - | |||
| - | === job の最大利用メモリ量 === | ||
| - | デフォルト値: | ||
| - | 変更する場合: | ||
| - | |||
| - | |||
| - | === host/queue の確認 === | ||
| - | sinfo -s | ||
| - | === queue(partition) の状況 === | ||
| - | sinfo --Format=" | ||
| - | |||
| - | === host の状況 === | ||
| - | sinfo --Format=" | ||
| - | |||
| - | === job の投入 === | ||
| - | srun command | ||
| - | command を "" | ||
| - | |||
| - | === 標準出力/ | ||
| - | srun -o output.txt -e error.txt command | ||
| - | output.txt/ | ||
| - | |||
| - | === pipe/ | ||
| - | srun bash -c " | ||
| - | |||
| - | === 10個のコアを使用する場合 === | ||
| - | srun --cpus-per-task=10 command | ||
| - | |||
| - | === 多くのメモリを使用する場合 === | ||
| - | srun --mem=40G command | ||
| - | これで、40G 以上のメモリを搭載したノードのみで実行される | ||
| - | |||
| - | === 最低 20 個以上のコアでできるだけ多く使いたい === | ||
| - | srun --exclusive --mincpus=20 command | ||
| - | |||
| - | === queue/ | ||
| - | srun -p tenMin | ||
| - | |||
| - | === interactive (対話) モードでの使用 === | ||
| - | srun --pty bash | ||
| - | |||
| - | === job の確認 === | ||
| - | squeue | ||
| - | == すべての 情報を表示 == | ||
| - | squeue -o " | ||
| - | 例 | ||
| - | squeue --Format=" | ||
| - | == 詳細情報 == | ||
| - | scontrol show job [jobid] | ||
| - | | ||
| - | === その他 === | ||
| - | 上記の " | ||
| - | 例えば、${HOME}/ | ||
| - | alias squeue1=" | ||
| - | 次回ログイン以降から、squeue1 と打つと上記のコマンド結果が表示される。 | ||
| - | |||
| - | == module == | ||
| - | module をバッチ処理で使いたい場合は、以下のようにする | ||
| - | srun bash -c " | ||
| - | source / | ||
| - | // 計算処理 | ||
| - | " | ||
| - | ==== 管理者編 ==== | ||
| - | === node を復活させる === | ||
| - | scontrol update NodeName=cXX State=RESUME | ||
| - | === node のスペック確認 === | ||
| - | slurmd -C | ||
unix/slurmusage.1756034033.txt.gz · 最終更新: by editor
