概要
Rescale で初めてバッチジョブを実行するには、プラットフォームの基本的な仕組みを理解し、特定のベストプラクティスに従う必要があります。
このガイドでは、ローカルでのシミュレーションからクラウドベースのバッチ処理へ移行する際に押さえておくべき重要なポイントを説明します。
最初のバッチジョブを実行する前に、以下のドキュメントをご参照ください。
バッチジョブは主に Linux 環境上で実行されるため(特に指定がない限り)、Linux のファイルシステムの慣習や制約に慣れておいてください。
ガイドライン
シミュレーションの理解
Rescaleでシミュレーションを実行する前に、以下の点を確認してください。
実行するシミュレーションの種類を十分に理解していること
ローカル(オンプレミス)環境で、少なくとも一度は正常に実行できていること
想定される入力・出力および実行時の挙動を把握していること
実績のある構成から始める
初回の実行では、以下を推奨します。
ローカル環境で正常に完了した際と同じ、またはできるだけ近いコア数を使用すること
まずジョブが正常に完了することを確認し、その後でスケーリングによる性能最適化を検証すること
エラー発生リスクを低減するため、可能な限り既知の構成条件で実行すること
ソフトウェアバージョンの互換性
Rescaleで利用するソフトウェアのバージョンが、入力ファイルを作成したローカル環境のバージョンと一致していることを確認してください。ただし、入力ファイルとの後方互換性が担保されている場合には、より新しいバージョンの利用も可能です。
ファイル名のルール
Linux互換性のため、入力ファイル名にスペースは使用しないでください。Windowsではスペースを含むファイル名が一般的ですが、多くのバッチジョブが実行されるLinux環境では、スペース付きのファイル名は標準では適切に扱われません。
アップロード前に以下を確認してください。
スペースをすべて削除する
代わりに「_」または「-」を使用する
スクリプト内の参照ファイル名がすべて一致していることを確認する
推奨ワークフロー
ローカル環境での事前確認:シミュレーションがローカル環境で正常に実行できることを確認する
互換性の確認::ソフトウェアバージョンおよびファイル名に問題がないことを確認する
保守的な構成で開始:実績のあるコア数および設定を使用する
投入と監視:初回ジョブ実行時は、ログや出力を継続的に確認する
段階的な最適化:正常に完了したことを確認した後、段階的に性能最適化を実施
ネクストアクション
最初のバッチジョブが正常に完了した後は、以下のステップを検討してください。
ジョブのパフォーマンス指標を確認し、最適化の余地を見つける
より良い性能を目指して、異なるコアタイプやコア数を試す
ジョブテンプレートや自動化などの高度な機能を活用してみる
監視や通知設定の導入を検討する
これらのガイドラインに従うことで、クラウドベースのシミュレーションへのスムーズな移行が可能になり、Rescaleプラットフォームを継続的かつ効果的に活用するための基盤を築けます。
