メインコンテンツにスキップ

process_output.log と終了コードからジョブをトラブルシューティング

Rescale でジョブが失敗した場合に、process_output.log ファイルや終了コードを確認し、トラブルシューティングする方法をご紹介します。

今日アップデートされました

process_output.log を読んでジョブエラーを特定する

Rescale のジョブに関する問題の多くは、ジョブの process_output.log を確認することで特定できます。このログには、解析ソフトウェアの標準出力や、多くの潜在的なエラーメッセージが記録されています。


症状

  • ジョブのステータスが Failed または Completed と表示されているが、結果が正しく見えない

  • 実行中にエラーが発生した可能性がある

  • プロセスが正常に終了したかどうかを確認する必要がある


確認方法

  • 確認したいジョブの Results ページを開きます

  • ログが非常に大きい場合は、ログをダウンロードしてテキストエディタで開くと、効率よく検索できます


根本原因と解決手順

原因 1: 対象のログファイルを確認していない

主な実行出力は process_output.log に記録されています

  • ジョブ内で 「結果」ページに移動します

  • 検索バーを使って process_output.log を見つけます(「log」または「process」で検索)

  • 操作列の画面表示アイコンを選択してファイルを開きます。ファイルが大きい場合は、まずダウンロードしてテキストエディタで開くと効率的です

原因 2: エラーまたはワーニングメッセージがログ内に埋もれている

多くの場合、エラーは process_output.log 内で直接特定できます。

  1. ログをスクロールし、「error」や「warning」といった語句を検索します

  2. 詳細なトラブルシューティングを行う場合や、サポートに問い合わせる際に備えて、スタックトレースや明示的なエラーメッセージを控えておきます

原因 3: 非ゼロの終了コードはシステムまたはプロセスのエラーを示す

終了コードは、プロセスがどのように終了したかを示す要約です。通常、正常に実行されたジョブは 「Exit with code 0」 で終了します。

手順

  1. process_output.log の末尾に移動します

  2. 終了コードの行を確認します

  3. 終了コードを出発点として、根本原因(例: コマンド不足、権限の問題、メモリ不足など)を調査します。

終了コードの解釈

  • 0 — 正常終了(エラーなし)。ただし、結果の検証は続けて行ってください

  • 1 — 一般的なエラーの包括的コード

  • 2 — シェル組み込みコマンドの誤用

  • 126 — 呼び出されたコマンドを実行できない

  • 127 — コマンドが見つからない

  • 128 — exit に対する無効な引数

  • 128+n — 致命的なエラーシグナル「n」

  • 130 — スクリプトが Ctrl-C によって終了した

  • 137 — 終了モード未確定(多くの場合、メモリ不足または明示的な終了)

  • 255 — 終了ステータスが範囲外


検証

  • process_output.log の末尾で終了コードを確認し、プロセスが正常に終了したかどうかを判断します

  • 終了コードに対応する警告や明示的なエラーメッセージがログ内で特定できているか確認します


まだサポートが必要な場合は、Rescale サポートに問い合わせる際は、以下の情報を提供してください:

  • ジョブ ID

  • process_output.log(または関連する抜粋)

  • 終了コードおよび確認されたエラーメッセージ

  • 期待していた結果と実際の結果の簡単な説明

こちらの回答で解決しましたか?