ジョブ実行状態のモニタリング

ステータスタブでジョブの進捗をモニターし、クラスターに関する情報をリアルタイムで取得することができます。

status-gantt-chart.png

アイコンをクリックして、ステータスタブにアクセスしてください(赤色でハイライトされています)。

ジョブのステータス

ジョブが実行されると、Queued、Validating Input、Starting Cluster、Running Job、Stopping Clusterの5つのステージを経てジョブが正常に完了します。これらのジョブのステータスにおいてエラーが発生していた場合、緑色のチェックマークアイコンの代わりに赤色の「X」が表示されます。エラーが発生した場合はサポートまでご連絡ください。

ジョブのログ

ジョブのログには詳細な情報が記載されています。典型的なログ出力の例を以下に示します。

basic-job-logs.png

DOEなど複数回の実行を伴うジョブの場合、各々のジョブ実行がいつ開始するかがわかります。

doe-job-logs.png

クラスターのステータス

cluster-status.png

クラスターステータスのセクションには、ジョブが実行されているクラスターの最新情報が表示されます。ジョブが正しく実行されない場合や、特に時間がかかっている場合など、潜在的な問題を診断するために役立つモニタリング情報が含まれます。例えば、Avg Free Memory が著しく低かった場合、クラスターのメモリー容量がシミュレーションの実行要件を満たさなかった可能性があります。複数のノードでジョブを実行している場合、各ノードのステータスが別々の行に表示されます。

ライブテーリング

live-tailing-run.png

ライブテーリング では、シミュレーションの進捗をリアルタイムでモニターし、ソルバーによる実行時のファイル更新を追随することで、ソリューションが適切に発展しているかを確認することができます。

Active Runs テーブルの下にあるリストからケースを1つ選択し、そのケースに関連するファイルをクリックすると、選択したファイルの最新の行が表示されます。表示されるRuns のリストはシミュレーションの開始と終了に合わせて変わりますが、表示されるファイルのリストは、リフレッシュボタンを使って手動で更新し、最新のファイルの内容にアクセスする必要があります。ライブテール機能は、800kB以下のファイルに限って使用することができます。

ジョブ実行中のファイルのダウンロード

実行時にライブテーリングウィンドウにマウスカーソルを置くと、ウィンドウの右上にいくつかのオプションが表示されます。左の Download ボタンで、クリックしたときのファイルをダウンロードすることができます。ジョブの実行中にその Run に含まれる全てのファイルをダウンロードしたい場合は、スナップショットの手順に従ってください。その他のボタンで、ファイルの内容を更新したり、ウィンドウを全画面表示したり、表示する行数を変更したりすることができます。

live-tailing-settings.png

個別のジョブ実行またはジョブ全体の停止

進行中の各々のジョブ実行を停止する場合は、Active Runs のテーブルの Runs の列内の実行番号の横の X をクリックしてください。

stop-individual-run.png

この方法で各々のジョブを停止すると、以下のようなダイアログウィンドウが表示されます。Stop を選択した場合、このジョブ実行のファイルは Stop ボタンをクリックしたときの状態でストレージにアップロードされます。 これにより、後のジョブでの入力ファイルとして使用することができます。

stop-run-popup.png

Stop を選択したジョブ実行がすでにワークフローを完了している場合、以下のようなダイアログが表示されることがあります。この場合、このダイアログで Stop をクリックすると安全です。このジョブ実行で使用したファイルがアップロードされます。

already-stopped-popup.png

各々のジョブ実行ではなく、ジョブ全体を停止させたい場合は、以下ような方法で Stop ボタンを使うことができます。完了もしくは部分的に完了したジョブのファイルがストレージにアップロードされます。まだ開始していないジョブは起動されません。

stop-job-button.png

この Stop ボタンでジョブ全体を終了させると、以下のようなダイアログが表示されます。

stop-job-popup.png

このようにジョブを中断してクラスターをシャットダウンすると、ジョブステータスの出力ログに User requested… と記録されます。

stopping-job-status.png