一般的なFAQ

最大XNUMXWの出力を提供する Command  string には、選択したソフトウェアを実行するために必要なコマンドまたはコマンドのセットを指定できます。 指定するコマンドには、次のようにアップロードしたスクリプトが含まれる場合があります。 入力ファイル 仕事で。 複数のコマンドはセミコロンで区切る必要があります。 あなたの 文字列またはスクリプトは、選択したソフトウェアを複数回呼び出す可能性があります。 スクリプトを使用すると、より複雑なワークフローを指定できます。 Command 

この 基本的なジョブの例  コマンドラインでスクリプトを使用した簡単な例を示します。 これ STAR-CCM+の例  その ソフトウェア starccm+ 直接。 これ LS-DYNAの例 リスケールを使用する ls-dyna ラッパー スクリプトを使用して、LS-DYNA を起動するコマンド ラインを簡素化します。

A コマンドテンプレート の形成に役立つ提案が含まれています 文字列を入力し、選択したソフトウェアを実行します。 テンプレートは以下を呼び出すために使用できます。

  • 最大XNUMXWの出力を提供する スタンダード またはアプリケーションのシリアルバージョン
  • 最大XNUMXWの出力を提供する SMP  command
  • 最大XNUMXWの出力を提供する のMPI  command

ハイブリッド並列化をサポートするコードは、MPI の設定を使用できます。 コマンドテンプレート..

最大XNUMXWの出力を提供する コマンドテンプレート. それ自体は次のいずれかで構成されます。

a) 選択したソフトウェアを実行するために使用される標準コマンドの XNUMX つ。 通常、使用するスレッドまたはプロセスの数を指定するコマンド ライン オプションも含まれます。 Comsol Multiphysics テンプレートは一例です。

comsol -clustersimple -f $HOME/machinefile バッチ -inputfile

b) A wrapper script 指示。 ラッパー スクリプトは、選択したハードウェアを効率的に使用できるように、選択したソフトウェアを実行するタスクを簡素化するために Rescale によって提供されます。 ラッパー スクリプト テンプレートの例は LS-DYNA です。

ls-dyna-n -s -私-p -a

私たちは、使用 <> 通常、ジョブを送信する前に実際の値に置き換えることが期待されるフィールドを示す表記法。 コマンド実行時のエラーを避けるために、値を入力したら必ず括弧を削除してください。

必ずしもすべてのフィールドを使用する必要はありません。 状況に無関係な場合は削除できます。 のために Amazon 仮想マシン その他 、コードはハイブリッド モードをサポートしている可能性がありますが、MPI を単独で使用する予定の場合は、値を省略できます。

Rescale では、ソフトウェア パッケージの標準コマンド ラインが特に複雑な場合、 ラッパースクリプト より簡単に正しい実行可能ファイルにアクセスできるようになります。 この一例は LS-DYNA です。LS-DYNA では、呼び出す必要がある実行可能ファイルの名前は、ソフトウェアのバージョン、単精度か倍精度のどちらを使用するか、SMP、ハイブリッド、MPP 並列化のいずれを使用するかによって異なります。 通常、各ラッパー スクリプトには、必要な実行可能ファイルを正確に呼び出し、選択したハードウェアを利用できるようにするための、いくつかの単純なコマンド ライン オプションがあります。

ラッパー スクリプトの使用は完全にオプションです。 さらに、ローカル実行から同じ実行可能コマンドを使用しても、Rescale で機能します。 必要に応じて、にログインできます。 コンピューティング クラスターは、緩やかまたは緊密な一連のコンピューティング クラスターで構成されます。 その他 次の手順に従って、ラッパー スクリプトのコンテンツを表示します。 次の手順に従って、ラッパー スクリプトのコンテンツを表示します。 クラスターへの接続。 ソフトウェアのラッパー スクリプト ソースを表示するには、 which コマンドを使用してラッパー スクリプトを見つけます。 cat ラッパー スクリプト ファイルの内容を連結するコマンド。 which コマンドを使用してラッパー スクリプトを見つけます。 cat ラッパー スクリプト ファイルの内容を連結するコマンド。

 ソフトウェアの設定 これらは各ジョブの中で提示されます ページ。 ザ· コマンドテンプレート. で使用できる基本的なオプションを示します。 スタンダードSMP > のMPI 該当する場合はモード。

はい、できます。 ほとんどの場合、必要な実行可能ファイルはすでに $PATH コマンドラインまたはスクリプトを実行するときの環境変数。 必要に応じて、クラスターにログインして、そのソフトウェアで指定されていない実行可能ファイルを見つけることができます。 コマンドテンプレート.の指示に従ってください。 クラスターへの接続または直接お問い合わせください .

実行時には、最も一般的な形式のホスト ファイルとマシン ファイルは次の場所にあります。 $HOME あなたのフォルダー ワークスペースを使用すると、リスケールの顧客は専用のチームを作成できます... その他 。 コマンド ラインで入力データとしてホスト ファイルが必要な場合は、ホスト ファイルを名前で指定できます。 $HOME 接頭語。 例えば:

--hostfile $HOME/machinefile.openmpi

選択したソフトウェアの「**コマンド テンプレート」は通常、必要なホストファイルを正確に参照します。 内容を列挙すると  $HOME 次のホスト ファイルが見つかります。

hosts、mpd.hosts、machinefile、machinefile.gpu、machinefile.openmpi、hosts、rhosts、mpd.hosts.string、PCF.xml`

一部のソフトウェアでは、ホスト情報に特別なファイルまたは形式が必要です。 Rescale は、可能な限り、そのようなソフトウェアに必要な環境変数や特定のファイルを作成します。 たとえば、Abaqus を実行すると、Rescale はホスト情報を正しい形式でファイルに配置します。  abaqus_v6.env あなたのためのファイル。 ANSYS を実行すると、 $MACHINES 環境変数には、必要な形式のホスト情報が含まれます。

場合によっては、ソフトウェアでは、ホスト (または他の) ファイルへのフル パスを入力ファイルの XNUMX つに入れる必要があります。 Rescale では、パスが何になるかは事前にわかりませんが、それを表す環境変数にアクセスできます。 の シップフローの例 を使用する方法を示します  sed 文字列を置換するコマンド

Parallel( nprocesses=2, nthreads=1, hostfile="$HOME/machinefile.openmpi" )

ファイル内  hamb_def その代替品とともに

Parallel( nprocesses=2, nthreads=1, hostfile="/enc/uprod_mtmHV/machinefile.openmpi" )

実行時。

いいえ。 GPU 何百ものコアがあります。 GPU を備えたクラスターの価格は、クラスター上の関連する CPU コアの数と、 GPUコアの数。 GPU を備えた Rescale クラスターは、複数の CPU (通常は XNUMX 個) とノードごとに XNUMX つ以上の GPU (別名 CUDA 対応デバイス) を備えたコンピューティング ノードで構成されます。 Kepler の場合はノードごとに XNUMX つの GPU があり、Tesla (MXNUMX) の場合は XNUMX つの GPU があります。   GPUコアの数。 GPU を備えた Rescale クラスターは、複数の CPU (通常は 8 個) とノードごとに 2050 つ以上の GPU (別名 CUDA 対応デバイス) を備えたコンピューティング ノードで構成されます。 Kepler の場合はノードごとに XNUMX つの GPU があり、Tesla (MXNUMX) の場合は XNUMX つの GPU があります。

LOGICAL_CPU_COUNT=$(lscpu -p | egrep -v '^#' | wc -l)
PHYSICAL_CPU_COUNT=$(lscpu -p | egrep -v '^#' | sort -u -t, -k 2,4 | wc -l)

Linuxコマンド  lscpu Rescale コンピューティング ノードで利用できます。 このコマンドは、CPU、スレッド、コア、ソケット、NUMA ノードの数、CPU キャッシュ、CPU ファミリ、CPU キャッシュに関する情報などの CPU アーキテクチャ情報を収集します。 bogoMIPS、バイトオーダーとステッピングから sysfs > /proc/cpuinfo人間が読める形式で印刷します。 オンライン CPU とオフライン CPU の両方をサポートします。 また、さまざまなキャッシュがさまざまな CPU によってどのように共有されるかなど、解析可能な形式で出力することもでき、これを他のプログラムに供給できます。

たとえば、リスケール  ハードウェアの設定 以下は、Rescale Luna を備えたコンピューティング ノードの場合です。 さまざまな HPC 向けに事前構成され最適化されたアーキテクチャ... その他 . .

図 1: ハードウェア設定

このハードウェアの選択では、 lscpu (他の情報とともに) 報告します:

図 2: ハードウェア情報

これは、XNUMX つの物理コアと XNUMX つの論理コアに相当します。 コードに利点がある場合は、XNUMX つのスレッドで実行することを選択できます。