ニッケルと鉄: Rescale のプラットフォームでの CONVERGE™ ジョブにはどちらが適していますか?
Convergent Science の CONVERGE™ は、エンジン設計およびシミュレーションの分野で最も人気のある数値流体設計 (CFD) シミュレーション プログラムの XNUMX つです。 その並列処理機能は MPI を活用し、マルチコアおよびメニー コア環境でのジョブの実行速度を効果的に向上させます。 利用可能なすべてのコア タイプを使用して、Rescale のクラウド シミュレーション プラットフォームで CONVERGE™ ジョブをオンデマンドで実行できます。 このブログ投稿では、ニッケルと鉄の両方の HPC コア タイプのパフォーマンスとコストを比較します。 これが、Rescale で独自の CONVERGE™ シミュレーションを実行するための中心となる選択ガイドとして機能することを願っています。
テスト環境
ニッケル (HPC+) | 鉄 (HPC InfiniBand) | |
申し込み | Linux 用 CONVERGE™ 2.2 | Windows 用 CONVERGE™ 2.2 |
MPI フレーバー | Linux用のhp-mpi | マイクロソフト MPI 4.2 |
コアタイプ | ニッケル | 鉄 |
計算 | 6.75 CU | 6.75 CU |
メモリ (GB/コア) | 3.8 GB | 3.8 GB |
ストレージ (GB/コア) | 32 GB | 32 GB |
ネットワーク | 10 Gb / s | RDMA インフィニバンド (40 Gb/秒) |
価格 | $0.15 (/コア/時間) | $0.30 (/コア/時間) |
表の最初の 10 行は選択したソフトウェア環境を示し、残りの行はハードウェア仕様を示します。 ハードウェア仕様のほとんどはニッケルと鉄で似ていますが、注目すべき違いの 40 つはネットワークです。 Nickel の帯域幅は 50Gb/s のみですが、Iron core タイプの帯域幅は XNUMXGb/s で、これは複数のノードにまたがって実行されるジョブにとって大きな利点であり、これが XNUMX つのコア タイプ間の価格差 XNUMX% の主な理由であると考えられます。 。
ベンチマークジョブ
私たちが選択したベンチマーク ジョブは、Convergent Science によって提供されています。 これはサッカー場での曲がるシュートの現象をモデル化しており、空中でボールを「曲げる」には何が必要かを示すことを目的としています (詳細な説明)。 このシミュレーションでは、0.1 秒のタイム ステップを使用して、サッカー ボールの動きの 0.001 秒をモデル化します。 モデルは最初は 81,576 個のノードで構成されます。
小規模クラスターのパフォーマンスとコストの比較
最初のラウンドでは、両方のコア タイプについて、それぞれ 16、32、および 64 コアでクラスターのパフォーマンスをテストしました。 結果を以下の表に示します。
16コア | 32コア | 64コア | ||
ニッケル (HPC+) | 時間 | 2611.39 | 2086.38 | 1857.28 |
料金($/時間) | 2.40 | 4.80 | 9.60 | |
鉄 (HPC InfiniBand) | 時間 | 3671.327635 | 2709.023048 | 2020.854733 |
料金($/時間) | 4.80 | 9.60 | 19.20 |
表から、最大 64 コアの Nickel クラスターは Iron よりも優れたパフォーマンスを持ち、安価であることがわかります。 したがって、小さなクラスターで小さなジョブを実行する必要がある場合は、おそらく Nickel の方が良い選択です。
中規模クラスターのパフォーマンスとコストの比較
128 番目のラウンドでは、両方のコア タイプの 256 コア クラスターと XNUMX コア クラスターで中規模クラスターのパフォーマンスをテストしました。 そして、その結果を以下の表に示します。
128コア | 256コア | ||
ニッケル (HPC+) | 時間 | 2973.34 | / |
料金($/時間) | 19.20 | 38.40 | |
鉄 (HPC InfiniBand) | 時間 | 1434.00 | 1277.43 |
料金($/時間) | 38.40 | 76.80 |
コア数が 128 に達すると、ニッケル クラスターの実行時間が大幅に増加したことがわかります。256 コア クラスターの場合は、128 コアの場合よりも時間がかかることが判明したため、ジョブを終了しました。 これは、通信のオーバーヘッドと相互接続の遅さの両方が原因で発生します。 一方、Iron クラスターのパフォーマンスは、関連するコアの数に応じて着実に向上します。 そのため、128 コアを超えるコアで実行すると、Iron は Nickel クラスターよりも優れたパフォーマンスを発揮します。
要約
上のグラフから、64 コア未満のクラスターの場合、CONVERGE™ ジョブでは Nickel の方が高速であるのに対し、128 コアを超える中規模のクラスターの場合は、Iron の方が良い選択肢であることがわかります。 さらに重要なのは、ジョブをより速く実行すると、オンデマンド ライセンスのコストをさらに節約できる可能性があることです。