エンジニアリングを加速する 5 つの勝利戦略: クラウド HPC はインテリジェントです (パート 4/5)
- 編集者メモ: この投稿は、6 部構成のブログ シリーズの紹介です。 レポート全文を読む ここから.
4. XNUMX つの勝利戦略: 静的からインテリジェントへ
従来の HPC は静的です
HPC に対する従来の密接に結合されたアプローチを考慮すると、パフォーマンスと分析インテリジェンスは重要ではありませんでした。 構成は、一度安定して調整されると、頻繁には変更されませんでした。変更する理由もありませんでした。また、ソフトウェア/ハードウェアのパフォーマンス分析に投資する理由もほとんどありませんでした。 このアプローチを維持すると、当然、クラウドのような動的な環境では課題が生じます。 クラウドでは、新しいハードウェア オプションが頻繁に追加され、それぞれがアプリケーションのパフォーマンスに潜在的な利益 (または損失) をもたらします。 HPC 管理者は、インテリジェンスの恩恵なしにこの世界をナビゲートするための範囲を合理的に提供することはできません。
クラウド向けに構築された HPC はインテリジェントです
HPC に対するクラウド向けに構築されたアプローチは、クラウド環境を最大限に活用するにはインテリジェンスが必要であることを認識することから始まります。 新しいオプションが頻繁に追加され、変更が発生する可能性がある環境では、HPC 環境のパフォーマンス、コスト、その他の側面に関するインテリジェンスを得ることが、ビジネス成果を達成し、リスクを管理するための鍵となります。 インテリジェンスには次のような例が含まれます。
- ソフトウェアとハードウェアのパフォーマンス インテリジェンス – アーキテクチャの違いは、ソフトウェア ライセンスやインフラストラクチャのコスト、解決までの時間など、ワークロードのフルスタック コストにどのような影響を与えますか?
- 価格設定、予算編成、計画に関するインテリジェンス – プロジェクトは時間と予算どおりに実行されていますか? HPC 使用の予測される増加は、予算と予想される HW パフォーマンスの向上と一致していますか?
- ユーザーとシミュレーションのワークフロー インテリジェンス – ユーザーは適切なソフトウェア バージョンとデータを使用してワークロードを適切に実行していますか? 適切なテンプレートと計算パイプラインを使用していますか?
- セキュリティとコンプライアンスのインテリジェンス – 世界中のユーザーはどこからログインしていますか? HPC 環境に対してどのようなデータをダウンロードおよびアップロードしているのでしょうか? パスワードとタイムアウトのポリシーは有効ですか?

HPC 組織によるサポートが必要なユーザーとソフトウェア/ハードウェア アーキテクチャが増えるにつれ、クラウドベースの HPC の価値を引き出すにはインテリジェンスが重要になります。 また、このインテリジェンスを自動化エンジンと組み合わせて、より適切な技術的、ビジネス的、運用上の選択を行えるようにする必要があります。そうしないとエンジニアリング組織や IT 組織が管理できなくなる可能性があります。

Rescale のアプローチは、IT/HPC がクラウドを最大限に活用できるようにするインテリジェントなコントロール プレーンを提供することです。
- 財務管理 – 予算の監視、アラート、執行を可能にし、ビジネス リーダーが HPC ジョブの価値と影響を把握できるようにします。
- セキュリティとアクセス制御 - コンプライアンスとセキュリティの要件を満たすために、ユーザー、アクセス、ソフトウェア バージョン、ワークフローを詳細に制御します。
- マルチチーム制御 – 安全な共有ワークスペースを実現し、企業内および企業間のエンジニアリング コラボレーションを向上させます。
- ソフトウェアおよびソフトウェア ライセンスの管理 – IT チームがアプリケーション ポートフォリオを管理して、プロジェクトが適切なライセンスを適切なタイミングで効率的に使用できるようにします。
- インフラストラクチャ アーキテクチャの制御 – パフォーマンス インテリジェンスに基づいて、コスト/パフォーマンスまたはシミュレーション スループットを最大化するためにどのチームがどのアーキテクチャを使用できるかについてのエンタープライズ ポリシーを定義します。
AWS アーキテクチャが競争力のあるコアあたりのパフォーマンスと価値を提供し、大容量を実現するサンプル ワークロード

Azure アーキテクチャがコアあたり最高の価値とパフォーマンスを提供するサンプル ワークロード
