| | |

AI の力を活用してクラウドでのエンジニアリング シミュレーションを最適化

複雑な HPC シミュレーションを最適化するために、コンピューティング リソースの最適な組み合わせをどのように選択しますか?

AI による推奨事項が今後の方向性を示しています。

ハイ パフォーマンス コンピューティング (HPC) を利用した複雑なシミュレーションは、ハードウェアとソフトウェアのオプションの増加により、実行するだけでもさらに複雑になっています。 私たちの多くにとって、クラウド サービスはインフラストラクチャ スタックを簡素化できますが、可能なオプションが膨大にあるため、価格とパフォーマンスの最適な組み合わせを見つけるのが恐ろしく複雑になります。 

昔は生活は単純でした。 オンプレミス HPC には比較的選択肢が限られていました。 コア、I/O帯域幅、メモリ、ストレージはすべて固定されていました。

私のバックグラウンドを踏まえて 自動車CFD、モータースポーツ エンジニアリングの分野では、私はオンプレミス HPC を車をレンタルするのではなく所有するのと同じように考える傾向があります。 買える範囲で最高の車を購入してからわずか数週間後に、誰かがより優れた、より速く、より機能を満載したモデルを発売します。 オンプレミスの HPC も同様です。プロセッサーやメモリなどを選択して、余裕のある最大容量のスタックを作成すると、翌日には新しいチップセットが市場に投入されます。

これに対抗するものとして、クラウドの HPC は継続的な改善を活用します。 XNUMX ~ XNUMX 年ごとに更新されるオンプレミス ソリューションとは異なり、クラウド プロバイダーはすべて、市場の最新チップセットを使用して最新かつ最高の機能を提供するために競い合います。 モータースポーツの話に戻ります。クラウドで HPC を実行することは、常に調整されアップグレードされる車を運転するようなものです。 新しいパワーユニット? もちろん! 燃料流量の向上? もちろん!

しかし、この混乱の世界では、シミュレーション ワークロードを最適化するための最適なソリューションをどのように選択すればよいでしょうか? 標準的なワークフローを実行して良好な結果が得られるかもしれませんが、ランタイムを短縮する可能性がある発売されたばかりの新しいチップセットをご存知ですか? の挑戦 ワークフローの最適化 これは現在、HPC カンファレンスで最も注目されているトピックの XNUMX つですが、それには十分な理由があります。

AI を使用して HPC シミュレーションを最適化する

ここで AI が介入します。シミュレーションを実行すると、ジョブの実行方法 (コア使用率、メモリ消費量、I/O パフォーマンスなど) に関する大量のメタデータが生成され、数千のシミュレーションからのデータは、最適なリソース プールを提供します。 AIエンジニアリング モデル。 過去 10 年間にクラウド上で HPC シミュレーションを実行してきた結果をもとに、AI は提案されたワークフローに対してインテリジェントな推奨と最適化を行うことができます。

さらに、高度に専門化された新しいチップセットが複数市場に投入されるようになったため、最新のオプションを監視することはほぼ不可能になりました。 クラウド プロバイダーがこれらのサービスを自社のサービスに追加すると、AI は主張されている機能を調べて、潜在的な新しいオプションを提案できます。

その結果、私のようなエンジニアは、チップセット、GPU、アクセラレータ カードのリリースに追いつく必要がなくなります。 AI は、実行中のジョブに適した新しいコア タイプを推奨します。 たとえば、AI は、特定のワークロードとソフトウェアの組み合わせが、特定のコア タイプでより高速な結果を生み出す傾向があることを提案し、その提案に魅力を感じた場合は、それに従うことを選択できます。

さて、モータースポーツのシミュレーションでは、時間が重要な要素となります。レースはあと XNUMX 日待つことはできないため、重要な問題は常にどれだけ早く結果を出せるかということです。 シミュレーションが遅いと、非常に望ましくない遅延が発生する可能性があります。これは、提案された変更が実際の車両に到達するまでに完了しなければならない製造ステップが非常に多いためです。 以前は、多くの場合、データ ポイントの数を犠牲にしてシミュレーションを高速化することが解決策でしたが、その結果、設計上の決定に悪影響を及ぼす可能性がありました。

AI 最適化支援により、シミュレーションはより多くのデータ ポイントを実行したり、より速く実行したり、多くの場合その両方が可能になります。 ジョブをより迅速に実行できる場合は、その時間をより多くのジョブの実行に使用します。 コンピューティングとソフトウェアの合計費用はほぼ同じになると思われますが、最適化を強化することでスループットを向上させることができました。

Rescale を使用して任意の HPC ワークロードの実行を自動化する

開示警告: 私がソリューション アーキテクトとして働いている Rescale では、次のようなクラウドベースのプラットフォームを構築しました。 AI であらゆる HPC ワークロードの実行を自動化 可能な限り最良のハードウェアとソフトウェアの構成を採用します。 Rescale は、複数のクラウド ベンダーにわたるジョブ オーケストレーションとリソース管理を自動化し、IT および HPC 管理者がビジネス目標 (時間やコストの削減など) に基づいて数回のクリックで最適なワークロード構成を確認して選択できるようにします。 Rescale は、各プロバイダーが提供するサービスの複雑さを学習するのではなく、膨大な数のテクノロジーに対して AI を活用した推奨事項を提供し、エンジニアや科学者がジョブのセットアップ、ベンチマーク、トラブルシューティングではなく、日常の仕事に集中できるようにします。

市場が多様化し専門化するにつれて、最適な構成を選択するという作業は、ますます困難になっていきます。 たとえば、この記事の執筆時点では、超高スループットを約束する新しい GPU と CPU を組み合わせたチップセットがありますが、現時点ではソフトウェア ベンチマーク データは比較的少ないです。 すべてのクラウド プロバイダーはこれらの新しいテクノロジーを導入し、ミックスに追加する新しいスイート スポットを作成します。 

これらの構成のスイート スポットを検出して推奨する AI の利点に加え、Rescale のインテリジェンスにより、グローバルなクラウド リソース管理が可能になり、ユーザーがジョブの起動時間を短縮できるようにジョブの負荷を自動的に分散し、ジョブの失敗を最小限に抑え、選択したクラウドの場所にワークロードを振り向けることができます。プロバイダーは、ビジネス継続のために利用可能な最大のキャパシティを持っています。 

これに基づいて、単にワークロードをクラウドに移動するだけでは十分ではないことがわかります。 AI を活用した最適化機能は、特にエンジニアがますます複雑なシミュレーションを作成する場合に、クラウドを最大限に活用するために必要な要素となります。

Rescale の AI 最適化が適用される様子に興味がある場合は、 ワークロードを減らすことができます デモについてはこちらのチームにお問い合わせください.

類似の投稿