| | | | |

成熟度インデックスの再スケール: クラウドおよびマルチクラウド運用の信頼性を最大化するインテリジェンス

クラウド ハードウェアの成熟度は、コスト、パフォーマンス、信頼性に影響します。 Rescale Maturity Index は、コンピューティング主導のイノベーションにおける競争力を高めます。

今日、テクノロジーアナリストやベンダーは、 マルチクラウド戦略 ベンダーロックインに関する懸念を引き起こすことによって。 一般的な理由としては、コスト効率、事業継続性、運用全体の回復力などが挙げられますが、多くの企業はその最大の利点の XNUMX つである柔軟性と多くのアーキテクチャの選択を逃している可能性があります。

現代の科学研究、工学、 製品の研究開発 に依存する 高性能コンピューティング、具体的には、データと計算を集中的に使用するアプリケーションを強化する高性能の特殊なハードウェアです。 この研究開発の状況では、最新のチップ アーキテクチャに柔軟に切り替えることが、優れた製品を最初に市場に投入するための鍵となります。 復元力と継続性は確かにクラウドおよびマルチクラウド戦略の大きな利点ですが、より多くの組織がマルチアーキテクチャの柔軟性の重要な価値を認識しています。 

クラウドサービスプロバイダー (CSP) は現在、新しいコンピューティング チップ アーキテクチャを驚くべきペースで導入しています。 通常は、次のようなハードウェア ベンダーとのパートナーシップを通じて行われます。 インテル, AMD、アームと NVIDIA, CSP は四半期ごとに、新しく優れたチップ アーキテクチャを発表しています。 さらに、クラウド プロバイダーは独自のコンピューター チップの製造を開始し、さらに多くのチップの中から選択できるようになりました。 

マルチクラウドとマルチアーキテクチャの約束と課題 

最新テクノロジーを積極的かつ継続的に導入する企業にとって、アプリケーションのパフォーマンス向上とコスト削減は、大きな競争上の利点となります。 現在、すべてのクラウド プロバイダーがさまざまなアーキテクチャ オプションを提供しているため、このアプローチはマルチクラウドとシングルクラウドの両方の運用にますます関連性が高まっています。 

しかし、ほとんどの組織は、継続的なアーキテクチャの導入を効果的に行うことが複雑なため、達成するのに苦労しています。 新しいアーキテクチャのオンボーディング、テスト、展開には舞台裏で多くの手順が行われますが、主な障害は、利用可能なハードウェア オプションの多様化が進むなか、どのように選択すればよいのかわからないことです。 

ほとんどの場合、組織は ベンチマークを実施する 新しいソフトウェアのオンボード時に、最適なハードウェア構成を決定します。 ベンチマークは、その時点での少数のアーキテクチャのパフォーマンスを測定するのには価値がありますが、新しいアーキテクチャの継続的なリリースや、その規模や地域での可用性は考慮されていません。 

成熟度インテリジェンス: Rescale が顧客のクラウド投資からより多くの利益を得るのにどのように役立つか

チップの選択肢が爆発的に増える中、特定のワークロードに最適なハードウェアとソフトウェア構成を選択することがこれまで以上に重要になっています。 成熟度 (クラウド内の特定のアーキテクチャまたはハードウェア構成の信頼性とスケールの尺度) は、特に最新かつ最高のアーキテクチャを活用し、 最高のコストパフォーマンス 可能。 成熟度を考慮に入れないと、クラウド インフラストラクチャやソフトウェア ライセンスに過剰な支出が発生する可能性があります。 成熟度追跡のメリットを実感し始めている組織もあれば、どこから始めればよいか分からない組織もあります。

Rescale を使用すると、組織はハイパースケールおよび専門 CSP のネットワークから世界最大のアーキテクチャの選択肢にアクセスできるようになります。 選択肢が非常に多いため、アプリケーションのニーズに適したアーキテクチャを選択することが重要です。成熟度を徹底的に理解することで、お客様がクラウド運用からより多くの価値を引き出すことができます。 Rescale は内部的に、各アーキテクチャの運用準備状況、サービス レベル保証、各 CSP およびリージョン全体のキャパシティの複合スコアである成熟度インデックスを使用して、これらの問題を追跡します。 新しいチップが市場に登場し、古いチップが使用されなくなるにつれて、Rescale はこの指数を継続的に維持します。

成熟度がコンピューティング インテリジェンスのより広範なフレームワークにどのように適合するか

Rescale の成熟度インデックスは、クラウド プロバイダーとアーキテクチャのオプションを比較するための一貫したフレームワークを組織に提供しますが、これはより広範なインテリジェンス フレームワークの一部です。 リスケールの インテリジェント・コンピューティング・フレームワーク は、成熟度、パフォーマンス、コスト、持続可能性の XNUMX つの指数を組み合わせて構成されています。 特定の顧客の目標に応じて、このインテリジェンスを使用して意思決定を行い、目標を達成するためのポリシーを設定できます。 

インテリジェント コンピューティング フレームワークの再スケール 成熟度、パフォーマンス、コスト、持続可能性の4つの指標で構成されます

このインテリジェンス フレームワークは、Rescale で各アーキテクチャ構成がどのようにスコアリングされ、推奨されるかを管理します。 これらの構成は Rescale として知られています コアタイプ、スコアリングする前に、アプリケーションのパフォーマンスを最適化するために事前構成、ベンチマーク、調整を行います。 スコアリング後、Rescale 独自の Compute Recommendation Engine (CRE) はこのインテリジェンスを考慮して、ユーザーが新しいソフトウェアをセットアップするとき、または新しいアーキテクチャが利用可能になったときに、最適なアーキテクチャ構成を推奨します。 

ハードウェア上で適切なデータを見つけるのが非常に難しい理由

チップ メーカーが AMD の EPYC Genoa、Intel Icelake、NVIDIA H100 などの新しいアーキテクチャを発売する場合、通常は特定の地域の単一のクラウド プロバイダーから開始します。 典型的なシナリオは、クラウド プロバイダー A がプロセスの早い段階でチップ メーカーと緊密に連携し、他のクラウド プロバイダーに先駆けて新しいチップ タイプを採用したというものです。 さらに、クラウド プロバイダー A はこのサービスを米国の単一リージョンに導入し、18 か月後にヨーロッパに、XNUMX か月後に日本に拡大しました。 そのため、新しい種類のチップを使用するこのようなクラウド サービスの成熟度は、通常、地域によって異なります。 

ただし、Rescale の顧客は、Rescale プラットフォーム上のこの情報にリアルタイムでアクセスできます。 さらに、Rescale は定性的なパフォーマンス、成熟度、容量の徹底的な評価を実行します。 これにより、ユーザーはさまざまなクラウド サービス プロバイダーの製品を比較できるようになります。 Rescale は、新しいアーキテクチャが市場に投入されるとすぐに、それを理解するために多大な労力を費やします。 これは自動化され、次のインテリジェンスによって強化されます。 クラウドインフラ プラットフォーム上の使用パターン全体にわたって収集したアプリケーション要件。 

Rescale の利点: 顧客に最先端のテクノロジーをより迅速に提供できる

リスケールの HPC ハードウェア ソフトウェアの専門家は、強力な自動化と業界の経験を活用して、関連するすべてのアーキテクチャの徹底的な評価を実施します。 ほとんどの組織にとって、同じプロセスはコストがかかり、戦略的プロジェクトやイノベーションへの取り組みからリソースを転用するために数か月の初期作業 (および継続的な作業) が必要になります。 カーテンの裏側を見るために、Rescale の成熟度評価プロセスの XNUMX つの段階を次に示します。

Rescale は、インフラストラクチャ製品が広く一般に公開される前に、顧客が使用できるように新しいアーキテクチャを導入、評価、準備する作業をすでに行っています。 この取り組みには以下が含まれます。

  • どの新しいアーキテクチャが HPC に最適であるかを判断し、 AI、およびその他の研究開発アプリケーション。
  • CSP からのインフラストラクチャへの早期/プレビュー アクセスをリクエストします。
  • 内部テストとマイクロベンチマークを実行して、アーキテクチャのパフォーマンスがメーカーが宣伝する仕様を満たしていることを確認します。
  • アプリケーション固有のベンチマークとチューニングを実行し、オペレーティング システム、ソフトウェア バージョン、ソフトウェア バージョンなどのいくつかの変数を徹底的に評価します。 のMPI 可能な限り最高のパフォーマンスを保証するためのバージョン。 このステップでは、Rescale は多くの場合、CSP、ソフトウェア、ハードウェア ベンダーと直接連携します。 Rescale の顧客は、これらの新しいサービスに早期ベータ版でアクセスできる場合もあります。

内部評価が完了すると、新しいアーキテクチャがリリースされ、一般に顧客が利用できるようになります。 Rescale が成熟度を測る継続的な活動には次のようなものがあります。 

  • GA アーキテクチャが Rescale 独自のサービス レベル保証 (SLA) を確実に満たすようにします。 当社の SLA は、送信されたジョブが正常に完了することを保証します (ハードルは高い)。これには、アーキテクチャが利用可能であるだけでなく、ソフトウェア要件を満たすために安定していることが必要です。 
  • さまざまな地域で広く使用できるように、適切な規模 (容量) を確保します。 コンピューティングとより大規模なワークロードの起動に対する需要が高まる中、Rescale を使用すると、組織は数十万のコアと数百万のジョブにわたって並列コンピューティングを実行できるようになります。 

Coretype を顧客にリリースした後も、Rescale は次の方法でアーキテクチャの可用性と信頼性を監視し続けます。

  • Rescale サービス以外の問題についてグローバル クラウド インフラストラクチャ ネットワークを監視します。
  • 最適な価値を提供しない、信頼性の問題がある、またはサポートされなくなった古いアーキテクチャを段階的に廃止 (非推奨) します。 

「私たちは、お客様の特定の研究開発ワークロードに対して最高のパフォーマンスと効率を実現することに情熱を注いでいます。 私たちは常に新しいアーキテクチャを評価、テスト、調整し、お客様のために事前の基礎工事を行っています。 当社の社内 HPC 専門知識と Rescale プラットフォームの自動化およびインテリジェンスを組み合わせることで、お客様は最大限の価値を確実に得ることができます。 HPC 投資によるに設立された地域オフィスに加えて、さらにローカルカスタマーサポートを提供できるようになります。」

– Rescale、HPC エンジニアリング マネージャー、Radhika Gundavelli 氏

Rescale Maturity Index によってもたらされる顧客の成果

コンピューティングの状況がいかにダイナミックであるかを説明するために、Rescale の成熟度インデックスが、お客様が R&D の取り組みをサポートする HPC インフラストラクチャについて最善の決定を下すのにどのように役立ったかをいくつかの例で示します。

  • A ライフサイエンス ゲノミクス分析と診断を行う研究所が世界的に展開している顧客は、コストを非常に意識しつつ、結果を迅速に得ることに重点を置く必要がありました。 Rescale は、カスタム アプリケーションのニーズに基づいて、新しいアプリケーションを特定することができました。 アームアーキテクチャ これにより、信頼性とコストパフォーマンスが向上し、コストを低く抑えながら信頼性を高く保つことができます。 
  • An 航空宇宙 メーカーは動作させるためにより多くの電力を必要としていました 計算流体力学 (CFD) 分析。 Rescale の評価に基づいて、同社は複数のクラウドにわたって大規模に AMD EPYC Milan プロセッサに移行しました。これにより、信頼性の向上、コストの削減 (約 20% の節約)、およびパフォーマンスの向上が実現しました。 これらの新しいアーキテクチャのスケーリングと並列効率により、メーカーは各 CFD ジョブを 1000 以上のコアで実行できるようになり、新しい設計の開発とテストの能力が大幅に向上します。 Rescale のインテリジェントな自動化により、需要の高い Milan プロセッサが利用できない場合でも、お客様は AMD EPYC Rome プロセッサにシームレスに切り替えることができます。 (Rescale のお客様は、コアタイプ セット機能を使用してこの機能を有効にすることができます)。
  • ある自動車メーカーは、 GPU CPU 数値流体力学 (CFD) ソルバーを実行します。 GPU アクセラレーションは、多くの従来のコンピュータ支援エンジニアリング (CAE) ソフトウェアを最大 10 倍高速化する可能性があります。 この顧客にとって、スイッチによりコスト パフォーマンスが約 30% 向上し、研究開発サイクルが大幅に短縮されました。 GPU に対する世界的な需要が非常に高く、組織の厳しい地理的コンプライアンス要件にも関わらず、Rescale はニーズを満たすクラウド サービス プロバイダーとチップ アーキテクチャを見つけることができました。

さて、次は何を達成しますか?

ここまで読んだ方は、おそらくハードウェアのパフォーマンスに対する私たちの情熱、そしてさらに重要なことに、それが業界のイノベーションにとって何を意味するのかについても共感していただけるでしょう。

チップのパフォーマンスと成熟度に関する情報はすべて新しいもの、または複雑なものかもしれませんが、このメッセージはあなたに向けたものです。私たちは、クラウドによってイノベーションがよりシンプルかつ迅速になるべきだと信じています。そのため、私たちはあなたのためにハイ パフォーマンス コンピューティングの重要な側面を自動化しています。ハードウェアインフラストラクチャの成熟度評価。 スプレッドシートを開始して何人かのビジネス アナリストの助けを求める必要はありません。私たちがサポートします。

新しい最先端のアーキテクチャの代替案に興味がある場合、またはクラウドの料金を節約したい場合は、喜んでいくつかの推奨事項をご提案します。 当社の HPC 専門家にお問い合わせください。 お客様のコンピューティングの目標についてお聞きし、私たちがどのように支援できるかについて話し合うことを楽しみにしています。

著者

  • ギャレット・ヴァンリー

    Garrett VanLee は、Rescale の製品マーケティングを率いており、業界全体のイノベーションの最先端で顧客と緊密に連携しています。彼は、顧客の成功事例、研究の成果、Rescale のエンジニア、科学者、IT 専門家が他の組織を支援するためのベスト プラクティスを共有することを楽しんでいます。ギャレットは現在、スーパーコンピューティングの収束に焦点を当てています。 (HPC), AIシミュレーション モデルと、これらのトレンドが科学と産業における発見をどのように推進しているかについて説明します。

類似の投稿