| | | | | |

クラウド内の HPC 上のスクリプトが反転されました

クラウド: ビジネス継続性から競争力へ

世界中のITプロフェッショナルが追求しているのは、 クラウドファーストの取り組み、職場における前例のない変化とクラウドテクノロジーの進歩によって加速しています。 移行の緊急性がさらに高まっているため、ビジネス側の関係者は、新しいユースケースに対応するための容量と最新テクノロジーの需要を徐々に高めています。 雇用の増加に伴い (コンピュータワールド) と雇用 (フォーブス)が 2021 年に活況を取り戻していることから、多くの業界がエキサイティングなマイルストーンや積極的なリリース ロードマップを宣伝していることは驚くべきことではありません。 陸路や空路での旅行で起こっているディープテクノロジーのイノベーションから、そのイノベーションを推進する計算能力に至るまで、科学と産業の研究開発における刺激的なブームが見られます。
多くの組織が仕事とコラボレーションの未来を再定義する中、クラウド対応のチームとツールはますますビジネス継続性の生命線となっています。 製品のイノベーションを推進するためにハイ パフォーマンス コンピューティング (HPC) に依存している IT チームと研究開発チームは、今後 73 年間で HPC ワークロードの 5% がクラウドに移行すると考えていると述べています。
これまで、コスト、セキュリティ、特殊なユースケースに関する懸念により、一部の組織ではクラウドへの飛躍が妨げられたり、孤立したワークロードやバースト コンピューティング ニーズへの展開が制限されたりしていました。 しかし、このクラウドの受け入れは多くの予想よりも早く到来しました。2020 年には HPC クラウド セグメントで 78.8% という「極めて高い成長」が見られ、予想を大幅に上回りました (インターセクト360).
この需要の高まりに応えようと、AMD EPYC™ プロセッサーを搭載した Rescale on Azure のような最先端のクラウド HPC 製品は、これらの以前の懸念点を差別化点に変えるためにシナリオを反転させています。 

クラウド HPC に関する一般的な誤解に挑戦する

「クラウド HPC では、私の特殊なユースケースを処理できません。」 

クラウド HPC は、XNUMX 年近く前に初期の採用者がクラウドで実行されるバッチ ワークロードの実験を開始して以来、大きな進歩を遂げてきました。 現在、クラウドは現代の企業をほぼ変革しましたが、一部の特定のワークロードは依然としてオンプレミスに残っています。 科学および工学の研究開発の分野では、大規模なデータ処理と特殊なシミュレーション方法を実行する能力が重要な差別化要因となっています。 そのため、競争力を維持するために、多くの大手組織は、ユースケースに特化した特殊なスーパーコンピューターを構築しました。
クラウド コンピューティングが最初に導入されたとき、エンジニアも IT 専門家も同様に、自動車や飛行機の効率を高めるコンピューティング専用に構築された自社のデータ センターとクラウドが競合することになるとは想像できませんでした。 クラウド サービス プロバイダーがエンタープライズ リソース プランニング (ERP) アプリケーションが求める汎用スケールの提供を競う中、好奇心旺盛な HPC エンジニアはクラウドで基本的なバッチ ワークロードをテストする際につまずいていました。 数値流体力学や、航空宇宙や自動車のユースケースで使用されるその他の一般的なワークロードなど、マルチノード HPC クラスターを必要とするジョブを実行する際に問題が発生しました。
クラウド展開かオンプレミス展開かに関係なく、特定のユースケースに合わせてクラスターを起動するには、ワークロード要件、ハードウェアの種類、ソフトウェアのライセンスとインストールに関する知識、コマンド ラインとメッセージ パッシング インターフェイスの理解が必要です。 さらに、クラウドは大量のハードウェア、ストレージ、セキュリティ、ネットワーク アーキテクチャを提供しており、訓練されていない人にとっては、クラウドに最適で安全なリソースを展開するのは圧倒的で困難な場合があります。 さらに、初期のクラウド インフラストラクチャは、計算化学、気象予測、地震シミュレーションなどの多くのワークロードの高いクロック速度、コア数、相互接続、およびメモリ要件に対応する機能を備えていませんでした。
現在、主要なクラウド プロバイダーは、さまざまな HPC ワークロードの需要に合わせて構築されたあらゆる種類のハードウェアを提供しています。 半導体およびエレクトロニクスの設計会社は、設計検証のさまざまな段階に対応するために、さまざまなコンピューティング タイプを維持していることがよくあります。 同様に、ライフ サイエンス組織は、クラウドの柔軟性と GPU および CPU リソースの拡張と切り替えの選択肢を利用して、分子動力学や結晶化などのシミュレーションを使用して創薬を実施します。
私たちは現在、HPC がユニークなユースケース全体で可能であるだけでなく、実際に新しいユースケースを可能にするクラウドの成熟段階にいます。 新しい発見とイノベーションは、必要なリソースを正確に起動して即座に移行できるクラウドネイティブのスタートアップから生まれています。 新しいハードウェアのリリース率が急激に増加し、組織は新しいハードウェアを好む傾向にあります (クラウド HPC レポートのビッグ コンピューティング状態)、業界のあらゆる分野の HPC 実践者が、機械学習、ジェネレーティブ デザイン、デジタル ツインなどの急成長するユースケースを求めてクラウドに群がることが予想されます。

「クラウド HPC は経済的ではありません。」

約30年にわたり、 Top500 リストでは主要なスーパーコンピューターを追跡しており、2021 年にはクラウド ネイティブ スーパーコンピューターが登場します。 初めてリストに載った システムの上位 10% にランクインします。 この極めて重要なマイルストーンは、クラウドのパフォーマンスが大リーグに向けて準備ができていることを示しています。 しかし、コストはどうでしょうか?
クラウド コンピューティングのコストは、「無制限のコンピューティング」という主張を聞くたびに尻込みする多くの IT リーダーにとって争点となっています。 HPC アプリケーションはリソースを必要とします。 ビジネス面では、処理されるデータが増えるほどモデルの精度が高まり、(おそらく) 最終製品の品質も向上します。 企業は常に、ビジネス ユーザーの要求と割り当てられた研究開発資金のバランスをとることに取り組んできました。 HPC インフラストラクチャの意思決定を担当する多くの HPC/IT 管理者は、コア時間あたりのコストに基づいて、オンプレミスがクラウドよりも優れたパフォーマンスを発揮するという概念に依存してきました。 現代のクラウド ハードウェアの経済学では、一般的に考えられているコストの想定が困難になっており、クラウド プロバイダーは全体的なサポートにおいて大幅に成熟しており、支出効率の向上につながっています。
で議論したように、 HPC バイヤーズ ガイド、HPC 運用に関連するハードコストとソフトコストを計算するには多くの考慮事項がありますが、焦点を絞った議論のために、クラウドとオンプレミスのインフラストラクチャのコスト パフォーマンスを比較することができます。
インフラストラクチャの意思決定の経済性を最大化するために、Rescale は組織が広範かつ継続的なコストパフォーマンス データにアクセスできるようにします。 このデータは、増え続けるコンピューティング ハードウェア タイプのポートフォリオを比較して選択するためのインデックス、Rescale Performance Index (RPI) を提供します。 多くの顧客がオンプレミスから移行するため、Rescale はそれらの導入からのベンチマーク データも持っています。
クラウドとデータセンターの新しいハードウェアのベンチマークのプロットで観察できるのは、新しいクラウド ハードウェアのパフォーマンス/コストの指標 (下図の「価値」) が、フル装備のハードウェアよりも速く、より頻繁に増加していることです。データセンターのインストール。 継続的に最適化すること、またはよりパフォーマンスの高いハードウェアに移行できることにより、組織はコンピューティング インフラストラクチャ コストの 20% を回収することができます (デジタル研究開発のためのインテリジェント コンピューティング)。 Azure 上の AMD CPU などの HPC ハードウェアに特に注目すると、RPI にプラスの傾向が見られます。これは、実務者がコストを一定に保ちながらパフォーマンスの向上を期待できることを意味します。 クラウドは毎年同じコストでパフォーマンス向上へのアクセスを提供するため、時間の経過とともに、クラウドの固定予算から得られる合計パフォーマンスは、同じ合計コストでの固定オンプレミス クラスターのパフォーマンスを超えます。

ポンド対ポンドのハードウェア経済性の比較を検討した後、HPC コストを増大させる可能性のある他の要因、つまり、ほとんどの組織にとってハードウェア コストを大幅に上回るライセンスと人員配置について検討できるようになります。 HPC の専門知識に対する需要が急増し、人材が不足しているため、オンプレミス展開の構築と維持の実現可能性は低下し、規模はクラウド ホスト型ソリューションにさらに傾くと予想されます。

「クラウド HPC は安全ではありません。」 

眉をひそめる人によると Gartner によって最近共有されたデータポイント, 「60 年までに、パブリック クラウドの IaaS ワークロードで発生するセキュリティ インシデントは、従来のデータ センターに比べて 2020% 減少します。そして、クラウド内のすべてのセキュリティ障害の少なくとも 95% は、顧客が原因となるでしょう。」
クラウドには脆弱性がたくさんあると信じている人にとっては、これは驚くべきことかもしれません。 パブリック クラウドはこれまで、企業の IT 組織の間で懸念や憶測を引き起こしており、特に特定のデータ規制や遵守すべきコンプライアンス標準がある企業にとっては、クラウド HPC への移行を妨げるほどのことがよくありました。 こうした懸念は、物理的に IT の監督下になく、企業全体のファイアウォールやポリシーの下にないインフラストラクチャに対する合理的な不信感に基づいています。 当然のことながら、最先端の HPC ワークロードの多くには、ITAR、FedRAMP、NIST などのコンプライアンス標準によって管理される機密の知的財産やデータの処理が含まれます。
しかし、クラウド サービス プロバイダーはこの物語を変えることに熱心に取り組んでおり、その取り組みを効果的に実証して顧客の信頼を築くためのポリシーと手段を整備しています。 AMD EPYC™ プロセッサーを搭載した Rescale on Azure は、HPC スタック全体にわたる信頼性、コンプライアンス、セキュリティを目的に特別に設計されたクラウド ハイ パフォーマンス コンピューティング ソリューションを提供します。 Azure は、業界、国、地域にわたる 90 のコンプライアンス認定を遵守し、リモート コラボレーションを念頭に構築された回復力のある国際基盤を提供します。 スタックの上位にある Rescale のソフトウェア定義セキュリティは、適切な IP 処理を強制し、高品位 TLS による転送時の暗号化と、256 ビット AES による保存時の多層暗号化を実現します。 既存のクラウド セキュリティ標準を強化するために、Rescale は追加の保護機能を組み込んで、エンドツーエンドのワークフローが安全であり、SOC 2 Type-2、CSA、ITAR、HIPAA、FedRAMP Mode、および GDPR に準拠していることを保証します。
世界中の労働力がより分散し、協力し、相互依存するようになるにつれて、HPC の取り組みやチームが IT ガバナンスに新たな複雑さを生み出すことが予想されます。 Rescale は、お客様が社内の部門や分野を越えて、また合弁事業や研究コンソーシアムなどのパートナーシップを通じてイノベーションの限界を押し広げているのを見て興奮しています (Covid に対するテクノロジー)。 これらの目的のために、Rescale はチームを簡単に管理し、データをきれいに分割して新しい洞察を引き出し、機密データを損なうことなくシームレスなコラボレーションを可能にするツールを組織に提供します。

AMD EPYC を搭載した Azure での Rescale プロセッサ

業界データがクラウド HPC の急速な導入を継続していることを示しているため、AMD EPYC™ プロセッサーを搭載した Rescale on Azure とのパートナーシップは、最先端の技術革新を通じてクラウド HPC に対する従来のユーザーの懸念に対処することに引き続き取り組んでいます。 導入を通じてクラウド HPC に関する誤解に異議を唱えている企業は、歴史的な精査や認識されているリスクをはるかに上回るメリットを実現しています。
AMD EPYC™ プロセッサーを搭載した Rescale on Azure は、スケールとパフォーマンスにおいて新たな高みを達成するために、シンプルさを念頭に置いて構築されたクラウド HPC ソリューションです。 詳細またはお問い合わせについては、sales@rescale.com までお問い合わせください。
 
このブログは、Garrett VanLee (製品マーケティング、Rescale)、Andrew Jones (企業 Azure エンジニアリングおよび製品計画)、Sean Kerr (製品マーケティング、AMD) によって執筆およびレビューされました。

著者

  • ギャレット・ヴァンリー

    Garrett VanLee は、Rescale の製品マーケティングを率いており、業界全体のイノベーションの最先端で顧客と緊密に連携しています。彼は、顧客の成功事例、研究の成果、Rescale のエンジニア、科学者、IT 専門家が他の組織を支援するためのベスト プラクティスを共有することを楽しんでいます。ギャレットは現在、スーパーコンピューティングの収束に焦点を当てています。 (HPC), AIシミュレーション モデルと、これらのトレンドが科学と産業における発見をどのように推進しているかについて説明します。

類似の投稿