ニーズに合った適切な HPC クラウドアーキテクチャを見つける

デジタルの研究開発に携わるには、本当に素晴らしい時代です。オンプレミスのデータセンターの古い制約は、クラウドベースのスーパーコンピューティングサービスの事実上無制限の弾力的な容量に置き換えられています。研究者やエンジニアは、限られた非常に貴重なリソースにアクセスするために列に並んで待つ必要はもうありません。

しかしこれは、選択肢がたくさんあることも意味します。どのクラウドプロバイダーを使用すればよいでしょうか? シングルクラウドにするべきでしょうか、それともマルチクラウドにするべきでしょうか? どのハイパフォーマンスコンピューティング (HPC) サービスが最適ですか? どのようなチップアーキテクチャを使用する必要がありますか?

そして重要なことに、HPC クラウドサービスとそれをサポートするチップアーキテクチャは急速に進化しています。チップの種類と数は爆発的に増加しています。これにより、HPC ユーザーには大量のオプションが提供されるようになりますが、同時にかなりの複雑さも生じます。

良いニュース？ Rescale は、チップ選択の課題を簡素化するためにパフォーマンスプロファイルを作成しました。これらの傾向と、Rescale がどのように役立つかを詳しく見てみましょう。

HPC の新時代

HPC クラウドサービスは、現実世界の物理学の複雑なモデルやシミュレーションを実行するためのデジタル R&D の急速な成長によって、過去 XNUMX 年間で需要が急増しました。 HPC には、複雑な計算問題を解決するために戦略的にプールされたコンピューティング、アプリケーション、ストレージ、ネットワーキングリソースのエコシステムが含まれています。

クラウドテクノロジーは HPC 革命の最前線にあり、さまざまな業界の組織が従来のデータセンター環境が提供できる能力を超えるデータ処理能力を活用できるように支援します。クラウド上の HPC は、研究開発プログラムのデジタル変革を推進しようとしている組織に、前例のないレベルのパフォーマンス、効率、柔軟性を提供します。

近年クラウドの導入は急激に増加しており、企業は IT 予算の 30% 以上をクラウドインフラストラクチャに費やしています。この成長には正当な理由があります。クラウドは、共有リソースへのオンデマンドアクセスや、高価な社内サーバー機器の排除によるコスト削減など、比類のない利点を提供します。

特殊チップの成長

クラウドベースの HPC サービスの拡大と相まって、特殊チップの大幅な成長により、研究開発向けのハイパフォーマンスコンピューティングが変革され、特定のワークロードに合わせて調整されたスーパーコンピューティング能力が提供されています。特殊チップは、汎用の中央処理装置 (CPU) の非効率性に対処することを目的としています。。

これらの新しいチップは、グラフィックプロセッシングユニット (GPU)、フィールドプログラマブルゲートアレイ (FPGA)、特定用途向け集積回路 (ASIC) など、さまざまな形式で提供されます。これらは、人工知能 (AI)、機械学習 (ML)、ビッグデータ分析などの特定のタスクの計算を高速化するように設計されています。

特殊チップの普及により、パフォーマンスが向上しています。ムーアの法則は過去 XNUMX 年間にわたって横ばい傾向にあり、これは、従来のチップの性能がコンピューター業界の初期ほど速く向上していないことを意味します。

その結果、市場は速度、コスト、エネルギー効率において新たな効率を得るために、専用の半導体コンピューティングアーキテクチャに移行しており、チップアーキテクチャの多様性は爆発的に増加しています。特殊なチップの数は過去 1,000 年間で 10% 増加しました。たとえば 2020 年には、400 を超える新しいチップタイプ (コアタイプとインスタンス) が市場に参入しました。現在では 1,450 を超える異なるチップタイプ (コアタイプとインスタンス) があり、これは加速するばかりです。

ムーアの法則が平坦化するにつれ、業界は特殊なチップに注目するようになりました
データ集約型の研究開発コンピューティングタスクのパフォーマンスを向上させます。

この驚くべき成長は、Arm アーキテクチャの急速な採用とチップ製造方法の新しいパラダイムによって促進されています。 AWS、Microsoft、Google などの企業は、クラウド運用をサポートするために独自のチップを製造しています。

重要なのは、これらの特殊チップは特定の計算タスク用に設計されていることです。 XNUMX つのチップは並列タスクに優れている可能性があり、もう XNUMX つのチップはシングルスレッドのデータ集約型計算タスクで最速の速度を提供する可能性があります。そして、これらはいずれも、すべてのタスクおよびすべてのワークロードにとって最適な選択ではありません。

たとえば、次のコマンドを実行している場合、計算流体力学 (CFD) または有限要素解析 (FEA) シミュレーション、どのソフトウェアを実行しますか? それらは異なる動作をすることになります。導入する各変数により、特定のタスクに最適なパフォーマンスを提供する異なるチップが生成されます。

これらのトレードオフを詳しく見てみましょう。適切なチップの選択適切なアプリケーションと計算タスクを使用すると、パフォーマンス、コスト、エネルギー効率に大きな違いが生じます。

研究開発のコンピューティングニーズに適したチップアーキテクチャを選択する

最初に検討する使用例は、シミュレーションの実行時間を最適化することです。適切なハードウェアを選択することで、ユーザーはシミュレーションに必要なリソースを割り当て、自動車部品メーカーが新規契約を獲得するために新しい機器を設計する場合など、時間が重要な要素である場合にシミュレーションをより高速に実行できます。

あるいは、シミュレーションコストの削減を検討しているかもしれません。適切なハードウェアを選択することで、ユーザーはシミュレーションの実行に必要なソフトウェアライセンスの時間を最小限に抑えることができ、シミュレーションの実行にかかる全体的なコストを削減できます。

これは、予算が限られている場合に特に役立ちます。このような経済情勢の中で、組織はこれまで以上にコストを意識する必要があります。クラウドのコストを管理するには、より高速なハードウェアを使用して合計使用時間を短縮することが非常に有益です。

XNUMX 番目の使用例は、シミュレーションのスケーリングです。シミュレーションがスケールするにつれて、特に複数のクラスターで実行する必要がある場合や、より多くのメモリを必要とするユースケースでは、ハードウェアが異なるとパフォーマンスも異なります。

これら XNUMX つのユースケースは、ハイパフォーマンスコンピューティングで考えられるすべての研究開発ユースケースのほんの一部にすぎません。そしてほとんどの状況では、これら XNUMX つのニーズがすべて融合します。

最速、最安、最大規模だけを求めるわけではありません。そして多くの場合、それはコストパフォーマンスとのトレードオフの問題です。どのクラウドサービス上のどのチップがイノベーションの取り組みを加速するのに最も効果的でしょうか?

効果的なベンチマークの障壁

HPC アーキテクチャのパフォーマンス、コスト、エネルギー効率、およびスケーラビリティを理解することが重要です。この理解を得るために、組織は従来、特定のハードウェアをベンチマークし、アプリケーションでテストすることができました。しかし現在、新しいチップが急速に市場に投入されており、組織がベンチマークに追いつくことが困難になっています。

そしてベンチマークは簡単ではありません。 HPC ベンチマークを開始するには、時間がかかる場合があります。ベンチマークを設定して実行するには多大な労力が必要です。これは、実行するために必要な専門知識やリソースが不足している組織にとっては特に困難となる可能性があります。

現在、テストに最適なハードウェアを特定することは困難です。また、異なるシステム属性、おそらく異なる CPU メモリストレージやネットワークを持つさまざまなチップを使用したい場合もあります。最新かつ最高のチップタイプが導入されるたびに追いついていないと、遅れを取る可能性があります。

また、パフォーマンスの問題の根本原因の特定は複雑な場合があるため、ベンチマーク結果の分析と解釈は困難です。

パフォーマンスプロファイル: 常に適切なチップ

では、研究開発タスクに適した HPC ハードウェアを選択するためにベンチマークが重要である場合、組織は何ができるでしょうか? 答えはパフォーマンスプロファイルを再スケールする.

パフォーマンスプロファイルは、組織がニーズに最適なチップタイプを即座に知る方法を自動化します。

パフォーマンスプロファイルを使用すると、組織は特定のアプリケーションやコンピューティングタスクに対する独自のパフォーマンスインテリジェンスを確立できます。

パフォーマンスプロファイルを使用すると、適切なコアタイプや必要なコア数を選択する際に、推測に頼る必要がなくなります。

代わりに、パフォーマンスプロファイルを使用すると、そのパフォーマンスマップを使用して、シミュレーションに最適なハードウェアリソースの組み合わせを決定できます。

パフォーマンスプロファイルは、ハードウェアアーキテクチャの長所と短所を理解するために必要なすべての比較データを提供します。その後、戦略的ニーズに合わせた意思決定を行うことができます。ユースケースで見てきたように、それは顧客ごとに異なり、実際は当面のプロジェクトによって異なります。

パフォーマンスプロファイルを使用すると、ソフトウェアとモデルの実際のベンチマークに基づいて情報に基づいた意思決定を行うことができ、チップタイプ、クラスターサイズ、アプリケーションタイプ、およびコンピューティングタスク間の変数を分離することができます。パフォーマンスプロファイルを使用すると、どの HPC インフラストラクチャが研究開発のニーズに対して実際に機能するかを知ることができます。

クリーンエネルギーの新興企業である Kairos Power を含め、当社の顧客の多くはすでに Rescale パフォーマンスプロファイルの恩恵を受けています。

「パフォーマンスプロファイルは、私たちにとって非常に貴重な機能です」と Kairos の主任流体力学エンジニア、ブライアンジャクソンは言います。「パフォーマンスプロファイルを使用することで、私たちのチームは、これまで使用してきたチップアーキテクチャと比較してコスト対速度が 30% 向上する XNUMX つのハードウェアアーキテクチャを発見しました。今後は、これらの新しいコアタイプを利用し、引き続きこの新しい Rescale 機能を使用してパフォーマンスと価値を最適化していきます。」

デジタル R&D とハイパフォーマンスコンピューティングのこの新しい時代では、クラウドサービスプロバイダーから適切なハードウェアアーキテクチャを選択する必要性が最も重要です。正しい選択を行うことは、コスト、パフォーマンス、規模、持続可能性に大きな影響を与えます。間違った対応をすると、イノベーションへの取り組みが遅れ、コストがかかる可能性があります。 Rescaleパフォーマンスプロファイルを使用して賢明に選択してください。

組織が研究開発ニーズに適した HPC アーキテクチャを選択するのに Rescale パフォーマンスプロファイルがどのように役立つかについて詳しく知りたいですか?ウェビナーをご覧ください。「クラウドにおけるワークロードのコストとパフォーマンスの最適化」または詳細について学ぶパフォーマンスプロファイル.

エリック・ログン

Rescale プラットフォームで視覚化、ワークフロー、コラボレーション、パフォーマンスインテリジェンス、アイデンティティ管理を管理しています。 Rescale に入社する前は、Erik は LiveRamp でデータマーケットプレイスとプラットフォーム統合製品を運営していました。キャリアの初期には、ロッキード・マーティン社の衛星部門でエンジニアを務めていました。

すべての投稿を見る

クッキー	演奏時間	説明
AWSALBCORS	7日	このCookieはアマゾンウェブサービスによって管理され、負荷分散に使用されます。
cookielawinfo-チェックボックス-広告	1年	GDPR Cookie Consentプラグインによって設定されたこのCookieは、「広告」カテゴリのCookieに対するユーザーの同意を記録するために使用されます。
cookielawinfo-チェックボックス-分析	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「分析」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-機能	11か月間	Cookieは、「機能」カテゴリのCookieに対するユーザーの同意を記録するためにGDPRCookieの同意によって設定されます。
cookielawinfo-checkbox-Necessary	11か月間	このCookieはGDPR Cookie Consentプラグインによって設定されます。 Cookieは、「必要」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-その他	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「その他」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-パフォーマンス	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「パフォーマンス」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
visible_cookie_policy	11か月間	CookieはGDPR Cookie Consentプラグインによって設定され、ユーザーがCookieの使用に同意したかどうかを保存するために使用されます。個人データは保存されません。

クッキー	演奏時間	説明
__cf_bm	30 minutes	Cloudflareによって設定されたこのCookieは、Cloudflareボット管理をサポートするために使用されます。
クッキー	2年	LinkedInは、ブラウザIDを認識するために、LinkedInの共有ボタンと広告タグからこのCookieを設定します。
長い	セッション	LinkedInは、ユーザーの言語設定を記憶するようにこのCookieを設定します。
LIDC	1日	LinkedInは、データセンターの選択を容易にするためにlidccookieを設定します。
プレイヤー	1年	Vimeo は、この Cookie を使用して、Vimeo から埋め込みビデオを再生するときにユーザーの設定を保存します。

クッキー	演奏時間	説明
AWSALB	7日	AWSALBは、セッションをターゲットにマッピングするためにアマゾンウェブサービスによって設定されるアプリケーションロードバランサーCookieです。
同期アクティブ	決して	この Cookie は Vimeo によって設定され、訪問者のビデオコンテンツの好みに関するデータが含まれているため、Web サイトは好みの音量やビデオ品質などのパラメータを記憶します。

クッキー	演奏時間	説明
_ga	2年	GoogleAnalyticsによってインストールされた_gacookieは、訪問者、セッション、およびキャンペーンデータを計算し、サイトの分析レポートのサイト使用状況を追跡します。 Cookieは情報を匿名で保存し、ランダムに生成された番号を割り当てて、一意の訪問者を認識します。
_gat_UA-32985745-1	1 minute	ウェブサイトの所有者が訪問者の行動を追跡し、サイトのパフォーマンスを測定できるようにするために、GoogleAnalyticsとGoogleTagManagerによって設定された_gatcookieのバリエーション。名前のpattern要素には、関連するアカウントまたはWebサイトの一意のID番号が含まれています。
_gcl_au	3か月間	Google Tag Managerによって提供され、サービスを使用するWebサイトの広告効率を実験します。
_gid	1日	GoogleAnalyticsによってインストールされた_gidcookieは、訪問者がWebサイトをどのように使用しているかに関する情報を格納すると同時に、Webサイトのパフォーマンスの分析レポートを作成します。収集されるデータには、訪問者の数、ソース、匿名でアクセスするページなどがあります。
同意	2年	YouTubeは、埋め込まれたyoutube-videosを介してこのCookieを設定し、匿名の統計データを登録します。
utm_キャンペーン	過去	Google 広告サービスは、セッションキャンペーン値が存在する場合、この Cookie を設定して保存します。
utm_content	過去	この Cookie は、セッションコンテンツの値を保存するために使用されます (存在する場合)。
utm_source	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
utm_term	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
vuid	2年	VimeoはこのCookieをインストールして、Webサイトにビデオを埋め込むための一意のIDを設定することにより、追跡情報を収集します。

クッキー	演奏時間	説明
_fbp	3か月間	このCookieは、Webサイトにアクセスした後、FacebookまたはFacebook広告を利用したデジタルプラットフォームのいずれかで広告を表示するようにFacebookによって設定されます。
_mkto_trk	2年	Marketo によって提供されるこの Cookie には、ユーザーのサイトの使用状況を追跡するために使用される情報 (一意のユーザー ID など) が含まれています。 Marketo によって設定された Cookie は、Marketo によってのみ読み取り可能です。
fr	3か月間	Facebookは、FacebookピクセルまたはFacebookソーシャルプラグインを備えたサイトで、Web全体のユーザーの行動を追跡することにより、ユーザーに関連する広告を表示するようにこのCookieを設定します。
IDE	1年24日	Google DoubleClick IDE Cookieは、ユーザーがWebサイトを使用して関連する広告を表示する方法に関する情報を、ユーザープロファイルに従って保存するために使用されます。
Personalization_id	2年	Twitter は、ソーシャルメディアの機能を統合および共有するためにこの Cookie を設定し、追跡とターゲティングのためにユーザーが Web サイトをどのように使用するかに関する情報も保存します。
test_cookie	15 minutes	test_cookieはdoubleclick.netによって設定され、ユーザーのブラウザがCookieをサポートしているかどうかを判断するために使用されます。
utm_medium	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
VISITOR_INFO1_LIVE	5月27日	ユーザーが新しいプレーヤーインターフェースを取得するか古いプレーヤーインターフェースを取得するかを決定する帯域幅を測定するためにYouTubeによって設定されるCookie。
YSC	セッション	YSC CookieはYoutubeによって設定され、Youtubeページに埋め込まれたビデオのビューを追跡するために使用されます。
yt-リモート接続デバイス	決して	YouTubeは、埋め込まれたYouTubeビデオを使用して、ユーザーのビデオ設定を保存するためにこのCookieを設定します。
yt-リモートデバイスID	決して	YouTubeは、埋め込まれたYouTubeビデオを使用して、ユーザーのビデオ設定を保存するためにこのCookieを設定します。
yt.innertube :: nextId	決して	YouTubeによって設定されたこのCookieは、ユーザーが見たYouTubeの動画に関するデータを保存するための一意のIDを登録します。
yt.innertube ::リクエスト	決して	YouTubeによって設定されたこのCookieは、ユーザーが見たYouTubeの動画に関するデータを保存するための一意のIDを登録します。

クッキー	演奏時間	説明
_chtbl	セッション	説明はありません。
_dtses	30 minutes	説明はありません。
_dtuid	10年	説明はありません。
BIGipServersj30web-nginx-app_https	セッション	全く説明しない
email	過去	説明はありません。
gclid	過去	全く説明しない
ハンドル ip	1月	説明はありません。
handle_landing_page	1月	説明はありません。
handle_original_ref	過去	説明はありません。
ハンドル参照	過去	説明はありません。
handle_url	1月	説明はありません。
li_gc	2年	全く説明しない
muc_ads	2年	全く説明しない
ユーザ名	過去	説明はありません。

Rescale プラットホーム

概要

HPC & AI ソフトウェア

HPC & AI アーキテクチャ

セキュリティ&コンプライアンス

エコシステム統合

価格（英語）

HPC as a Service

インテリジェントバッチ

エラスティック・クラウド・ワークステーション

ストレージ・ファブリック

エンタープライズ管理

チーム管理

パフォーマンス管理

持ち込みソフトウェアをクラウドで利用

デジタルエンジニアリング

AI の物理学

データ管理

計算パイプライン