コストとエネルギー消費量を削減しながら HPC パフォーマンスを向上させる方法

ハイパフォーマンスコンピューティングは現在、現代の研究と工学の基礎となっています。業界全体の組織が、製品開発サイクルを短縮するためにデジタルモデリングとシミュレーションに注目しています。特に工学系では、電子設計自動化 (EDA) そして、産業用モノのインターネット (IIoT) の急速な拡大が HPC の需要を押し上げています。

企業はますます複雑になるシミュレーションやその他のタスクを HPC に頼る一方で、コストを管理し、エネルギー消費を削減し続ける必要もあります。

ハイパフォーマンスコンピューティング (HPC) とは何ですか?

汎用コンピューティングと比較して、HPC は、複雑な計算問題を非常に高速に処理するための優れたスループットを提供します。 HPC システムコンピューティング、ネットワーク、ストレージという XNUMX つの主要コンポーネントが含まれます。これらは、大規模な並列処理を通じてコンピューティング能力を集約します。

HPC クラスターは、ネットワーク内に接続された多数のサーバーで構成されます。各コンポーネントコンピューターは「ノード」とみなされます。 HPC システムには、多くの場合、ノードごとに 16 つの CPU を備えた 64 ～ XNUMX のノードが含まれます。

ハイパフォーマンスコンピューティングの必要性は、今日のますます洗練されたソフトウェアと、シミュレーションや分析で使用される膨大なデータセットによって促進されています。このソフトウェアは、航空機の航空力学、自動運転、創薬、気象モデリングなど、さまざまな分野で製品のパフォーマンスを向上させるために使用されます。たとえば、次のようなシミュレーションソフトウェアアプリケーションがあります。 ANSYS, ジーメンス, ダッソー, 収束科学特殊な HPC アーキテクチャに依存して実行する計算流体力学民間航空機、軍用機、宇宙船の開発向け。研究開発組織は通常、幅広いアプリケーションのポートフォリオ、商用コード、オープンソースコード、および自家製コードを含むコードが含まれます。効率的に実行できるようにする HPC infrastructure それぞれに異なるニーズがあるため、これは課題です。同時に、独立系ソフトウェアベンダー (ISV) の状況は拡大し続けており、組織が高度な研究開発ソフトウェアの使用をサポートする必要がある方法はさらに複雑になっています。

特化した HPC クラスター

特殊な HPC 半導体チップの種類が増えていることを考慮すると、組織は複雑な研究開発アプリケーションを実行するために、パフォーマンスとコストの間の多くのトレードオフを考慮する必要があります。

HPC は、特殊な HPC クラスターを利用して、特定の種類のアプリケーションとワークロードのワークフローを最適化します。

一部のタスクでは、特殊なハードウェアとソフトウェアだけでなく、ノード間でより多くの通信が必要になります。特定のワークロードの計算要件によって、クラスター内に必要なノードの数が決まります。一部のソフトウェアおよび計算タスクも、特定の種類の半導体チップを使用するとパフォーマンスが向上します。のような自動ベンチマーク評価ツールパフォーマンスプロファイルを再スケールする最適なチップアーキテクチャを特定のコンピューティングタスクに適合させるのに非常に役立ちます。

クラスター用の高性能相互接続は、低遅延と低帯域幅のニーズに対応します。ワークロードを追跡し、必要に応じて再ルーティングします。大規模なデータセットを処理する XNUMX つの方法は、HPC アプリケーションをパッケージ化し、複数のクラスター間で実行することです。クラスターマネージャーは、容量チェックとヘルスチェックを実行して、利用可能なリソースを見つけて使用します。

コンテナ化

一部の組織は、AI の導入でますます普及している、GPU に最適化されたコンテナーを使用した HPC ワークロード管理にも取り組んでいます。オープンソースの Apptainer (Singularity) は、HPC 用に最も広く使用されているコンテナシステムです。 Shifter と Docker も他のオプションです。これらにより、主要な AI アプリケーションのシームレスな統合が可能になります。コンテナ化されたアプリケーションにより移植性が向上し、社内アプリケーションや商用アプリケーションをどこからでも使用できるようになります。

仮想化はコンテナ化の代替手段です。ホストオペレーティングシステム上に仮想環境を生成します。仮想マシン (VM) は独自のオペレーティングシステムでプログラムされており、仮想マシン間を完全に分離できます。 Hyper-V、vSphere、OpenStack などがその例です。

HPC が重要なのはなぜですか?

HPC は、従来のコンピューティングよりもはるかに短い時間で重要な情報と分析を提供します。 HPC のスピードは、エンジニアやデータサイエンティストから製品設計者や研究者に至るまで、多くの役割にメリットをもたらします。

また、モデリングとシミュレーション (M&S) をまったく新しいレベルに引き上げます。たとえば、高解像度のモデルでは、新製品に関するより詳細な情報が提供されるため、プロトタイプや実際のテストの必要性が軽減または排除されます。実際の衝突試験ではなく自動車の衝突シミュレーション、または実際の航空機ではなくフライトシミュレータでパイロットを訓練することを考えてください。

クラウド HPC を使用すると、さまざまな企業がコンピューティングのニーズをオンデマンドで迅速に拡張できます。

いくつかの例があります：

エンジニアリング会社
研究所
金融テクノロジー（フィンテック）
商品開発
政府と防衛

新興企業や中小企業でも、拡張性の高いクラウド HPC を活用できます。

HPC パフォーマンスの理解

デジタル研究とエンジニアリングのペースは加速しており、組織にとって、特定のアプリケーションやコンピューティングタスクに適したチップアーキテクチャの選択など、HPC プロビジョニングサイクルを可能な限り自動化することが重要になっています。

HPC 最適化は、特定のワークロードに適切なコンピューティングアーキテクチャを提供する際の複雑さに対処します。また、システムのエネルギー効率を高めるためにも不可欠です。 HPC ワークロードは、オンプレミスまたはクラウドにあるシステムリソース全体に分散されるデータ集約型のタスクです。

今日の HPC システムは、AI、機械学習、深層学習などの驚異的なワークロードを処理できます。大量のデータを処理しながら、数百万のシナリオを同時に実行します。

主要業績評価指標

アナリストは、HPC システムのパワーをフロップ/秒で測定します。現在、オークリッジ国立研究所のフロンティアマシンは、 TOP500 1.102 Eflop/s を実現する最も強力なスーパーコンピューターのリスト (XNUMX エクサフロップスは XNUMX 京の計算に相当します)。

もう XNUMX つの重要な指標は、電力使用効率（PUE）、データセンター全体のエネルギー効率を決定します。 PUE は、データセンターに入る総電力をすべての IT 機器の動作に使用される電力で割ることによって計算できます。数値が 1.0 に近づくほど、全体の効率が向上します。もう XNUMX つのベンチマーク基準は、データセンターインフラストラクチャの効率化 (DCiE)。このエネルギー効率の指標は、IT 機器の電力を施設の総電力で割ることによって計算されます。

最後に、指標は重要ですが、それはある程度までです。最終的に、ユーザーが最も気にするのは、計算ジョブの高速化に役立つ現実世界のパフォーマンスです。あらゆる種類のソフトウェアとワークロードの HPC パフォーマンスを完全に評価することは困難な場合があります。一部の種類の半導体チップは、他の種類のソフトウェアよりも特定の種類のソフトウェアでより適切に動作します。

計算上のボトルネック

一部の企業では、オンプレミスのインフラストラクチャ自体がボトルネックになっています。このタイプのインフラストラクチャ投資は通常、100% の使用率で計算されるため、瞬間的な需要が供給を上回り、容量がなくなるためボトルネックが発生します。それに比べ、クラウド HPC は弾力性があり、ニーズの変化に応じてスケールアップおよびスケールダウンできます。組織は、より多くのコンピューティング能力をサブスクライブするだけで済みます。その結果、クラウドの HPC は、容量の上限による制約に遭遇することなく、最大限の活用を実現します。

HPC システム内には、メモリ容量、I/O スループット、ストレージの速度/容量など、他にも多くの潜在的なボトルネックが存在します。 CPU コア、クロック速度、またはキャッシュもパフォーマンスを制限する可能性がありますが、その他の阻害要因にはネットワークスイッチの帯域幅が含まれる可能性があります。

データ転送速度が高くなると、バッファリングとストレージに必要なメモリが増えることになるため、メモリ容量も問題になります。従来の DDR3、DDR4、さらには DDR5 メモリがボトルネックになる可能性があります。ただし、高帯域幅メモリ (HBM) は DDR5 メモリの XNUMX 倍の帯域幅を提供するため、解決策として考えられます。

ボトルネックを回避するには、ソフトウェアの仕様をパフォーマンスを最適化する HPC 構成に合わせることも重要です。

HPC のエネルギー効率

HPC 管理において、持続可能性はますます緊急のニーズとなっています。 HPC 運用の二酸化炭素排出量を制御するには、最もエネルギー効率の高いハードウェアを評価できることが不可欠です。

ワットあたりのフロップ数で測定される HPC システムのエネルギー効率は向上し続けています。この一例としては、ヘンリーニューヨーク市のフラットアイアン研究所のシステムで、効率スコアは 65.09 GFlops/W でした。

データセンター運営者は、さまざまな方法でエネルギー効率を改善し続けています。たとえば、次世代の低電力チップセットはエネルギー消費を削減し、熱の放散に優れています。電力が最適化された IP コアにより、エネルギー使用量とデータ転送も削減されます。広帯域メモリ。一部の事業者は、次のような代替の持続可能性手法に目を向けています。液体冷却 & 熱リサイクル.

データセンターの期待はますます高まっています再生可能エネルギー源水力、風力、太陽光、バイオマス、グリーン水素など。 191 年から 2015 年にかけてデータセンターの電力消費量が 2021 テラワット時で横ばいになったことからも明らかなように、大きな進歩が見られます。ただし、オンプレミスのデータセンターからの XNUMX 回限りの移行により、HPC 需要の全体的な伸びがいくらか隠蔽されてしまいました。

HPC コンピューティング需要への対応

需要に応えるために、業界はこれまで以上に強力なマシンで対応しています。システムはペタフロップスからエクサフロップス以上の容量に移行しています。エクサフロップス機能を備えたスーパーコンピューターは、XNUMX 京の計算を実行するのに XNUMX 秒を必要とします。それ以上かかります 31億年 XNUMX 秒あたりわずか XNUMX 回の計算で、その数の計算を完了します。

HPC 効率を拡大するためのイノベーションには、新しいアーキテクチャとハードウェアが含まれます。たとえば、3DIC とダイツーダイ接続は最新のパフォーマンス要件に対応します。また、FPGA、GPU、CPU、その他の処理アーキテクチャが単一ノードに統合されている場合、より柔軟なスイッチングが可能になります。

新しいハードウェアはクラウドベースの HPC を好むことがよくあります。したがって、従来のオンプレミスデータセンターは、よりエネルギー効率の高いチップセットを常に活用できるとは限りません。クラウドへの移行は、スピード、スケーラビリティ、持続可能性に対する需要の高まりに効果的に対処する XNUMX つの方法です。

ただし、オンプレミスからクラウドへの単純な「リフトアンドシフト」移行では、企業の新たな HPC ニーズに必ずしも対応できるとは限りません。通常、更新サイクルは XNUMX ～ XNUMX 年であるため、レガシーインフラストラクチャでは変化するビジネスニーズに対応できない場合があります。このような長いサイクルでは、HPC エコシステムの急速な変化に追いつくことができません。クラウドの導入により、財務上の柔軟性も比較的高くなります。企業の HPC コストモデルは長期的なものから移行する CapEx 短期的な運用コストへ。それほど多くの資本を拘束せず、さまざまなクラウド HPC コストモデルを現在のニーズにうまく適合させることができます。

主要な取り組み

オンプレミスのデータセンターを使用している企業にとって、クラウドへの移行は、コストを削減しながらエネルギー効率を向上させる重要な方法です。 Cloud HPC は、あらゆる規模の企業に最新の技術進歩の恩恵を受ける方法を提供します。

HPC パフォーマンスを最適化するには、ソフトウェア仕様と利用可能なハードウェアを調整する必要があります。さらに、特殊な HPC クラスターとコンテナー化によって、HPC のパフォーマンスとエネルギー効率も向上します。

AI の使用が普及するにつれて、HPC システムはさらに高度なものになるでしょう。効率的なエネルギー.

Rescale の詳細をご覧ください

Rescale が、より大きなイノベーションを推進しながら、組織のコスト管理にどのように役立つかをご覧ください。とパフォーマンスプロファイル、ニーズに最適なクラウド HPC アーキテクチャを簡単に特定できます。

オンデマンドウェビナーで詳細をご覧ください「クラウドでのワークロードのコストとパフォーマンスを最適化します。」

ギャレット・ヴァンリー

Garrett VanLee は、Rescale の製品マーケティングを率いており、業界全体のイノベーションの最先端で顧客と緊密に連携しています。彼は、顧客の成功事例、研究の成果、Rescale のエンジニア、科学者、IT 専門家が他の組織を支援するためのベストプラクティスを共有することを楽しんでいます。ギャレットは現在、スーパーコンピューティングの収束に焦点を当てています。 (HPC), AIシミュレーションモデルと、これらのトレンドが科学と産業における発見をどのように推進しているかについて説明します。

すべての投稿を見る

クッキー	演奏時間	説明
AWSALBCORS	7日	このCookieはアマゾンウェブサービスによって管理され、負荷分散に使用されます。
cookielawinfo-チェックボックス-広告	1年	GDPR Cookie Consentプラグインによって設定されたこのCookieは、「広告」カテゴリのCookieに対するユーザーの同意を記録するために使用されます。
cookielawinfo-チェックボックス-分析	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「分析」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-機能	11か月間	Cookieは、「機能」カテゴリのCookieに対するユーザーの同意を記録するためにGDPRCookieの同意によって設定されます。
cookielawinfo-checkbox-Necessary	11か月間	このCookieはGDPR Cookie Consentプラグインによって設定されます。 Cookieは、「必要」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-その他	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「その他」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-パフォーマンス	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「パフォーマンス」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
visible_cookie_policy	11か月間	CookieはGDPR Cookie Consentプラグインによって設定され、ユーザーがCookieの使用に同意したかどうかを保存するために使用されます。個人データは保存されません。

クッキー	演奏時間	説明
__cf_bm	30 minutes	Cloudflareによって設定されたこのCookieは、Cloudflareボット管理をサポートするために使用されます。
クッキー	2年	LinkedInは、ブラウザIDを認識するために、LinkedInの共有ボタンと広告タグからこのCookieを設定します。
長い	セッション	LinkedInは、ユーザーの言語設定を記憶するようにこのCookieを設定します。
LIDC	1日	LinkedInは、データセンターの選択を容易にするためにlidccookieを設定します。
プレイヤー	1年	Vimeo は、この Cookie を使用して、Vimeo から埋め込みビデオを再生するときにユーザーの設定を保存します。

クッキー	演奏時間	説明
AWSALB	7日	AWSALBは、セッションをターゲットにマッピングするためにアマゾンウェブサービスによって設定されるアプリケーションロードバランサーCookieです。
同期アクティブ	決して	この Cookie は Vimeo によって設定され、訪問者のビデオコンテンツの好みに関するデータが含まれているため、Web サイトは好みの音量やビデオ品質などのパラメータを記憶します。

クッキー	演奏時間	説明
_ga	2年	GoogleAnalyticsによってインストールされた_gacookieは、訪問者、セッション、およびキャンペーンデータを計算し、サイトの分析レポートのサイト使用状況を追跡します。 Cookieは情報を匿名で保存し、ランダムに生成された番号を割り当てて、一意の訪問者を認識します。
_gat_UA-32985745-1	1 minute	ウェブサイトの所有者が訪問者の行動を追跡し、サイトのパフォーマンスを測定できるようにするために、GoogleAnalyticsとGoogleTagManagerによって設定された_gatcookieのバリエーション。名前のpattern要素には、関連するアカウントまたはWebサイトの一意のID番号が含まれています。
_gcl_au	3か月間	Google Tag Managerによって提供され、サービスを使用するWebサイトの広告効率を実験します。
_gid	1日	GoogleAnalyticsによってインストールされた_gidcookieは、訪問者がWebサイトをどのように使用しているかに関する情報を格納すると同時に、Webサイトのパフォーマンスの分析レポートを作成します。収集されるデータには、訪問者の数、ソース、匿名でアクセスするページなどがあります。
同意	2年	YouTubeは、埋め込まれたyoutube-videosを介してこのCookieを設定し、匿名の統計データを登録します。
utm_キャンペーン	過去	Google 広告サービスは、セッションキャンペーン値が存在する場合、この Cookie を設定して保存します。
utm_content	過去	この Cookie は、セッションコンテンツの値を保存するために使用されます (存在する場合)。
utm_source	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
utm_term	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
vuid	2年	VimeoはこのCookieをインストールして、Webサイトにビデオを埋め込むための一意のIDを設定することにより、追跡情報を収集します。

クッキー	演奏時間	説明
_fbp	3か月間	このCookieは、Webサイトにアクセスした後、FacebookまたはFacebook広告を利用したデジタルプラットフォームのいずれかで広告を表示するようにFacebookによって設定されます。
_mkto_trk	2年	Marketo によって提供されるこの Cookie には、ユーザーのサイトの使用状況を追跡するために使用される情報 (一意のユーザー ID など) が含まれています。 Marketo によって設定された Cookie は、Marketo によってのみ読み取り可能です。
fr	3か月間	Facebookは、FacebookピクセルまたはFacebookソーシャルプラグインを備えたサイトで、Web全体のユーザーの行動を追跡することにより、ユーザーに関連する広告を表示するようにこのCookieを設定します。
IDE	1年24日	Google DoubleClick IDE Cookieは、ユーザーがWebサイトを使用して関連する広告を表示する方法に関する情報を、ユーザープロファイルに従って保存するために使用されます。
Personalization_id	2年	Twitter は、ソーシャルメディアの機能を統合および共有するためにこの Cookie を設定し、追跡とターゲティングのためにユーザーが Web サイトをどのように使用するかに関する情報も保存します。
test_cookie	15 minutes	test_cookieはdoubleclick.netによって設定され、ユーザーのブラウザがCookieをサポートしているかどうかを判断するために使用されます。
utm_medium	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
VISITOR_INFO1_LIVE	5月27日	ユーザーが新しいプレーヤーインターフェースを取得するか古いプレーヤーインターフェースを取得するかを決定する帯域幅を測定するためにYouTubeによって設定されるCookie。
YSC	セッション	YSC CookieはYoutubeによって設定され、Youtubeページに埋め込まれたビデオのビューを追跡するために使用されます。
yt-リモート接続デバイス	決して	YouTubeは、埋め込まれたYouTubeビデオを使用して、ユーザーのビデオ設定を保存するためにこのCookieを設定します。
yt-リモートデバイスID	決して	YouTubeは、埋め込まれたYouTubeビデオを使用して、ユーザーのビデオ設定を保存するためにこのCookieを設定します。
yt.innertube :: nextId	決して	YouTubeによって設定されたこのCookieは、ユーザーが見たYouTubeの動画に関するデータを保存するための一意のIDを登録します。
yt.innertube ::リクエスト	決して	YouTubeによって設定されたこのCookieは、ユーザーが見たYouTubeの動画に関するデータを保存するための一意のIDを登録します。

クッキー	演奏時間	説明
_chtbl	セッション	説明はありません。
_dtses	30 minutes	説明はありません。
_dtuid	10年	説明はありません。
BIGipServersj30web-nginx-app_https	セッション	全く説明しない
email	過去	説明はありません。
gclid	過去	全く説明しない
ハンドル ip	1月	説明はありません。
handle_landing_page	1月	説明はありません。
handle_original_ref	過去	説明はありません。
ハンドル参照	過去	説明はありません。
handle_url	1月	説明はありません。
li_gc	2年	全く説明しない
muc_ads	2年	全く説明しない
ユーザ名	過去	説明はありません。

Rescale プラットホーム

概要

HPC & AI ソフトウェア

HPC & AI アーキテクチャ

セキュリティ&コンプライアンス

エコシステム統合

価格（英語）

HPC as a Service

インテリジェントバッチ

エラスティック・クラウド・ワークステーション

ストレージ・ファブリック

エンタープライズ管理

チーム管理

パフォーマンス管理

持ち込みソフトウェアをクラウドで利用

デジタルエンジニアリング

AI の物理学

データ管理

計算パイプライン

ハイ パフォーマンス コンピューティング (HPC) とは何ですか?