Google Compute Engine での MPI レイテンシ

Google は、Google Compute Engine (GCE) サービスへのアクセスを一般に公開することで、IaaS クラウドコンピューティングの輪に正式に挑戦を開始しました。 Google が宣伝する差別化機能の XNUMX つは、パフォーマンスネットワークインフラストラクチャの。
私たちは、HPC アプリケーションドメインのコンテキスト内で相互接続のパフォーマンスがどのようなものかを確認するために、このサービスを簡単に試してみることにしました。特に、MPI クラスター内の XNUMX 台のマシン間の遅延を測定することに興味がありました。
このテストでは、XNUMX つのインスタンスをスピンアップし、OpenMPI クラスターをセットアップしてから、osu_latency ベンチマークを実行しました。 OSU マイクロベンチマークテストスイートを使用して、ピンポン方式でノード間で 0 バイトのメッセージを送信するのにかかる時間を測定します。以下に報告される数値は、3 回の試行で平均された一方向の潜時数値です。試験ごとに新しいマシンのペアが起動されました。

インスタンスタイプ	トライアル #1	トライアル #2	トライアル #3	平均
n1-標準-1	183.12	172.57	169.90	175.20
n1-標準-2	192.27	202.51	196.20	196.99
n1-標準-4	169.97	170.96	177.03	172.65
n1-highcpu-2	176.34	210.81	192.04	193.06
n1-highcpu-4	205.00	176.11	159.95	180.35
n1-highmem-2	176.80	177.73	189.72	181.42
n1-highmem-4	173.78	175.94	185.85	178.52

*すべての遅延数値はマイクロ秒単位で測定されます
報告されたレイテンシの数値は、テストしたすべてのインスタンスタイプでほぼ同じです。テスト間の差異は、マシン上の他のテナントからの競合が原因である可能性があります。クラウドコンピューティングインスタンスのベンチマークは、非常に難しい問題として知られています。将来的には、より多くのインスタンスおよび異なる期間にわたって、より徹底的なテストを実行することを検討します。
比較のポイントとして、Amazon EC70 インスタンスで同じテストを実行すると、レイテンシは 90 ～ 2 マイクロ秒であることがわかります。これは真の同一比較ではないことを指摘することが重要です。Amazon は、特別なクラスターコンピューティングインスタンスタイプと配置グループを提供しています。後者により、帯域幅が向上し、同じグループ内のマシン間の待ち時間が短縮されます。 GCE レイテンシーの数値は Edward Walker の数値に近いようです。報告 EC2 上の非クラスターコンピューティングインスタンスの場合。おそらく Google は、今のところ Web サービスのホスティングというより一般的なワークロードに焦点を当てており、最終的には HPC などの他のドメイン向けにインフラストラクチャを調整することに重点を置くようです。現時点では、GCE は本質的に「恥ずかしいほど並列」なワークロードに適しているようです。
このような種類のマイクロベンチマークは、実際のアプリケーションを実行したときに見られるパフォーマンスを必ずしも表しているわけではないことに注意してください。期待されるパフォーマンスを正確に把握するために、マクロレベルのアプリケーション固有のテストを実行することをお勧めします。レイテンシのペナルティを軽減するには、いくつかの方法があります。

特定のクラスのシミュレーション問題では、モデルを別々の部分に分解し、それらを並行して評価できる場合があります。パブリッククラウドの出現により、考え方の転換が必要です。単一のオンプレミスクラスターを使用するのではなく、分解された部分を同時に操作できる多数の小さなクラスターを起動することができます。
可能な場合は、ハイブリッド Open MP / MPI アプリケーションを活用します。クラスターノード間のチャットの量を減らすことは、遅延コストを完全に回避するための優れたアプローチです。

私たちは、さまざまなクラウドプロバイダーの間で軍拡競争が続くことを楽しみにしており、HPC のパフォーマンスが向上し続けることを期待しています。一例として、Microsoft は最近新しい機能を発表しました。 Azure 向けの HPC オファリングこれにより、インスタンス間の Infiniband 接続が保証されます。ほとんどの場合と同様、大規模なクラウドコンピューティングプロバイダー間の競争はエンドカスタマーにとって非常に有益です。 Rescale では、お客様に可能な限り最高のパフォーマンスを提供し続ける機会に興奮しています。

ライアン・カネシロ

すべての投稿を見る

類似の投稿

クッキー	演奏時間	説明
AWSALBCORS	7日	このCookieはアマゾンウェブサービスによって管理され、負荷分散に使用されます。
cookielawinfo-チェックボックス-広告	1年	GDPR Cookie Consentプラグインによって設定されたこのCookieは、「広告」カテゴリのCookieに対するユーザーの同意を記録するために使用されます。
cookielawinfo-チェックボックス-分析	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「分析」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-機能	11か月間	Cookieは、「機能」カテゴリのCookieに対するユーザーの同意を記録するためにGDPRCookieの同意によって設定されます。
cookielawinfo-checkbox-Necessary	11か月間	このCookieはGDPR Cookie Consentプラグインによって設定されます。 Cookieは、「必要」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-その他	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「その他」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-パフォーマンス	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「パフォーマンス」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
visible_cookie_policy	11か月間	CookieはGDPR Cookie Consentプラグインによって設定され、ユーザーがCookieの使用に同意したかどうかを保存するために使用されます。個人データは保存されません。

クッキー	演奏時間	説明
__cf_bm	30 minutes	Cloudflareによって設定されたこのCookieは、Cloudflareボット管理をサポートするために使用されます。
クッキー	2年	LinkedInは、ブラウザIDを認識するために、LinkedInの共有ボタンと広告タグからこのCookieを設定します。
長い	セッション	LinkedInは、ユーザーの言語設定を記憶するようにこのCookieを設定します。
LIDC	1日	LinkedInは、データセンターの選択を容易にするためにlidccookieを設定します。
プレイヤー	1年	Vimeo は、この Cookie を使用して、Vimeo から埋め込みビデオを再生するときにユーザーの設定を保存します。

クッキー	演奏時間	説明
AWSALB	7日	AWSALBは、セッションをターゲットにマッピングするためにアマゾンウェブサービスによって設定されるアプリケーションロードバランサーCookieです。
同期アクティブ	決して	この Cookie は Vimeo によって設定され、訪問者のビデオコンテンツの好みに関するデータが含まれているため、Web サイトは好みの音量やビデオ品質などのパラメータを記憶します。

クッキー	演奏時間	説明
_ga	2年	GoogleAnalyticsによってインストールされた_gacookieは、訪問者、セッション、およびキャンペーンデータを計算し、サイトの分析レポートのサイト使用状況を追跡します。 Cookieは情報を匿名で保存し、ランダムに生成された番号を割り当てて、一意の訪問者を認識します。
_gat_UA-32985745-1	1 minute	ウェブサイトの所有者が訪問者の行動を追跡し、サイトのパフォーマンスを測定できるようにするために、GoogleAnalyticsとGoogleTagManagerによって設定された_gatcookieのバリエーション。名前のpattern要素には、関連するアカウントまたはWebサイトの一意のID番号が含まれています。
_gcl_au	3か月間	Google Tag Managerによって提供され、サービスを使用するWebサイトの広告効率を実験します。
_gid	1日	GoogleAnalyticsによってインストールされた_gidcookieは、訪問者がWebサイトをどのように使用しているかに関する情報を格納すると同時に、Webサイトのパフォーマンスの分析レポートを作成します。収集されるデータには、訪問者の数、ソース、匿名でアクセスするページなどがあります。
同意	2年	YouTubeは、埋め込まれたyoutube-videosを介してこのCookieを設定し、匿名の統計データを登録します。
utm_キャンペーン	過去	Google 広告サービスは、セッションキャンペーン値が存在する場合、この Cookie を設定して保存します。
utm_content	過去	この Cookie は、セッションコンテンツの値を保存するために使用されます (存在する場合)。
utm_source	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
utm_term	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
vuid	2年	VimeoはこのCookieをインストールして、Webサイトにビデオを埋め込むための一意のIDを設定することにより、追跡情報を収集します。

クッキー	演奏時間	説明
_fbp	3か月間	このCookieは、Webサイトにアクセスした後、FacebookまたはFacebook広告を利用したデジタルプラットフォームのいずれかで広告を表示するようにFacebookによって設定されます。
_mkto_trk	2年	Marketo によって提供されるこの Cookie には、ユーザーのサイトの使用状況を追跡するために使用される情報 (一意のユーザー ID など) が含まれています。 Marketo によって設定された Cookie は、Marketo によってのみ読み取り可能です。
fr	3か月間	Facebookは、FacebookピクセルまたはFacebookソーシャルプラグインを備えたサイトで、Web全体のユーザーの行動を追跡することにより、ユーザーに関連する広告を表示するようにこのCookieを設定します。
IDE	1年24日	Google DoubleClick IDE Cookieは、ユーザーがWebサイトを使用して関連する広告を表示する方法に関する情報を、ユーザープロファイルに従って保存するために使用されます。
Personalization_id	2年	Twitter は、ソーシャルメディアの機能を統合および共有するためにこの Cookie を設定し、追跡とターゲティングのためにユーザーが Web サイトをどのように使用するかに関する情報も保存します。
test_cookie	15 minutes	test_cookieはdoubleclick.netによって設定され、ユーザーのブラウザがCookieをサポートしているかどうかを判断するために使用されます。
utm_medium	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
VISITOR_INFO1_LIVE	5月27日	ユーザーが新しいプレーヤーインターフェースを取得するか古いプレーヤーインターフェースを取得するかを決定する帯域幅を測定するためにYouTubeによって設定されるCookie。
YSC	セッション	YSC CookieはYoutubeによって設定され、Youtubeページに埋め込まれたビデオのビューを追跡するために使用されます。
yt-リモート接続デバイス	決して	YouTubeは、埋め込まれたYouTubeビデオを使用して、ユーザーのビデオ設定を保存するためにこのCookieを設定します。
yt-リモートデバイスID	決して	YouTubeは、埋め込まれたYouTubeビデオを使用して、ユーザーのビデオ設定を保存するためにこのCookieを設定します。
yt.innertube :: nextId	決して	YouTubeによって設定されたこのCookieは、ユーザーが見たYouTubeの動画に関するデータを保存するための一意のIDを登録します。
yt.innertube ::リクエスト	決して	YouTubeによって設定されたこのCookieは、ユーザーが見たYouTubeの動画に関するデータを保存するための一意のIDを登録します。

クッキー	演奏時間	説明
_chtbl	セッション	説明はありません。
_dtses	30 minutes	説明はありません。
_dtuid	10年	説明はありません。
BIGipServersj30web-nginx-app_https	セッション	全く説明しない
email	過去	説明はありません。
gclid	過去	全く説明しない
ハンドル ip	1月	説明はありません。
handle_landing_page	1月	説明はありません。
handle_original_ref	過去	説明はありません。
ハンドル参照	過去	説明はありません。
handle_url	1月	説明はありません。
li_gc	2年	全く説明しない
muc_ads	2年	全く説明しない
ユーザ名	過去	説明はありません。

Rescale プラットホーム

概要

HPC & AI ソフトウェア

HPC & AI アーキテクチャ

セキュリティ&コンプライアンス

エコシステム統合

価格（英語）

HPC as a Service

インテリジェントバッチ

エラスティック・クラウド・ワークステーション

ストレージ・ファブリック

エンタープライズ管理

チーム管理

パフォーマンス管理

持ち込みソフトウェアをクラウドで利用

デジタルエンジニアリング

AI の物理学

データ管理

計算パイプライン

著者