オンプレミス HPC システム構築の醜く、隠され、過小評価されているコスト

現在および将来の HPC および組織の需要に応じて、各システムには利点と制限があり、それらを定義して比較する必要があります。通常、システム間の主な比較の XNUMX つは総所有コスト (TCO) です。以前のブログ投稿でも述べたように、 TCO は、根本的に異なる代替製品間で購入を決定するのにはまったく適していません。オンプレミス HPC システムの TCO については、当社の営業担当副社長もブログで 30 年以上議論しています。「ハイパフォーマンスコンピューティングの実際のコスト」オンプレミス HPC システムの購入を検討している人にとって、オンプレミス HPC システムの TCO を計算するときに見落とされがちな隠れた費用がいくつかあります。
この投稿では、オンプレミスシステムの TCO を分析し、見落とされる可能性のあるいくつかの費用を明らかにするつもりです。
TCO についての簡単なレビュー
オンプレミス HPC システムの TCO の広義の定義は、将来のシステムに関連するすべての直接経費と間接経費の合計額です。より明らかな経費は、ハードウェア、ソフトウェア、人員配置、電力です。ハードウェアとしては、サーバー、配線、ToR スイッチ、集約スイッチ、サーバーラック、配電ユニットなどが必要です。次に、複雑な問題を解決するために各ノード間の通信を調整するソフトウェアを購入する必要があります。さらに、使用する予定のソフトウェアのライセンスを購入する必要があります。非常に変動しやすく、見積もりが難しいリソースは、オンプレミス HPC システムの開発、展開、保守に必要な人員配置です。最後に、オンプレミスの HPC システムには多くの電力と冷却機能が必要です。エネルギー消費量と、それが運用コストにどのような影響を与えるかを計算することが重要です。上記の項目の費用を合計すると、オンプレミス HPC システムの基本的な TCO が求められます。ただし、オンプレミスシステムの TCO に大きな影響を与える可能性のある隠れたコストがいくつかあります。
現実世界の隠れたコスト
#1 HPC システムをホストする施設には、一見した以上に大きなコスト依存関係があります。。現在のシステムとその潜在的な拡張性をサポートするために必要な適切な冷却と電力設備が施設に確保されていることを確認すると、将来的に大幅な経費を節約できます。電力は大きな出費であり、全体の運用コストに非常に大きな影響を与える可能性があります。クラスターの場所と使用率に応じて、電力コストは大きく異なる可能性があります。所在地によっては電力料金が大きく変動する場合があり、費用を最小限に抑えるために HPC システムをどのように運用するかに大きな影響を与えます。場合によっては、電力が運営費の 1/3 以上になることもあります。設備とエネルギーは TCO を計算する際に考慮することが重要であり、大規模な設備の場合は最優先事項として考慮する必要があります。
#2 人員配置には想像以上のコストと変動があり、無視するとパフォーマンスと稼働時間が低下します。 最も変動しやすく、定義が難しい費用の 5 つは、オンプレミス HPC システムの人員配置です。 HPC システムの開発、展開、保守を実行できる優れた運用マネージャーおよび IT マネージャーを見つけ、雇用し、訓練することは非常に困難です。 HPC システムの設計には、コンピューティングの需要に最適なハードウェアとソフトウェアを適合させるために高価な専門家が必要です。システムの調達だけでも、HPC システム全体の 6% もの費用がかかる可能性があり、少なくとも XNUMX か月かかります。この間、クラスターを組み立てるためにスペシャリストに支払いを続ける必要がありますが、HPC システムに対する報酬は受け取れません。システムを導入すると、そのメンテナンスと運用を確保するために非常に特殊な IT スタッフが必要になります。これらの従業員は、HPC システムの寿命とパフォーマンスをテストして保護するための専門的なスキルを必要とします。これらの機能を実行する適切な従業員を見つけるのは面倒でコストがかかる場合がありますが、オンプレミス HPC システムの導入を検討する場合は最優先事項です。
#3 十分に活用されていない場合、アイドル時間だけでなく、関連するオーバーヘッドも大きくなります。 HPC システムがアイドル状態になると、ROI が低下するだけでなく、製品開発サイクルに壊滅的な影響を与える可能性があります。バックアップシステムは、HPC システムを稼働させるために必要な経費とはみなされないため、見落とされる可能性があります。ただし、それらを持たないと悲惨な結果が生じる可能性があります。システムを停電から確実に保護するには、発電機、スイッチ、ガス、バックアップエネルギーシステムのメンテナンスがすべて必要です。バックアップエネルギーの備えと同様に、バックアップハードウェアは HPC システムのアイドル状態を軽減するために非常に重要です。問題が発生した場合に備えて、予備のハードウェアを手元に用意しておくことが重要です。バックアップハードウェアがなければ、部品の修理または購入の間、システムはアイドル状態のままになる可能性があります。計画に失敗した場合は、失敗することを計画する必要があります。これは、オンプレミスの HPC システムを実行する場合に特に当てはまります。
#4 最後に、オンプレミステクノロジは絶えず困難を伴う (そして通常は負ける) 戦いです。。これは、最高のテクノロジーが利用されていないこと、そしてそれに追いつくために多大な努力と資本を費やさなければならないことによって引き起こされる害です。 HPC システムを比較するときは、コストと報酬、およびそれらが相互に与える影響を認識する必要があります。最高のテクノロジーを使用しないと、最高のシステムによって得られる報酬の喪失に起因する出費が発生する可能性があります。最適な HPC ソリューションを使用しないことに関連する費用は、生産性の低下、イノベーションの逃し、解決までの時間の長期化、テクノロジーの更新コスト、IT リスク管理、IT 負債とコミットメントの増加です。最も有害な剥奪された報酬は、研究パイプラインの非効率性であり、市場投入までの時間の増加、イノベーションの遅れ、研究者のアイドル時間の増加に関連して膨大な費用が発生します。 HPC テクノロジーの欠如は、より大きな問題を調査できなかったり、組織の競争力を低下させるイノベーションの欠落など、取り返しのつかない影響を組織にもたらす可能性があります。より優れた HPC ソリューションによってチームの効率がどの程度向上するかを評価し、それから逆算して非効率性と相関する費用を計算する必要があるため、これらの費用の計算は困難であることがよくあります。
要約すると、オンプレミス HPC システムの真の TCO を見つけることは、人員配置、設備、電力消費、バックアップの準備、報酬の剥奪など、すべての隠れたコストを考慮すると非常に困難であることがわかります。 HPC システムを比較する際に考慮すべき最も重要な費用の XNUMX つは、報酬の剥奪によって生じる費用であると私は主張します。ただし、これらは計算と予測が最も難しいことが判明しています。クラウド対応 HPC システムとオンプレミス HPC システムの TCO 比較というテーマは定期的に議論されていますが、まだ明確に定義されていません。この比較は私たちが改善に取り組んでいるものですので、このブログ投稿や TCO に関してコメントや質問がございましたら、ぜひご意見をお聞かせください。
サラ・ジーンズ。（2017年19月2日）。ハイパフォーマンスコンピューティング (HPC) のクラウドとデータセンターのコスト: 実際の例。取得元: https://www.internet14114.edu/blogs/detail/XNUMX
トニー・スパニョーロ。（2015年XNUMX月）。ハイパフォーマンスコンピューティングの実際のコスト。取得元: https://rescale.com/blog/the-real-cost-of-high-performance-computing/
ヴォルフガング・ゲンチェ。（2016年6月2016日）。社内コンピューティングリソースとクラウドコンピューティングのメーカー向けの総コスト分析。取得元: https://community.theubercloud.com/wp-content/uploads/04/XNUMX/TCO-Study-UberCloud.pdf

売上の再スケール

すべての投稿を見る

クッキー	演奏時間	説明
AWSALBCORS	7日	このCookieはアマゾンウェブサービスによって管理され、負荷分散に使用されます。
cookielawinfo-チェックボックス-広告	1年	GDPR Cookie Consentプラグインによって設定されたこのCookieは、「広告」カテゴリのCookieに対するユーザーの同意を記録するために使用されます。
cookielawinfo-チェックボックス-分析	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「分析」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-機能	11か月間	Cookieは、「機能」カテゴリのCookieに対するユーザーの同意を記録するためにGDPRCookieの同意によって設定されます。
cookielawinfo-checkbox-Necessary	11か月間	このCookieはGDPR Cookie Consentプラグインによって設定されます。 Cookieは、「必要」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-その他	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「その他」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-パフォーマンス	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「パフォーマンス」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
visible_cookie_policy	11か月間	CookieはGDPR Cookie Consentプラグインによって設定され、ユーザーがCookieの使用に同意したかどうかを保存するために使用されます。個人データは保存されません。

クッキー	演奏時間	説明
__cf_bm	30 minutes	Cloudflareによって設定されたこのCookieは、Cloudflareボット管理をサポートするために使用されます。
クッキー	2年	LinkedInは、ブラウザIDを認識するために、LinkedInの共有ボタンと広告タグからこのCookieを設定します。
長い	セッション	LinkedInは、ユーザーの言語設定を記憶するようにこのCookieを設定します。
LIDC	1日	LinkedInは、データセンターの選択を容易にするためにlidccookieを設定します。
プレイヤー	1年	Vimeo は、この Cookie を使用して、Vimeo から埋め込みビデオを再生するときにユーザーの設定を保存します。

クッキー	演奏時間	説明
AWSALB	7日	AWSALBは、セッションをターゲットにマッピングするためにアマゾンウェブサービスによって設定されるアプリケーションロードバランサーCookieです。
同期アクティブ	決して	この Cookie は Vimeo によって設定され、訪問者のビデオコンテンツの好みに関するデータが含まれているため、Web サイトは好みの音量やビデオ品質などのパラメータを記憶します。

クッキー	演奏時間	説明
_ga	2年	GoogleAnalyticsによってインストールされた_gacookieは、訪問者、セッション、およびキャンペーンデータを計算し、サイトの分析レポートのサイト使用状況を追跡します。 Cookieは情報を匿名で保存し、ランダムに生成された番号を割り当てて、一意の訪問者を認識します。
_gat_UA-32985745-1	1 minute	ウェブサイトの所有者が訪問者の行動を追跡し、サイトのパフォーマンスを測定できるようにするために、GoogleAnalyticsとGoogleTagManagerによって設定された_gatcookieのバリエーション。名前のpattern要素には、関連するアカウントまたはWebサイトの一意のID番号が含まれています。
_gcl_au	3か月間	Google Tag Managerによって提供され、サービスを使用するWebサイトの広告効率を実験します。
_gid	1日	GoogleAnalyticsによってインストールされた_gidcookieは、訪問者がWebサイトをどのように使用しているかに関する情報を格納すると同時に、Webサイトのパフォーマンスの分析レポートを作成します。収集されるデータには、訪問者の数、ソース、匿名でアクセスするページなどがあります。
同意	2年	YouTubeは、埋め込まれたyoutube-videosを介してこのCookieを設定し、匿名の統計データを登録します。
utm_キャンペーン	過去	Google 広告サービスは、セッションキャンペーン値が存在する場合、この Cookie を設定して保存します。
utm_content	過去	この Cookie は、セッションコンテンツの値を保存するために使用されます (存在する場合)。
utm_source	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
utm_term	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
vuid	2年	VimeoはこのCookieをインストールして、Webサイトにビデオを埋め込むための一意のIDを設定することにより、追跡情報を収集します。

クッキー	演奏時間	説明
_fbp	3か月間	このCookieは、Webサイトにアクセスした後、FacebookまたはFacebook広告を利用したデジタルプラットフォームのいずれかで広告を表示するようにFacebookによって設定されます。
_mkto_trk	2年	Marketo によって提供されるこの Cookie には、ユーザーのサイトの使用状況を追跡するために使用される情報 (一意のユーザー ID など) が含まれています。 Marketo によって設定された Cookie は、Marketo によってのみ読み取り可能です。
fr	3か月間	Facebookは、FacebookピクセルまたはFacebookソーシャルプラグインを備えたサイトで、Web全体のユーザーの行動を追跡することにより、ユーザーに関連する広告を表示するようにこのCookieを設定します。
IDE	1年24日	Google DoubleClick IDE Cookieは、ユーザーがWebサイトを使用して関連する広告を表示する方法に関する情報を、ユーザープロファイルに従って保存するために使用されます。
Personalization_id	2年	Twitter は、ソーシャルメディアの機能を統合および共有するためにこの Cookie を設定し、追跡とターゲティングのためにユーザーが Web サイトをどのように使用するかに関する情報も保存します。
test_cookie	15 minutes	test_cookieはdoubleclick.netによって設定され、ユーザーのブラウザがCookieをサポートしているかどうかを判断するために使用されます。
utm_medium	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
VISITOR_INFO1_LIVE	5月27日	ユーザーが新しいプレーヤーインターフェースを取得するか古いプレーヤーインターフェースを取得するかを決定する帯域幅を測定するためにYouTubeによって設定されるCookie。
YSC	セッション	YSC CookieはYoutubeによって設定され、Youtubeページに埋め込まれたビデオのビューを追跡するために使用されます。
yt-リモート接続デバイス	決して	YouTubeは、埋め込まれたYouTubeビデオを使用して、ユーザーのビデオ設定を保存するためにこのCookieを設定します。
yt-リモートデバイスID	決して	YouTubeは、埋め込まれたYouTubeビデオを使用して、ユーザーのビデオ設定を保存するためにこのCookieを設定します。
yt.innertube :: nextId	決して	YouTubeによって設定されたこのCookieは、ユーザーが見たYouTubeの動画に関するデータを保存するための一意のIDを登録します。
yt.innertube ::リクエスト	決して	YouTubeによって設定されたこのCookieは、ユーザーが見たYouTubeの動画に関するデータを保存するための一意のIDを登録します。

クッキー	演奏時間	説明
_chtbl	セッション	説明はありません。
_dtses	30 minutes	説明はありません。
_dtuid	10年	説明はありません。
BIGipServersj30web-nginx-app_https	セッション	全く説明しない
email	過去	説明はありません。
gclid	過去	全く説明しない
ハンドル ip	1月	説明はありません。
handle_landing_page	1月	説明はありません。
handle_original_ref	過去	説明はありません。
ハンドル参照	過去	説明はありません。
handle_url	1月	説明はありません。
li_gc	2年	全く説明しない
muc_ads	2年	全く説明しない
ユーザ名	過去	説明はありません。

Rescale プラットホーム

概要

HPC & AI ソフトウェア

HPC & AI アーキテクチャ

セキュリティ&コンプライアンス

エコシステム統合

価格（英語）

HPC as a Service

インテリジェントバッチ

エラスティック・クラウド・ワークステーション

ストレージ・ファブリック

エンタープライズ管理

チーム管理

パフォーマンス管理

持ち込みソフトウェアをクラウドで利用

デジタルエンジニアリング

AI の物理学

データ管理

計算パイプライン

著者

類似の投稿

ニュースレターの申込み