| |

分離不安: クラスターから離れています


気を散らすもの、騒音、子供たち、中断。 すべては現代の経験の一部であるように思えます。 ここ Rescale では、他の企業と同様に、67 日間にわたり在宅勤務が続いています。 それが難しい理由は無数にあります。 ただし、クラスターへのアクセスや、業務を遂行するために必要なソフトウェア ライセンスは、その中に含まれるべきではないと私たちは強く感じています。
残念ながら、これがほとんどの企業の現実のようです。 実際、アクセンチュアによれば、 企業のわずか10% このような状況に備えた包括的な計画とリソースを用意してください。 現実には、私たちの残りの人々は石畳みの分散作業環境から立ち往生しています。 これには、アクセスできないワークステーションに関連付けられたソフトウェア ライセンス、従業員の 10 ~ 15% のみをサポートするように設計された VPN、遅いネットワーク相互接続速度、壊れたエンジニアリング ワークフロー、不十分なホーム コンピューティングなど、多くの苦痛が伴います。
残念ながら、これは一般的に生産性の広範な低下につながります。 厳しいマクロ経済状況では、ほとんどの企業はこの下落に耐えることができません。 こうしたプレッシャーが重なり、悲惨な状況が生じます。 分散したチームが効率的に作業するためのソリューションがなければ、企業は負のスパイラルに陥る危険があります。
次世代の科学、工学、テクノロジーを可能にするために構築されたインフラストラクチャは、主にオフィスから行われることを前提として構築されました。 では、次世代のインフラとはどのようなものなのでしょうか? 企業は新しい環境を実現するためにどのように投資していますか?
VPN の強化
多くの企業は、ユーザーが自社のクラスター、場合によっては仮想デスクトップなどにリモート アクセスできるように設計された VPN をすでに導入しています。 問題? ほとんどの企業 会社の従業員のごく一部を一度に処理できるように VPN を構成しました。
私たちが話を聞いた多くの企業は、数百の同時接続のサポートの追加、ネットワーク I/O の改善など、VPN の改善を展開する計画を立てています。 ただし、このような多層的なプロセスには時間がかかります。 そのため、それまでの間、IT チームがグループに VPN へのアクセスを許可する特定のスケジュール時間を割り当てていることがわかります。

「午前 9 時から 9 時 30 分と午後 1 時から 1 時 30 分まで、クラスターにアクセスし、必要なデータをダウンロードまたはアップロードしたり、ジョブを送信したりすることができます。 この期間を逃した場合は、次のステップに進むためにさらに XNUMX 日待たなければなりません。 それは大きな時間の無駄です」と私たちが話をしたあるエンジニアは言いました。
これは、この問題を一度に XNUMX つずつ解決するための戦略かもしれませんが、平均的なエ​​ンジニアが作業方法の改善を実感できるまでには数か月かかるでしょう。
コンピューティング集約型のジョブをサードパーティに送信する
生産性を維持するのに十分な速度でネットワークへのアクセスを迅速に向上させることができないとプレッシャーを感じている企業は、別の選択肢であるアウトソーシングに目を向けています。
これらの企業は、データ センターへのアクセスが良好な独立系企業を利用し、シミュレーションやその他の高コンピューティング ワークロードを完了するよう依頼します。 サードパーティが正確に適切なソフトウェア、バージョンでシミュレーションを実行でき、利用可能な容量がある場合、独自のインフラストラクチャ内では実行できない場合に、ジョブを実行するための実行可能なオプションとなる可能性があります。
ただし、別の環境での作業にはいくつかのリスクが伴います。 IT チームは、厳格で目に見える制御を行わずに複数の環境を管理するときに、一般的に問題に遭遇します。
当社の顧客の XNUMX 人は、XNUMX つの環境での作業について次のような話をしてくれました。「XNUMX つのサイトでは、同じソフトウェアの異なるバージョンでシミュレーションを実行しました。 ケーブルの伸びについては、それぞれ若干異なる計算が行われていました。 最終的な飛行機を組み立てる段階になったとき、XNUMX つのバージョンのケーブルはすべて約 XNUMX インチ短すぎました。 これによりプロジェクトが XNUMX 年遅れました。」
信頼できるパートナーと非常に明確な可視性を備えたアウトソーシングは理にかなっていますが、私たちの経験から言えば、人を介して環境を管理することは、大きな遅延につながる可能性のあるミスの温床となります。
パブリック クラウドにクラスターをデプロイする
前述のソリューションのタイムラインとリスクを認識して、私たちが話を聞いた一部の企業は、特定のワークロードをパブリック クラウド インフラストラクチャに移行することを選択しました。 このオプションは、コンピューティング スケール、特殊なハードウェア、および接続における柔軟性を提供します。 基本的に、企業にはチームが必要とするだけのリソースを作成する機会があります。 拡張機能が組み込まれており、オンデマンドで提供されます。
パブリック クラウド インスタンスを導入する際に企業が直面する主な課題は、本質的に運用に関するものです。 このソリューションは、IT やシステム インテグレーターなどに完全に依存しています。 この設計と管理は通常、予想よりも大規模な作業になります。
高品質のクラウド導入では、チームやプロジェクトの個別の予算を制御、レポート、管理できる必要があります。 ライセンスのホスティングとジョブの割り当てに対処する必要があります。 リソースを最大限に活用するには、特定のジョブに最適なハードウェアを賢く選択する必要があります。 クラスターが不要な場合は、クラスターをインテリジェントに強制終了する必要があります。 IT 部門が四半期の終わりに突然の請求を受けないように、制限を設けて構築する必要があります。
システムがこれらすべての問題に対処している場合でも、規制要件により、特定の種類の情報を処理できない場合があります。 このシステムは ITAR、FedRAMP、さらには SOC II にも準拠していないため、特定の機密性の高いワークロードにはオプションではありません。
マネージド プラットフォームへの投資
マネージド プラットフォームを使用すると、企業は、存在するすべての運用上およびコンプライアンス上の問題を解決しながら、必要に応じてクラウド プラクティスのメリットを得ることができます。 これらのシステムは、実際には分散チームを有効にすることを目的として構築されたものではありませんが、チームの分散に依存せずに構築された唯一のシステムを表しています。
クラウド リソース上に構築されているというその性質上、アクセスは本質的にリモートであるため、今日私たちが置かれているような状況に対して堅牢であり、物事が新しい常態に戻ったときにも同様に役立ちます。
具体的には、Rescale は、企業が今日直面している課題に対していくつかの独自のアプローチを提供します。

  1. 予算管理 – Rescale は、チームがクラウド内のリソースをセルフサービスできるように構築されています。 これは、オンデマンドでスケールできるように調整されていることを意味します。 これが組織内で実際に機能するためには、管理者が特定のハード予算とソフト予算を設定し、支出を割り当て、場合によっては分割請求を行う機能も必要です。 これは Rescale のネイティブ機能であり、リソースの割り当ては数回クリックするだけで簡単に行えます。
  2. アクセス管理 – チームはクラスターとシステムに保存されているデータにアクセスできる必要があります。 Rescale のユーザー アクセスの一元管理により、安全かつ制御された方法でユーザーが必要なリソースに簡単にアクセスできるようになります。
  3. ソフトウェアライセンス管理 – Rescale は、既存のライセンスを持ち込んだり、新しいライセンスを購入したり、場合によってはオンデマンド ライセンスを購入したりするオプションを備えており、現在の状況に関係なく、チームの立ち上げと運営を支援するさまざまな方法を提供します。 2,000 を超えるソフトウェア バージョンがすでに利用可能でインストールされており、ライセンス キー XNUMX つでジョブを実行できます。 このシステムでは、環境間のバージョンの不一致を回避するために、バージョンを集中管理することもできます。
  4. セキュリティとデータ管理 – クラウド HPC に関しては、Rescale が最も安全なオプションです。 ITAR、FedRAMP、および SOC II に準拠しているため、Rescale は初日から強固なセキュリティを備えて構築されています。 そのシステムは最先端の暗号化とデータ管理保護を使用しています。 さらに、Rescale は管理者に制御を与え、ユーザーがアクセスすべきデータへのアクセス許可のみを持つようにします。
  5. アーキテクチャ管理 – Rescale は、すべてのパブリック クラウド上でクラスターを起動して停止できるシステムを開発しただけでなく、場所に関係なく最適なハードウェアを推奨する機能も備えています。 Rescale は、システム内のすべてのコア タイプの速度と堅牢性を認識しており、ユーザーが必要とする最高のコスト、パフォーマンス、拡張性を提供するハードウェア タイプをユーザーに案内できます。数百万のコア、数百のコア タイプが、顧客のニーズにインテリジェントにマッピングされています。

2020 年は、私たちのシステムとチームが究極のテストにさらされる年として永遠に続きます。 システムに関する今後のすべての議論は、テクノロジーがユーザーに力を与え、ユーザーを制限しないことを保証するために、パンデミックに対応する必要があります。 新型コロナウイルス感染症 (COVID-19) の影響で、HPC はどのように変化すると思いますか?
リモートチームを最適化する方法をお探しですか? ウェビナーに参加して詳細を学び、実際のエンジニアから適用可能なソリューションを聞いてください。 詳細はこちらです。

類似の投稿