Rescale: データの課題を最小限に抑える

クラウドで HPC を実行する場合、エンジニアや科学者が対処しなければならないワークフロータスクの XNUMX つは、大量のデータの処理です。エンジニアがよく尋ねる質問は、「どのようなデータが私にとって有益でしょうか? それを機能的な形式でどのように表示できるでしょうか?」です。すべてのデータをクラウドに保存する場合、データの生成から実際にデータを使用できるようになるまでの時間を最小限に抑えることが重要です。単にギガバイトのデータをダウンロードすることは、推奨または最も効率的な方法ではありません。
もちろん、アプリケーションが異なれば、目指す目標も異なります。エンジニアは、すべての出力データをローカルに保存してすぐにアクセスできるようにしたい場合があります。また、クラウドはプロジェクトのデータを保存するのに便利な方法であることが判明し、エンジニアはいつでも数か月前に実行されたジョブのサブセットをダウンロードできます。ただし、HPC ジョブの所要時間は非常に重要です。データ集約型のジョブの所要時間を最小限に抑える方法がいくつかあります。以下は、Rescale の顧客がデータの処理方法を最適化することで時間を最小限に抑える実際の方法をいくつか示しています。
LS-DYNA プレ/ポスト
LS-DYNA ジョブは大規模なデータ出力を生成する可能性があります。ジョブによってどのようなデータが生成されるかはユーザー次第です。実行によってハードドライブに書き込まれる頻度と、書き込まれるデータはユーザーが設定できます。ただし、平均的なエンジニアは、どのようなデータが必要になるかを 100% 確信しているわけではありませんが、最終的に何を使用するかについては十分に理解していると考えています。このエンジニアは、できる限り多くのデータをバイナリファイルに保存することを決定し、Rescale の便利なラッパースクリプトを使用して LS-DYNA ジョブを実行する方法を知っています。

ls-dyna -n -s ; -i -p

ただし、エンジニアは、Rescale の組み込みコマンドライン後処理オプションを使用し、「-d」フラグを使用して入力ファイルを XNUMX つの .db ファイルに後処理することで、ダウンロード帯域幅を節約しています。

ls-dyna -n 16 -s 4 -i big-model.k -p single -d create_postdb.inp

彼はおそらく必要となる情報 (変位、塑性ひずみ、フォンミーゼス応力、厚さ) を知っているため、create_postdb.inp ファイルは次のようになります。

d3plot Output.db state_on = 10、20、30、40、50、60、70、80、90、100 変位 Plastic_strain von_mises_stress 厚さ

エンジニアは、必要な情報がすべて含まれているoutput.dbをダウンロードするだけで済みます。つまり、35 GB のデータの代わりに、単一の 1 GB ファイルをダウンロードしていることになります。ファイルをダウンロードするのに XNUMX 時間半待つのではなく、必要なデータをすべてダウンロードするのにかかる時間はわずか数分に短縮されます。
クラスター上の後処理
別のエンジニアが実行中コンバージCFD。彼女の仕事はちょうど完了し、40 GB のデータが生成されました。幸いなことに、彼女は Rescale 設定ページで ssh 認証情報を設定しました。

彼女は公開キー (Rescale がすべての Rescale ノードに設定したもの) を入力し、ノードがネットワークからのみアクセスできるように CIDR ルールを設定しました。ジョブログには、クラスターへの接続方法が通知されています。

彼女は、ターミナルにコマンドをコピーして貼り付けるか、Windows で putty を使用することで、簡単にクラスターに ssh 接続できるようになりました。ノードにログインすると、次のコマンドを実行するだけです。

post_convert

これにより、Converge CFD の便利な後処理ツールが起動し、選択したデータセットを Tecplot、Ensight、またはその他のプロット可能な形式に変換できるようになります。彼女は scp または sftp を使用して、これらの小さなプロットファイルをローカルハードドライブにダウンロードできるようになりました。
すべてのデータのダウンロードについて「同期」したくない
最初のエンジニアは Rescale で多くのジョブを実行していますが、毎朝オフィスに来ると、多くのジョブが一晩で完了していることに気づきました。幸いなことに、彼はすべての出力ファイルを手動でダウンロードする代わりに、Rescale の便利な Java ベースのコマンドラインユーティリティを実行して、ジョブが終了するたびにファイルをハードドライブにダウンロードしました。
Rescale から API キーをリクエストした後、彼は次の簡単なコマンドを使用して、職場のコンピューターからコマンドラインユーティリティを起動しました。

java -jar rescale.jar sync -p abcdef1234567890 -d 600

このコマンドは Rescale の API を使用して、新しく完了したジョブがあるかどうかを 10 分ごとにチェックします。存在する場合、Rescale はファイルをローカルドライブに自動的にダウンロードします。コマンドラインユーティリティは、出力データを効率的にダウンロードして復号化 (マルチスレッド) します。そのため、エンジニアが眠っている間、彼の社内ネットワークは、彼が次の日をより生産的に過ごせるように、完了したすべてのジョブを職場のコンピュータにダウンロードする作業に熱心に取り組んでいました。
近日提供予定: GUI ベースの後処理
11 人目のエンジニアはすでに ssh 経由の XXNUMX 転送を使用して、クラウドで基本的な GUI ベースの後処理を実行できますが、パフォーマンスが向上すれば非常に便利になると考えています。幸いなことに、Rescale は GUI ベースの後処理を実行するためのリモートデスクトップソリューションに積極的に取り組んでいるため、彼女は長く待つ必要はありません。
データを賢く扱う
クラウド内のデータに関して言えば、肝心なのは、自由に使えるツールを可能な限り効率的に使用することです。使いやすいコマンドライン後処理ツールを提供するソフトウェアは、LS-DYNA と Converge CFD だけではありません。 Rescale で利用できる他の多くのツールは、これと同じ機能を提供します。
「クラウドで何が行われ、ローカルで何が行われるのか?」という問題。 Rescale が既存のエンジニアリングプロセスにどのように最適に適合するかを判断することによってのみ答えが得られます。すべてのデータをオンプレミスに置きながら、すべての後処理もオンプレミスで行うと便利な場合があります。ただし、両方のエンジニアリングケースで実証されているように、多くの場合、このエンジニアリング作業の多くをクラウドに移行できます。
このため、Rescale の目標は、データの処理の問題を可能な限り最小限に抑えるために必要なツールをすべて提供することです。

Mulyanto Poort

HPC の副社長 Mulyanto は、Rescale でアプリケーションエンジニアリングを担当しています。 Rescale に入社する前、Mulyanto は Mid-Michigan Research, LLC でソフトウェア開発および機械エンジニアとして XNUMX 年間勤務し、大手エンジン製造会社および自動車サプライヤー企業に対して専門的な研究コンサルティングを行っていました。 Mulyanto は以前、ミシガン州立大学で研究スペシャリストとしてカスタムデータと画像分析ツールの開発に注力していました。 Mulyanto は、ミシガン州立大学で機械工学の学士号と修士号を取得しています。

すべての投稿を見る

クッキー	演奏時間	説明
AWSALBCORS	7日	このCookieはアマゾンウェブサービスによって管理され、負荷分散に使用されます。
cookielawinfo-チェックボックス-広告	1年	GDPR Cookie Consentプラグインによって設定されたこのCookieは、「広告」カテゴリのCookieに対するユーザーの同意を記録するために使用されます。
cookielawinfo-チェックボックス-分析	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「分析」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-機能	11か月間	Cookieは、「機能」カテゴリのCookieに対するユーザーの同意を記録するためにGDPRCookieの同意によって設定されます。
cookielawinfo-checkbox-Necessary	11か月間	このCookieはGDPR Cookie Consentプラグインによって設定されます。 Cookieは、「必要」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-その他	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「その他」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-パフォーマンス	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「パフォーマンス」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
visible_cookie_policy	11か月間	CookieはGDPR Cookie Consentプラグインによって設定され、ユーザーがCookieの使用に同意したかどうかを保存するために使用されます。個人データは保存されません。

クッキー	演奏時間	説明
__cf_bm	30 minutes	Cloudflareによって設定されたこのCookieは、Cloudflareボット管理をサポートするために使用されます。
クッキー	2年	LinkedInは、ブラウザIDを認識するために、LinkedInの共有ボタンと広告タグからこのCookieを設定します。
長い	セッション	LinkedInは、ユーザーの言語設定を記憶するようにこのCookieを設定します。
LIDC	1日	LinkedInは、データセンターの選択を容易にするためにlidccookieを設定します。
プレイヤー	1年	Vimeo は、この Cookie を使用して、Vimeo から埋め込みビデオを再生するときにユーザーの設定を保存します。

クッキー	演奏時間	説明
AWSALB	7日	AWSALBは、セッションをターゲットにマッピングするためにアマゾンウェブサービスによって設定されるアプリケーションロードバランサーCookieです。
同期アクティブ	決して	この Cookie は Vimeo によって設定され、訪問者のビデオコンテンツの好みに関するデータが含まれているため、Web サイトは好みの音量やビデオ品質などのパラメータを記憶します。

クッキー	演奏時間	説明
_ga	2年	GoogleAnalyticsによってインストールされた_gacookieは、訪問者、セッション、およびキャンペーンデータを計算し、サイトの分析レポートのサイト使用状況を追跡します。 Cookieは情報を匿名で保存し、ランダムに生成された番号を割り当てて、一意の訪問者を認識します。
_gat_UA-32985745-1	1 minute	ウェブサイトの所有者が訪問者の行動を追跡し、サイトのパフォーマンスを測定できるようにするために、GoogleAnalyticsとGoogleTagManagerによって設定された_gatcookieのバリエーション。名前のpattern要素には、関連するアカウントまたはWebサイトの一意のID番号が含まれています。
_gcl_au	3か月間	Google Tag Managerによって提供され、サービスを使用するWebサイトの広告効率を実験します。
_gid	1日	GoogleAnalyticsによってインストールされた_gidcookieは、訪問者がWebサイトをどのように使用しているかに関する情報を格納すると同時に、Webサイトのパフォーマンスの分析レポートを作成します。収集されるデータには、訪問者の数、ソース、匿名でアクセスするページなどがあります。
同意	2年	YouTubeは、埋め込まれたyoutube-videosを介してこのCookieを設定し、匿名の統計データを登録します。
utm_キャンペーン	過去	Google 広告サービスは、セッションキャンペーン値が存在する場合、この Cookie を設定して保存します。
utm_content	過去	この Cookie は、セッションコンテンツの値を保存するために使用されます (存在する場合)。
utm_source	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
utm_term	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
vuid	2年	VimeoはこのCookieをインストールして、Webサイトにビデオを埋め込むための一意のIDを設定することにより、追跡情報を収集します。

クッキー	演奏時間	説明
_fbp	3か月間	このCookieは、Webサイトにアクセスした後、FacebookまたはFacebook広告を利用したデジタルプラットフォームのいずれかで広告を表示するようにFacebookによって設定されます。
_mkto_trk	2年	Marketo によって提供されるこの Cookie には、ユーザーのサイトの使用状況を追跡するために使用される情報 (一意のユーザー ID など) が含まれています。 Marketo によって設定された Cookie は、Marketo によってのみ読み取り可能です。
fr	3か月間	Facebookは、FacebookピクセルまたはFacebookソーシャルプラグインを備えたサイトで、Web全体のユーザーの行動を追跡することにより、ユーザーに関連する広告を表示するようにこのCookieを設定します。
IDE	1年24日	Google DoubleClick IDE Cookieは、ユーザーがWebサイトを使用して関連する広告を表示する方法に関する情報を、ユーザープロファイルに従って保存するために使用されます。
Personalization_id	2年	Twitter は、ソーシャルメディアの機能を統合および共有するためにこの Cookie を設定し、追跡とターゲティングのためにユーザーが Web サイトをどのように使用するかに関する情報も保存します。
test_cookie	15 minutes	test_cookieはdoubleclick.netによって設定され、ユーザーのブラウザがCookieをサポートしているかどうかを判断するために使用されます。
utm_medium	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
VISITOR_INFO1_LIVE	5月27日	ユーザーが新しいプレーヤーインターフェースを取得するか古いプレーヤーインターフェースを取得するかを決定する帯域幅を測定するためにYouTubeによって設定されるCookie。
YSC	セッション	YSC CookieはYoutubeによって設定され、Youtubeページに埋め込まれたビデオのビューを追跡するために使用されます。
yt-リモート接続デバイス	決して	YouTubeは、埋め込まれたYouTubeビデオを使用して、ユーザーのビデオ設定を保存するためにこのCookieを設定します。
yt-リモートデバイスID	決して	YouTubeは、埋め込まれたYouTubeビデオを使用して、ユーザーのビデオ設定を保存するためにこのCookieを設定します。
yt.innertube :: nextId	決して	YouTubeによって設定されたこのCookieは、ユーザーが見たYouTubeの動画に関するデータを保存するための一意のIDを登録します。
yt.innertube ::リクエスト	決して	YouTubeによって設定されたこのCookieは、ユーザーが見たYouTubeの動画に関するデータを保存するための一意のIDを登録します。

クッキー	演奏時間	説明
_chtbl	セッション	説明はありません。
_dtses	30 minutes	説明はありません。
_dtuid	10年	説明はありません。
BIGipServersj30web-nginx-app_https	セッション	全く説明しない
email	過去	説明はありません。
gclid	過去	全く説明しない
ハンドル ip	1月	説明はありません。
handle_landing_page	1月	説明はありません。
handle_original_ref	過去	説明はありません。
ハンドル参照	過去	説明はありません。
handle_url	1月	説明はありません。
li_gc	2年	全く説明しない
muc_ads	2年	全く説明しない
ユーザ名	過去	説明はありません。

Rescale プラットホーム

概要

HPC & AI ソフトウェア

HPC & AI アーキテクチャ

セキュリティ&コンプライアンス

エコシステム統合

価格（英語）

HPC as a Service

インテリジェントバッチ

エラスティック・クラウド・ワークステーション

ストレージ・ファブリック

エンタープライズ管理

チーム管理

パフォーマンス管理

持ち込みソフトウェアをクラウドで利用

デジタルエンジニアリング

AI の物理学

データ管理

計算パイプライン

著者

類似の投稿

ニュースレターの申込み