自分のストレージの持ち込み (パート 1)

Rescale プラットフォームは、主要なパブリッククラウドベンダーのストレージ製品を活用したエンドツーエンドのファイル管理を提供します。これには、最適化されたクライアント側の転送ツール、転送中および保存時の暗号化が含まれます。このモデルでは、Rescale がオブジェクトストアのレイアウトと暗号化キーの管理を制御します。復号化されたファイルのコンテンツを取得するには、ユーザーは Rescale ツールを使用する必要があります。これは、ゼロから始めて、完全に管理された安全なソリューションを探している場合には便利ですが、考えられるシナリオの XNUMX つは、すでにクラウドにアップロードされている入力データを使用してプラットフォームを使用する方法です。私たちが確認しているもう XNUMX つの使用例は、顧客が管理する保管場所にあるシミュレーション出力ファイルを直接操作する既存のデータパイプラインとの統合です。コストとパフォーマンスの理由から、コンピューティングをできるだけストレージの近くに配置することが重要です。 Rescale のプラットフォームの利点の XNUMX つは、さまざまなクラウドプロバイダーをサポートしており、すでに使用しているクラウドストレージアカウントにコンピューティングを提供できることです。
この投稿では、顧客がデフォルトの Rescale 管理ストレージを使用する代わりに、ユーザーが指定した場所から入出力ファイルを転送する方法を説明します。この例では、Amazon S3 に焦点を当てますが、同様のアプローチはどのプロバイダーでも使用できます。以下では、入力ファイルと出力ファイルが顧客が制御するバケットに存在する実験計画法ジョブのセットアップについて説明します。バケットの名前が「my-simulation-data」で、入力ファイルにはすべて「input」という接頭辞が付いており、パラメータースイープによって生成されたすべての出力ファイルは「output」という接頭辞が付いているパスにアップロードする必要があるとします。
この DOE は、HSDI および Pintle Injector のサンプルを実行します。コンバージCFD 弊社のサポートページ (https://support.rescale.com/customer/en/portal/articles/2579932-converge-examples）並行して。通常、DOE フレームワークは入力ファイル内の特定の数値を変更するために使用されますが、ここでは実行ごとにまったく異なる input.zip を選択するために使用します。
まず、コンバージ入力 zip (hsdi_fb_2mm.zip および pintle_injector.zip) を s3 の s3://my-simulation-data/input/ ディレクトリにアップロードします。
次に、次のような inputs.csv という名前のファイルをローカルに作成します。

s3_input,s3_output
s3://my-simulation-data/input/hsdi_fb_2mm.zip,s3://my-simulation-data/output/hsdi/
s3://my-simulation-data/input/pintle_injector.zip,s3://my-simulation-data/output/pintle/

Rescale コンピューティングノードにバケットへのアクセスを許可するには、入力ディレクトリへの読み取りアクセスと出力ディレクトリへのフルアクセスを提供する IAM ポリシーを作成する必要があります。

{ "バージョン": "2012-10-17", "ステートメント": [ { "効果": "許可", "アクション": [ "s3:Get*", "s3:List*" ], "リソース" : [ "arn:aws:s3:::my-simulation-data/input", "arn:aws:s3:::my-simulation-data/input/*" ] }, { "効果": "許可" 、「アクション」: [ "s3:*" ]、「リソース」: [ "arn:aws:s3:::my-simulation-data/output"、"arn:aws:s3:::my-simulation-data /output/*" ] } ] }

これを実現する別の方法は、クロスアカウントアクセスをセットアップすることです (https://docs.aws.amazon.com/IAM/latest/UserGuide/tutorial_cross-account-with-roles.html)。すべての計算ノードが AWS で実行される場合、これはアクセスを設定するための推奨される方法です。ただし、上記のアプローチは、計算ノードが実行されている場所に関係なく機能します。
次に、このポリシーを IAM ユーザーにアタッチし、アクセスキーと秘密キーを生成します。このアクセスキーと秘密キーは、ローカルファイルに保存する AWS 設定ファイルに配置する必要があります。

[デフォルト] aws_access_key_id=XXXXXXX aws_secret_access_key=XXXXXXXXX リージョン=us-east-1

上記を config というファイルに保存します。
ローカルで作成する必要がある最後のファイルは、実行スクリプトテンプレートです。実行ごとに実行されるシェルスクリプトテンプレートファイル内で、上で作成した inputs.csv から s3_input 変数と s3_output 変数を参照します。次のような run.sh.template というファイルを作成します。

#!/bin/bash export AWS_CONFIG_FILE=config aws s3 cp ${s3_input} 。 *.zip を解凍して aws s3 cp を収束します。 ${s3_output} --recursive --exclude config rm -rf *

上記のスクリプトには、いくつか注意すべき点があります。通常、Rescale プラットフォームは zip ファイルを自動的に解凍しますが、この場合、入力に対して Rescale ストレージをバイパスしているため、それを自分で処理する必要があります。スクリプトの最後にある rm -rf * は、ユーザーが指定した S3 の場所に出力ファイルをアップロードした後、すべての出力ファイルを削除します。この手順を省略すると、スクリプトの終了後に出力ファイルも Rescale ストレージにアップロードされます。
必要なファイルがローカルに作成されたので、それらを参照する新しい DOE ジョブをプラットフォーム上で構成できます。から新しい求人ページ、ジョブタイプを DOE に変更し、次のようにジョブを構成します。

入力ファイル: 構成のアップロード
並列設定: 「実行定義ファイルを使用する」を選択し、input.csv をアップロードします。
テンプレート: run.sh.template をアップロードします。テンプレート名として run.sh を使用します
ソフトウェア: converge 2.3.X を選択し、コマンドを run.sh に設定します。
ハードウェア: Onyx、スロットあたり 8 コア、2 タスクスロット

ジョブを送信します。ジョブが完了すると、すべての出力ファイルが s3://my-simulation-data/output/hsdi/ ディレクトリと s3://my-simulation-data/output/pintle/ ディレクトリに表示されます。
この DOE セットアップでは、補助セットアップデータ (例: AWS 設定ファイル、csv ファイル、実行スクリプトテンプレート) が暗号化され、Rescale が管理するストレージに保存されます。ジョブの本質である入力ファイルと出力ファイルは、ユーザー指定のバケットに保存されます。
上記のセットアップを構成するには、多少の手動作業が必要であることは認識しています。私たちのロードマップの XNUMX つは、お客様が提供するストレージアカウントとの統合を強化することです。詳細については続報をお待ちください！

ライアン・カネシロ

すべての投稿を見る

類似の投稿

英語

ビジネスの成長に合わせて Django アプリを進化させる

アーウェン・ソング 2016 年 2 月 11 日2023 年 1 月 25 日

Django を使用して最初の Web アプリケーションのプロトタイピングを開始するときは、常に XNUMX つの Django アプリを作成し、すべてのモデルをその中に入れる傾向があります。

英語

すべてのクラウド: ユニバーサルワークスペース

ロバート・コンビエ２０２２年７月１１日2023 年 3 月 7 日

「多くの手が軽い仕事をする」は、ジョン・ヘイウッドがこの言葉を初めて作った 16 世紀と同じように、今日でも当てはまります。歴史的な…

英語

クラウドの計算能力を最大限に活用する上でのソフトウェアの重要な役割

Mulyanto Poort 2014 年 6 月 23 日2023 年 3 月 22 日

エンジニアリング上の大規模な問題を解決するための並列パフォーマンスのスケーラビリティに関しては、ハードウェアに重点が置かれています。大規模なパーティション化された CFD を配布する場合、または…

英語

石油とガス: 掘削シナリオにおける音響放出解析

イレア・グレーデル 2013 年 10 月 21 日2023 年 10 月 25 日

はじめに大規模で要求の厳しい石油・ガス田では、貯留層のモデリングから掘削への応用、天然ガス抽出に至るまで、あらゆるものについて大規模で計算量の多いシミュレーションが必要です。追加…

英語 | 思考のリーダーシップ

クラウド: HPC における次の破壊

ロバート・コンビエ 2017 年 8 月 11 日2023 年 1 月 25 日

1991 年に私は Cray に入社し、Seymour Cray が設計したマシンに取り組む機会がありました。私はオペレーティングシステムの開発に取り組んでいたのですが…

英語

Rescale で R を使用して PageRank をスケーリングする

ロバート・コンビエ 2014 年 1 月 21 日2023 年 3 月 7 日

ここ数年にわたるデータ駆動型アプリケーションの急増により、多くのアプリケーションが巨大なデータセットの高度な分析に依存するようになりました。その間…

クッキー	演奏時間	説明
AWSALBCORS	7日	このCookieはアマゾンウェブサービスによって管理され、負荷分散に使用されます。
cookielawinfo-チェックボックス-広告	1年	GDPR Cookie Consentプラグインによって設定されたこのCookieは、「広告」カテゴリのCookieに対するユーザーの同意を記録するために使用されます。
cookielawinfo-チェックボックス-分析	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「分析」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-機能	11か月間	Cookieは、「機能」カテゴリのCookieに対するユーザーの同意を記録するためにGDPRCookieの同意によって設定されます。
cookielawinfo-checkbox-Necessary	11か月間	このCookieはGDPR Cookie Consentプラグインによって設定されます。 Cookieは、「必要」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-その他	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「その他」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-パフォーマンス	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「パフォーマンス」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
visible_cookie_policy	11か月間	CookieはGDPR Cookie Consentプラグインによって設定され、ユーザーがCookieの使用に同意したかどうかを保存するために使用されます。個人データは保存されません。

クッキー	演奏時間	説明
__cf_bm	30 minutes	Cloudflareによって設定されたこのCookieは、Cloudflareボット管理をサポートするために使用されます。
クッキー	2年	LinkedInは、ブラウザIDを認識するために、LinkedInの共有ボタンと広告タグからこのCookieを設定します。
長い	セッション	LinkedInは、ユーザーの言語設定を記憶するようにこのCookieを設定します。
LIDC	1日	LinkedInは、データセンターの選択を容易にするためにlidccookieを設定します。
プレイヤー	1年	Vimeo は、この Cookie を使用して、Vimeo から埋め込みビデオを再生するときにユーザーの設定を保存します。

クッキー	演奏時間	説明
AWSALB	7日	AWSALBは、セッションをターゲットにマッピングするためにアマゾンウェブサービスによって設定されるアプリケーションロードバランサーCookieです。
同期アクティブ	決して	この Cookie は Vimeo によって設定され、訪問者のビデオコンテンツの好みに関するデータが含まれているため、Web サイトは好みの音量やビデオ品質などのパラメータを記憶します。

クッキー	演奏時間	説明
_ga	2年	GoogleAnalyticsによってインストールされた_gacookieは、訪問者、セッション、およびキャンペーンデータを計算し、サイトの分析レポートのサイト使用状況を追跡します。 Cookieは情報を匿名で保存し、ランダムに生成された番号を割り当てて、一意の訪問者を認識します。
_gat_UA-32985745-1	1 minute	ウェブサイトの所有者が訪問者の行動を追跡し、サイトのパフォーマンスを測定できるようにするために、GoogleAnalyticsとGoogleTagManagerによって設定された_gatcookieのバリエーション。名前のpattern要素には、関連するアカウントまたはWebサイトの一意のID番号が含まれています。
_gcl_au	3か月間	Google Tag Managerによって提供され、サービスを使用するWebサイトの広告効率を実験します。
_gid	1日	GoogleAnalyticsによってインストールされた_gidcookieは、訪問者がWebサイトをどのように使用しているかに関する情報を格納すると同時に、Webサイトのパフォーマンスの分析レポートを作成します。収集されるデータには、訪問者の数、ソース、匿名でアクセスするページなどがあります。
同意	2年	YouTubeは、埋め込まれたyoutube-videosを介してこのCookieを設定し、匿名の統計データを登録します。
utm_キャンペーン	過去	Google 広告サービスは、セッションキャンペーン値が存在する場合、この Cookie を設定して保存します。
utm_content	過去	この Cookie は、セッションコンテンツの値を保存するために使用されます (存在する場合)。
utm_source	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
utm_term	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
vuid	2年	VimeoはこのCookieをインストールして、Webサイトにビデオを埋め込むための一意のIDを設定することにより、追跡情報を収集します。

クッキー	演奏時間	説明
_fbp	3か月間	このCookieは、Webサイトにアクセスした後、FacebookまたはFacebook広告を利用したデジタルプラットフォームのいずれかで広告を表示するようにFacebookによって設定されます。
_mkto_trk	2年	Marketo によって提供されるこの Cookie には、ユーザーのサイトの使用状況を追跡するために使用される情報 (一意のユーザー ID など) が含まれています。 Marketo によって設定された Cookie は、Marketo によってのみ読み取り可能です。
fr	3か月間	Facebookは、FacebookピクセルまたはFacebookソーシャルプラグインを備えたサイトで、Web全体のユーザーの行動を追跡することにより、ユーザーに関連する広告を表示するようにこのCookieを設定します。
IDE	1年24日	Google DoubleClick IDE Cookieは、ユーザーがWebサイトを使用して関連する広告を表示する方法に関する情報を、ユーザープロファイルに従って保存するために使用されます。
Personalization_id	2年	Twitter は、ソーシャルメディアの機能を統合および共有するためにこの Cookie を設定し、追跡とターゲティングのためにユーザーが Web サイトをどのように使用するかに関する情報も保存します。
test_cookie	15 minutes	test_cookieはdoubleclick.netによって設定され、ユーザーのブラウザがCookieをサポートしているかどうかを判断するために使用されます。
utm_medium	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
VISITOR_INFO1_LIVE	5月27日	ユーザーが新しいプレーヤーインターフェースを取得するか古いプレーヤーインターフェースを取得するかを決定する帯域幅を測定するためにYouTubeによって設定されるCookie。
YSC	セッション	YSC CookieはYoutubeによって設定され、Youtubeページに埋め込まれたビデオのビューを追跡するために使用されます。
yt-リモート接続デバイス	決して	YouTubeは、埋め込まれたYouTubeビデオを使用して、ユーザーのビデオ設定を保存するためにこのCookieを設定します。
yt-リモートデバイスID	決して	YouTubeは、埋め込まれたYouTubeビデオを使用して、ユーザーのビデオ設定を保存するためにこのCookieを設定します。
yt.innertube :: nextId	決して	YouTubeによって設定されたこのCookieは、ユーザーが見たYouTubeの動画に関するデータを保存するための一意のIDを登録します。
yt.innertube ::リクエスト	決して	YouTubeによって設定されたこのCookieは、ユーザーが見たYouTubeの動画に関するデータを保存するための一意のIDを登録します。

クッキー	演奏時間	説明
_chtbl	セッション	説明はありません。
_dtses	30 minutes	説明はありません。
_dtuid	10年	説明はありません。
BIGipServersj30web-nginx-app_https	セッション	全く説明しない
email	過去	説明はありません。
gclid	過去	全く説明しない
ハンドル ip	1月	説明はありません。
handle_landing_page	1月	説明はありません。
handle_original_ref	過去	説明はありません。
ハンドル参照	過去	説明はありません。
handle_url	1月	説明はありません。
li_gc	2年	全く説明しない
muc_ads	2年	全く説明しない
ユーザ名	過去	説明はありません。

Rescale プラットホーム

概要

HPC & AI ソフトウェア

HPC & AI アーキテクチャ

セキュリティ&コンプライアンス

エコシステム統合

価格（英語）

HPC as a Service

インテリジェントバッチ

エラスティック・クラウド・ワークステーション

ストレージ・ファブリック

エンタープライズ管理

チーム管理

パフォーマンス管理

持ち込みソフトウェアをクラウドで利用

デジタルエンジニアリング

AI の物理学

データ管理

計算パイプライン

著者