|

Rescale での NVIDIA Tesla V100 ベンチマーク結果

Rescale は、NVIDIA の最新かつ最先端の GPU を追加しました。 テスラ V100、 ScaleXプラットフォームへ。 これは、最新の Volta アーキテクチャに基づいた NVIDIA の最初の GPU です。 13 年 2017 月 100 日以降、すべてのプラットフォーム ユーザーは ScaleX 標準バッチ ワークフローの一部として VXNUMX を選択できるようになります。
ディープラーニング向けに最適化
Rescale の V100 搭載システムには 1、4、または 8 個の V100 GPU が搭載されており、すべて 300GB/秒の NVLink インターコネクトで接続されています。 V100 Volta アーキテクチャは、ディープ ラーニング用に調整された半精度 Tensor コアを備えたディープ ラーニング ワークロード向けに最適化されています。 これらのシステムは、次の図に示すように、前世代の P2 システムよりも 100 倍以上高速に深層学習モデルをトレーニングできます。 Caffe2 ResNet50 トレーナー ベンチマーク 結果:
caffe2-resnet50-v100-結果
(合成データ、GPU ごとのバッチ サイズ 64)
CUDA 9 を使用した TensorFlow は、8 つの V100 で 8 つの P100 を 40% 上回る同様の結果を達成します。 TensorFlow の畳み込みニューラル ネットワークのベンチマーク 3 つのネットワーク アーキテクチャすべてでテストされました。

Rescale_tensorflow CNN ベンチマーク グラフ

(合成データ、GPU ごとのバッチ サイズ 64)

今すぐ V100 GPU の使用を始めましょう!

今すぐ NVIDIA V100 の実行を開始できるように、クローンを作成して実行して新しいハードウェアをテストできるいくつかのサンプル ジョブを以下に示します。 ジョブのクローンを作成する方法については、 ここをクリック。 もちろん、そのためには Rescale アカウントが必要です。アカウントにサインアップできます。 ここ.

Caffe2 ResNet50 Trainer ベンチマーク
Caffe2 は、新しい Tensor コアのサポートを統合し、Volta アーキテクチャの半精度浮動小数点演算を最大限に活用する最初のディープ ラーニング フレームワークの 2 つです。 Rescale で上に示したのと同じ CaffeXNUMX ベンチマークを実行します。
Caffe2 ResNet50 4 x V100 ジョブのクローンを作成するには、ここをクリックしてください。

TensorFlow InceptionV3 ベンチマーク

TensorFlow は、高性能モデル トレーニングを提供することでも知られています。 上記と同じ TensorFlow CNN ベンチマークを Rescale V100 で実行して、結果を自分で比較してください。
InceptionV3 4 x V100 ジョブのクローンを作成するにはここをクリックしてください.

ディープラーニング キックスタート プログラム

弊社のハードウェア パートナーである Skyscale との共同プロモーションの一環として、ディープ ラーニング キックスタート プログラムへの参加をお申し込みください。 このプログラムでは、承認された申請者に GPU 使用のための Rescale ハードウェア クレジット 1,000 ~ 5,000 ドルを授与します。 企業を代表するすべての Rescale ユーザーが応募資格があります。 プログラムのユーザーは、NVLinked P100 または V100 GPU を搭載したシステム上で実行できるようになります。

著者

  • マーク·ホイットニー

    Mark Whitney は、Rescale のエンジニアリング ディレクターです。 彼の専門分野には、ハイ パフォーマンス コンピューティング アーキテクチャ、量子情報研究、クラウド コンピューティングが含まれます。 彼はカリフォルニア大学バークレー校でコンピューター サイエンスの博士号を取得しています。

類似の投稿