Rescale で Keras を使用したニューラルネットワーク

マークブログ
Rescale は、Theano ベースの Keras を含む、多数のニューラルネットワークソフトウェアパッケージの実行をサポートするようになりました。 Keras は、ユーザーがニューラルネットワークをレイヤーごとに定義し、トレーニング、検証し、それを使用して新しい画像にラベルを付けることができる Python パッケージです。この投稿では、畳み込みニューラルネットワーク (CNN) に基づいて画像を分類するには CIFAR10 データセット。次に、このトレーニング済みモデルを使用して新しい画像を分類します。

の修正バージョンを使用します。 Keras CIFAR10 CNN トレーニングの例まず、トレーニングスクリプトの修正バージョンを段階的に確認していきます。

CIFAR10 データセット

CIFAR10画像分類データセットをダウンロードできますここ。これは約 60000 枚の 32×32 ピクセル画像で構成されており、それぞれに 10 のカテゴリの XNUMX つが与えられます。データセットの Python バージョンを直接ダウンロードすることも、Keras の組み込みデータセットダウンローダーを使用することもできます (これについては後で詳しく説明します)。

次のコードを使用してこのデータセットを読み込みます。

from keras.datasets import cifar10 from keras.utils import np_utils nb_classes = 10 def load_dataset(): # データ、シャッフルされ、トレーニング セットとテスト セットに分割 (X_train, y_train), (X_test, y_test) = cifar10.load_data() print ('X_train Shape:', X_train.shape) print(X_train.shape[0], 'train tables') print(X_test.shape[0], 'test tables') # クラスベクトルをバイナリクラス行列に変換 Y_train = np_utils .to_categorical(y_train, nb_classes) Y_test = np_utils.to_categorical(y_test, nb_classes) X_train = X_train.astype('float32') X_test = X_test.astype('float32') X_train /= 255 X_test /= 255 return X_train, Y_train, X_テスト、Y_テスト

私たちは使用していますシファール10 ここではデータローダーを使用して、カテゴリラベルをワンホットエンコーディングに変換し、8 ビット RGB 値を 0 ～ 1.0 の範囲にスケーリングします。
　 X_電車 & X_テスト出力は、トレーニングセットとテストセット内のすべての画像の RGB ピクセル値の numpy 行列です。 50000 個のトレーニング画像と 10000 個のテスト画像があり、各画像は 32 つのカラーチャネルを持つ 32 × 3 ピクセルであるため、各行列の形状は次のようになります。

X_電車	（50000、3、32、32）
Y_train	(50000)
X_テスト	（10000、3、32、32）
Y_テスト	(10000)

Y 行列は、10 および 50000 の画像グループの 10000 の画像クラスの XNUMX つを表す順序値に対応します。

飛行機	0
自動車	1
鳥	2
cat	3
鹿	4
犬	5
カエル	6
うま	7
船	8
トラック	9

簡単にするために、この例では、正しいサイズの画像に対してそれ以上の前処理は行いません。実際の画像認識問題では、ある種の正規化を行うことになります。 ZCAホワイトニング、および/またはジッタリング。 Keras は、この前処理の一部を画像データジェネレーターとに提供されます。
ネットワークの定義
次のステップは、トレーニングしたいニューラルネットワークアーキテクチャを定義することです。

from keras.models import Sequential from keras.layers.core import Dense、Dropout、Activation、Flatten from keras.layers.convolutional import Convolution2D, MaxPooling2D def make_network(): model = Sequential() model.add(Convolution2D(32, 3, 3、border_mode='same'、input_shape=(img_channels, img_rows, img_cols))) model.add(Activation('relu')) model.add(Convolution2D(32, 3, 3)) model.add(Activation(' relu'))model.add(MaxPooling2D(pool_size=(2, 2)))model.add(Dropout(0.25))model.add(Convolution2D(64,border_mode='same'))model.add (Activation('relu'))model.add(Convolution3D(3, 2, 64))model.add(Activation('relu'))model.add(MaxPooling3D(pool_size=(3, 2)))model.add (Dropout(2))model.add(Flatten())model.add(Dense(2))model.add(Activation('relu'))model.add(Dropout(0.25))model.add(Dense(nb_classes) )) model.add(Activation('softmax')) モデルを返します

このネットワークには 4 つの畳み込み層と、その後に続く 2 つの密な層があります。追加のレイヤーを追加したり、レイヤーを削除または変更したりできますが、最初のレイヤーは入力イメージと同じサイズ (3、32、32) を持つ必要があり、最後の高密度レイヤーはクラスの数と同じ数の出力を持つ必要があります。ラベルとして使用しています (10)。最後の緻密層が完成した後、ソフトマックス出力を合計が 0 になる (1, 1) 範囲に圧縮するレイヤー。

トレーニングとテスト
次に、ネットワークをトレーニングしてテストします。

def train_model(model, X_train, Y_train, X_test, Y_test): sgd = SGD(lr=0.01、decay=1e-6、momentum=0.9、nesterov=True) model.compile(loss='categorical_crossentropy'、optimizer=sgd) model.fit(X_train, Y_train, nb_epoch=nb_epoch,batch_size=バッチサイズ, validation_split=0.1, show_accuracy=True,verbose=1) print('テスト中...') res = model.evaluate(X_test, Y_test,batch_size=batch_size) 、verbose=1、show_accuracy=True) print('テスト精度: {0}'.format(res[1]))

ここで私たちが選んだのは、確率的勾配降下法最適化手法としてクロスエントロピー損失。次に、次を使用してモデルをトレーニングします。フィット（）方法。トレーニングエポックの数 (データを反復処理する回数) とバッチのサイズ (ネットワーク上で一度に評価する入力の数) を指定します。バッチサイズが大きくなると、トレーニング中のメモリ使用量が増加します。ネットワークがトレーニングされた後、テストデータセットに対してモデルを評価し、精度を出力します。

モデルの保存
最後に、後で再利用できるように、トレーニングされたモデルをファイルに保存します。

def save_model(model):model_json = model.to_json() open('cifar10_architecture.json', 'w').write(model_json) model.save_weights('cifar10_weights.h5', overwrite=True)

Keras は、モデルアーキテクチャ (私たちの場合、出力内容) を保存することを区別します。 make_network()) とトレーニングされた重み。重みは HDF5 形式で保存されます。
Keras は、保存されたモデルが Keras と Theano の異なるバージョン間で互換性があることを保証しないことに注意してください。可能であれば、同じバージョンの Keras と Theano で保存されたモデルをロードすることをお勧めします。

トレーニングジョブを再スケールする
さて、内容を説明してきましたが、 cifar10_cnn.py 実行するトレーニングスクリプトでは、実行するようにすでに最適化されている GPU ノードでトレーニングするための Rescale ジョブを作成します。 NVIDIA GPU。この仕事は Rescaleで一般公開されています。まず、トレーニングスクリプトと CIFAR10 データセットをアップロードします。

ここでは、ジョブが実行されるたびに CIFAR サイトからデータセットを再ダウンロードすることを避けるために、Keras によってダウンロードされた CIFAR10 イメージの前処理バージョンをアップロードしています。このステップはオプションであり、代わりに単にアップロードすることもできます。 cifar10_cnn.py スクリプト。
次に、Keras を選択し、コマンドラインを指定します。

ソフトウェアピッカーから Keras を選択し、次に Theano がサポートする K520 GPU バージョンの Keras を選択します。コマンドラインは、アップロードしたデータセットを再パックし、アーカイブをデフォルトの Keras データセットの場所に移動します。 ~/.keras/datasets。次に、トレーニングスクリプトを呼び出します。 CIFAR10 セットを自分でアップロードしないことを選択した場合は、すべてのアーカイブ操作コマンドを省略して、トレーニングスクリプトを実行するだけで済みます。データセットはジョブクラスターに自動的にダウンロードされます。
最後のステップでは、実行する GPU ハードウェアを選択します。

ここで私たちが選択したのは、 ジェイド コアの種類と最小値 4 色このタイプの場合。最後に、ジョブを送信します。
トレーニングを開始する前に、クラスターをプロビジョニングしてネットワークをコンパイルするのに約 15 分かかります。開始したら、選択して進行状況を確認できます。 process_output.log.

ジョブが完了すると、トレーニングされたモデルファイルを使用できるようになります。これらはジョブ結果ページからダウンロードすることも、これから示すように新しいジョブで使用することもできます。

新しい画像の分類
トレーニングジョブには、前処理された numpy 形式のデータセットを使用しました。では、実際の画像をインターネットから取り出したい場合はどうすればよいでしょうかそしてそれらを分類しますか？以来犬 & cat の 2 クラスのうちの 10 つです CIFAR10 で表される画像では、犬と猫の画像を選択します。インターネットにアクセスして分類してみてください。

まず、画像をロードして縮小します。

import numpy as np import scipy.misc defload_and_scale_imgs(): img_names = ['standing-cat.jpg', 'dog-face.jpg'] imgs = [np.transpose(scipy.misc.imresize(scipy.misc.imread) (img_name), (32, 32)), (2, 0, 1)).astype('float32') for img_name in img_names] return np.array(imgs) / 255

うちはscipyを使ってます未読 JPG をロードし、画像のサイズを 32×32 ピクセルに変更します。結果として得られるイメージテンソルの次元は (32, 32, 3) であり、色の次元を最後ではなく最初にしたいので、転置を行います。最後に、イメージテンソルのリストを 0 つのテンソルに結合し、以前と同様にレベルが 1.0 ～ XNUMX の間に正規化されます。処理後の画像は小さくなります。

ここでは、元の画像のアスペクト比さえ維持しない最も単純なサイズ変更を実行したことに注意してください。トレーニング画像に正規化を行った場合は、これらの変換をこれらの画像にも適用したいと思うでしょう。

モデルのロードとラベル付け
保存したモデルの組み立ては、次に示す 2 段階のプロセスです。

keras.modelsからインポートmodel_from_json defload_model(model_def_fname,model_weight_fname):model = model_from_json(open(model_def_fname).read())model.load_weights(model_weight_fname) returnモデル

それをまとめると、ロードしたモデルを取得して呼び出します。予測クラス 2 つのイメージのクラス序数値を取得します。

if __name__ == '__main__': imgs =load_and_scale_imgs() model =load_model('cifar10_architecture.json', 'cifar10_weights.h5') 予測 =model.predict_classes(imgs) print(predictions)

ラベル付けジョブの再スケール
次に、ラベル付けスクリプトをジョブに組み込み、サンプル画像にラベルを付けます。この仕事は Rescaleで一般公開されています。作成したトレーニング済みモデルの選択を開始します。「クラウドストレージのファイルを使用する」をクリックし、トレーニングジョブによって作成された JSON および HDF5 モデルファイルを選択します。

次に、新しいラベル付けスクリプトをアップロードします犬猫.py そして犬と猫の画像。

Keras GPU ソフトウェアを選択し、ラベル付けスクリプトを実行します。この場合、犬と猫の画像はジョブの実行元の現在のディレクトリからロードされるため、ファイルを移動する必要はありません。

ラベルは次のように表示されます。 process_output.log ジョブが完了したとき。

出力は [3、5] これに対応します cat & 犬上記の画像クラス表から。
これでこのチュートリアルは終了です。 Rescale で画像認識畳み込みニューラルネットワークのトレーニングに成功し、そのネットワークを使用して追加の画像にラベルを付けました。近々別の投稿で、より複雑な Rescale ワークフローを使用してネットワークトレーニングを最適化する方法について説明します。

マーク·ホイットニー

Mark Whitney は、Rescale のエンジニアリングディレクターです。彼の専門分野には、ハイパフォーマンスコンピューティングアーキテクチャ、量子情報研究、クラウドコンピューティングが含まれます。彼はカリフォルニア大学バークレー校でコンピューターサイエンスの博士号を取得しています。

すべての投稿を見る

クッキー	演奏時間	説明
AWSALBCORS	7日	このCookieはアマゾンウェブサービスによって管理され、負荷分散に使用されます。
cookielawinfo-チェックボックス-広告	1年	GDPR Cookie Consentプラグインによって設定されたこのCookieは、「広告」カテゴリのCookieに対するユーザーの同意を記録するために使用されます。
cookielawinfo-チェックボックス-分析	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「分析」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-機能	11か月間	Cookieは、「機能」カテゴリのCookieに対するユーザーの同意を記録するためにGDPRCookieの同意によって設定されます。
cookielawinfo-checkbox-Necessary	11か月間	このCookieはGDPR Cookie Consentプラグインによって設定されます。 Cookieは、「必要」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-その他	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「その他」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-パフォーマンス	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「パフォーマンス」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
visible_cookie_policy	11か月間	CookieはGDPR Cookie Consentプラグインによって設定され、ユーザーがCookieの使用に同意したかどうかを保存するために使用されます。個人データは保存されません。

クッキー	演奏時間	説明
__cf_bm	30 minutes	Cloudflareによって設定されたこのCookieは、Cloudflareボット管理をサポートするために使用されます。
クッキー	2年	LinkedInは、ブラウザIDを認識するために、LinkedInの共有ボタンと広告タグからこのCookieを設定します。
長い	セッション	LinkedInは、ユーザーの言語設定を記憶するようにこのCookieを設定します。
LIDC	1日	LinkedInは、データセンターの選択を容易にするためにlidccookieを設定します。
プレイヤー	1年	Vimeo は、この Cookie を使用して、Vimeo から埋め込みビデオを再生するときにユーザーの設定を保存します。

クッキー	演奏時間	説明
AWSALB	7日	AWSALBは、セッションをターゲットにマッピングするためにアマゾンウェブサービスによって設定されるアプリケーションロードバランサーCookieです。
同期アクティブ	決して	この Cookie は Vimeo によって設定され、訪問者のビデオコンテンツの好みに関するデータが含まれているため、Web サイトは好みの音量やビデオ品質などのパラメータを記憶します。

クッキー	演奏時間	説明
_ga	2年	GoogleAnalyticsによってインストールされた_gacookieは、訪問者、セッション、およびキャンペーンデータを計算し、サイトの分析レポートのサイト使用状況を追跡します。 Cookieは情報を匿名で保存し、ランダムに生成された番号を割り当てて、一意の訪問者を認識します。
_gat_UA-32985745-1	1 minute	ウェブサイトの所有者が訪問者の行動を追跡し、サイトのパフォーマンスを測定できるようにするために、GoogleAnalyticsとGoogleTagManagerによって設定された_gatcookieのバリエーション。名前のpattern要素には、関連するアカウントまたはWebサイトの一意のID番号が含まれています。
_gcl_au	3か月間	Google Tag Managerによって提供され、サービスを使用するWebサイトの広告効率を実験します。
_gid	1日	GoogleAnalyticsによってインストールされた_gidcookieは、訪問者がWebサイトをどのように使用しているかに関する情報を格納すると同時に、Webサイトのパフォーマンスの分析レポートを作成します。収集されるデータには、訪問者の数、ソース、匿名でアクセスするページなどがあります。
同意	2年	YouTubeは、埋め込まれたyoutube-videosを介してこのCookieを設定し、匿名の統計データを登録します。
utm_キャンペーン	過去	Google 広告サービスは、セッションキャンペーン値が存在する場合、この Cookie を設定して保存します。
utm_content	過去	この Cookie は、セッションコンテンツの値を保存するために使用されます (存在する場合)。
utm_source	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
utm_term	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
vuid	2年	VimeoはこのCookieをインストールして、Webサイトにビデオを埋め込むための一意のIDを設定することにより、追跡情報を収集します。

クッキー	演奏時間	説明
_fbp	3か月間	このCookieは、Webサイトにアクセスした後、FacebookまたはFacebook広告を利用したデジタルプラットフォームのいずれかで広告を表示するようにFacebookによって設定されます。
_mkto_trk	2年	Marketo によって提供されるこの Cookie には、ユーザーのサイトの使用状況を追跡するために使用される情報 (一意のユーザー ID など) が含まれています。 Marketo によって設定された Cookie は、Marketo によってのみ読み取り可能です。
fr	3か月間	Facebookは、FacebookピクセルまたはFacebookソーシャルプラグインを備えたサイトで、Web全体のユーザーの行動を追跡することにより、ユーザーに関連する広告を表示するようにこのCookieを設定します。
IDE	1年24日	Google DoubleClick IDE Cookieは、ユーザーがWebサイトを使用して関連する広告を表示する方法に関する情報を、ユーザープロファイルに従って保存するために使用されます。
Personalization_id	2年	Twitter は、ソーシャルメディアの機能を統合および共有するためにこの Cookie を設定し、追跡とターゲティングのためにユーザーが Web サイトをどのように使用するかに関する情報も保存します。
test_cookie	15 minutes	test_cookieはdoubleclick.netによって設定され、ユーザーのブラウザがCookieをサポートしているかどうかを判断するために使用されます。
utm_medium	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
VISITOR_INFO1_LIVE	5月27日	ユーザーが新しいプレーヤーインターフェースを取得するか古いプレーヤーインターフェースを取得するかを決定する帯域幅を測定するためにYouTubeによって設定されるCookie。
YSC	セッション	YSC CookieはYoutubeによって設定され、Youtubeページに埋め込まれたビデオのビューを追跡するために使用されます。
yt-リモート接続デバイス	決して	YouTubeは、埋め込まれたYouTubeビデオを使用して、ユーザーのビデオ設定を保存するためにこのCookieを設定します。
yt-リモートデバイスID	決して	YouTubeは、埋め込まれたYouTubeビデオを使用して、ユーザーのビデオ設定を保存するためにこのCookieを設定します。
yt.innertube :: nextId	決して	YouTubeによって設定されたこのCookieは、ユーザーが見たYouTubeの動画に関するデータを保存するための一意のIDを登録します。
yt.innertube ::リクエスト	決して	YouTubeによって設定されたこのCookieは、ユーザーが見たYouTubeの動画に関するデータを保存するための一意のIDを登録します。

クッキー	演奏時間	説明
_chtbl	セッション	説明はありません。
_dtses	30 minutes	説明はありません。
_dtuid	10年	説明はありません。
BIGipServersj30web-nginx-app_https	セッション	全く説明しない
email	過去	説明はありません。
gclid	過去	全く説明しない
ハンドル ip	1月	説明はありません。
handle_landing_page	1月	説明はありません。
handle_original_ref	過去	説明はありません。
ハンドル参照	過去	説明はありません。
handle_url	1月	説明はありません。
li_gc	2年	全く説明しない
muc_ads	2年	全く説明しない
ユーザ名	過去	説明はありません。

Rescale プラットホーム

概要

HPC & AI ソフトウェア

HPC & AI アーキテクチャ

セキュリティ&コンプライアンス

エコシステム統合

価格（英語）

HPC as a Service

インテリジェントバッチ

エラスティック・クラウド・ワークステーション

ストレージ・ファブリック

エンタープライズ管理

チーム管理

パフォーマンス管理

持ち込みソフトウェアをクラウドで利用

デジタルエンジニアリング

AI の物理学

データ管理

計算パイプライン

著者

類似の投稿

ニュースレターの申込み