深層学習スタイルの転送 - チュートリアル

次のアンディ・ウォーホルになりたいと思っていたけれど、芸術的才能がなかったという人も、今では AI がそれを叶えてくれます。スタイル転送ニューラルネットワークを使用すると、画像に芸術的なスタイルを適用できます。これらは、既存の画像分類ネットワークを取得し、それを伝達ネットワークのトレーニングの損失関数として使用し、変換出力をトレーニング画像および絵画などのサンプルスタイル画像と比較することによって作成されます。直観的には、事前にトレーニングされたネットワークを使用して、ターゲット画像の意味論的特徴とスタイル画像のテクスチャを混合する新しいネットワークをトレーニングしています。

私たちは利用します JC Johnson の高速ニューラルスタイルの実装このプロセスでは、事前にトレーニングされた VGG16 ネットワークを使用してトレーニング中の損失を計算します。 Rescale で K80 GPU を使用して、変換ネットワークを効率的にトレーニングし、そのネットワークを新しい画像に適用します。

スタイル転送は 1 つのステップで行われます: 2) スタイル転送ネットワーク自体のトレーニング、および XNUMX) 転送モデルを新しい画像に適用します。以下では、各ステップを実行するために再スケールジョブを設定する方法を示します。
以下は、ジャクソン・ポロック、村上隆、香港の超高層ビルの写真など、さまざまなアートワークに合わせてスタイリングされた Rescale のチームメンバー XNUMX 人です。どれがどれであるか推測できるかどうかを確認してください。

スタイル転送は、新しい K80 GPU ハードウェアを備えた Rescale のクラウドコンピューティングプラットフォームで簡単に実現できます。独自のニューラルネットワークで芸術的にレンダリングされた画像を生成するためのサンプルファイルとともにチュートリアルが含まれています。このチュートリアルでは、クリントイーストウッド、ダースベイダー、デヴィッドボウイ、コーギーの肖像画にジャクソンポロックの「オンアーチズ」のスタイルを適用できます。

Rescale でのスタイル転送の実行
次に、Rescale で独自のスタイルの転送ジョブを実行する方法を説明します。 Torch ネットワークトレーニングジョブを作成して実行します。 jcjohnson の fast-neural-style パッケージ。このジョブを複製して、新しいスタイルをトレーニングしたり、新しい画像のスタイルを設定したりできます。ここで Rescale でこのジョブのクローンを作成できます.
まず、次のファイルを入力としてアップロードします。

fast-neural-style.tar.gz: GitHub からダウンロードした jcjohnson のソフトウェアを含む tarball。
ココ2014.h5.gz: HDF2014 形式の Microsoft COCO 5 イメージインコンテキストトレーニングデータセット (このリポジトリは、実際には COCO 1 の元の画像の 10/2014 をランダムに選択したものです)。
クリント.jpg: 私たちがスタイリングするイメージ
ポロック.jpg: 画像のスタイルに使用される画像 (アートワーク)
vgg16.t7.gz: トーチの t16 形式でトレーニングされた VGG7 モデル

次に、Torch を実行することと、どのスクリプトを実行するかを指定します。まず train.lua を実行します。 VGG16 をベースモデル、COCO 2014 をトレーニングデータセット、pollock.jpg をスタイルとして使用して、スタイル転送モデルを構築します。スタイル転送モデル、model.t7 が作成されたら、fast_neural_style.lua を呼び出して clint.jpg のスタイルを設定します。スタイル設定が完了したら、Rescale ストレージに保持する必要のないファイルをクリーンアップします。

ほぼ準備が整いました。ここで、Obsidian コアタイプ、2 CPU コア (1 つの K80 GPU に相当) を選択し、[送信] をクリックします。

クラスターが開始され、入力がクラスターに同期されると、初期スタイルモデルのトレーニングが開始され、以下のようなビューが表示されます。

トレーニングと画像のスタイリングが完了すると、結果ファイルが同期され、スタイル付けされたクリントイーストウッドを表示できるようになります。

また、モデル.t7 出力ファイルに含まれています。これは、さらなる画像のスタイルを設定するために使用する Pollock スタイルの転送ニューラルネットワークです。まず、このモデルファイルを入力ファイルとして利用できるようにしましょう。

ここで、同じコードリポジトリ、新しいモデルファイル、およびスタイルを設定するいくつかの画像を使用して新しいジョブを作成します。ここで Rescale でこのジョブのクローンを作成できます.

今回は、画像をアーカイブとしてアップロードしました。アップロード後に解凍され、生成された入力ディレクトリで fast-neural-style を実行します。より計算量の多いトレーニングプロセスを実行する必要がなくなったことに注目してください。

トレーニングが完了すると、スタイル設定された画像が結果のoutput_imgsに表示されます。

*このブログ投稿の技術的および指導的側面を設定してくれた Mark Whitney に特別に感謝します。

Adam McKenzie

アダムは CTO として、HPC チームとカスタマーサクセスチームの管理を担当しています。アダムはボーイングでキャリアをスタートし、787 年間 XNUMX に取り組み、主翼の設計、分析、最適化を行う構造およびソフトウェアエンジニアリングプロジェクトを管理しました。アダムはオレゴン州立大学で機械工学の学士号を優秀な成績で取得しています。

すべての投稿を見る

類似の投稿

クッキー	演奏時間	説明
AWSALBCORS	7日	このCookieはアマゾンウェブサービスによって管理され、負荷分散に使用されます。
cookielawinfo-チェックボックス-広告	1年	GDPR Cookie Consentプラグインによって設定されたこのCookieは、「広告」カテゴリのCookieに対するユーザーの同意を記録するために使用されます。
cookielawinfo-チェックボックス-分析	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「分析」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-機能	11か月間	Cookieは、「機能」カテゴリのCookieに対するユーザーの同意を記録するためにGDPRCookieの同意によって設定されます。
cookielawinfo-checkbox-Necessary	11か月間	このCookieはGDPR Cookie Consentプラグインによって設定されます。 Cookieは、「必要」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-その他	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「その他」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
cookielawinfo-チェックボックス-パフォーマンス	11か月間	このCookieは、GDPR CookieConsentプラグインによって設定されます。 Cookieは、「パフォーマンス」カテゴリのCookieに対するユーザーの同意を保存するために使用されます。
visible_cookie_policy	11か月間	CookieはGDPR Cookie Consentプラグインによって設定され、ユーザーがCookieの使用に同意したかどうかを保存するために使用されます。個人データは保存されません。

クッキー	演奏時間	説明
__cf_bm	30 minutes	Cloudflareによって設定されたこのCookieは、Cloudflareボット管理をサポートするために使用されます。
クッキー	2年	LinkedInは、ブラウザIDを認識するために、LinkedInの共有ボタンと広告タグからこのCookieを設定します。
長い	セッション	LinkedInは、ユーザーの言語設定を記憶するようにこのCookieを設定します。
LIDC	1日	LinkedInは、データセンターの選択を容易にするためにlidccookieを設定します。
プレイヤー	1年	Vimeo は、この Cookie を使用して、Vimeo から埋め込みビデオを再生するときにユーザーの設定を保存します。

クッキー	演奏時間	説明
AWSALB	7日	AWSALBは、セッションをターゲットにマッピングするためにアマゾンウェブサービスによって設定されるアプリケーションロードバランサーCookieです。
同期アクティブ	決して	この Cookie は Vimeo によって設定され、訪問者のビデオコンテンツの好みに関するデータが含まれているため、Web サイトは好みの音量やビデオ品質などのパラメータを記憶します。

クッキー	演奏時間	説明
_ga	2年	GoogleAnalyticsによってインストールされた_gacookieは、訪問者、セッション、およびキャンペーンデータを計算し、サイトの分析レポートのサイト使用状況を追跡します。 Cookieは情報を匿名で保存し、ランダムに生成された番号を割り当てて、一意の訪問者を認識します。
_gat_UA-32985745-1	1 minute	ウェブサイトの所有者が訪問者の行動を追跡し、サイトのパフォーマンスを測定できるようにするために、GoogleAnalyticsとGoogleTagManagerによって設定された_gatcookieのバリエーション。名前のpattern要素には、関連するアカウントまたはWebサイトの一意のID番号が含まれています。
_gcl_au	3か月間	Google Tag Managerによって提供され、サービスを使用するWebサイトの広告効率を実験します。
_gid	1日	GoogleAnalyticsによってインストールされた_gidcookieは、訪問者がWebサイトをどのように使用しているかに関する情報を格納すると同時に、Webサイトのパフォーマンスの分析レポートを作成します。収集されるデータには、訪問者の数、ソース、匿名でアクセスするページなどがあります。
同意	2年	YouTubeは、埋め込まれたyoutube-videosを介してこのCookieを設定し、匿名の統計データを登録します。
utm_キャンペーン	過去	Google 広告サービスは、セッションキャンペーン値が存在する場合、この Cookie を設定して保存します。
utm_content	過去	この Cookie は、セッションコンテンツの値を保存するために使用されます (存在する場合)。
utm_source	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
utm_term	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
vuid	2年	VimeoはこのCookieをインストールして、Webサイトにビデオを埋め込むための一意のIDを設定することにより、追跡情報を収集します。

クッキー	演奏時間	説明
_fbp	3か月間	このCookieは、Webサイトにアクセスした後、FacebookまたはFacebook広告を利用したデジタルプラットフォームのいずれかで広告を表示するようにFacebookによって設定されます。
_mkto_trk	2年	Marketo によって提供されるこの Cookie には、ユーザーのサイトの使用状況を追跡するために使用される情報 (一意のユーザー ID など) が含まれています。 Marketo によって設定された Cookie は、Marketo によってのみ読み取り可能です。
fr	3か月間	Facebookは、FacebookピクセルまたはFacebookソーシャルプラグインを備えたサイトで、Web全体のユーザーの行動を追跡することにより、ユーザーに関連する広告を表示するようにこのCookieを設定します。
IDE	1年24日	Google DoubleClick IDE Cookieは、ユーザーがWebサイトを使用して関連する広告を表示する方法に関する情報を、ユーザープロファイルに従って保存するために使用されます。
Personalization_id	2年	Twitter は、ソーシャルメディアの機能を統合および共有するためにこの Cookie を設定し、追跡とターゲティングのためにユーザーが Web サイトをどのように使用するかに関する情報も保存します。
test_cookie	15 minutes	test_cookieはdoubleclick.netによって設定され、ユーザーのブラウザがCookieをサポートしているかどうかを判断するために使用されます。
utm_medium	過去	この Cookie は、訪問者が最初にどこから Web サイトにアクセスしたかを記録するために使用されます。この情報は、Web サイト運営者がマーケティングの効率を知るために使用されます。
VISITOR_INFO1_LIVE	5月27日	ユーザーが新しいプレーヤーインターフェースを取得するか古いプレーヤーインターフェースを取得するかを決定する帯域幅を測定するためにYouTubeによって設定されるCookie。
YSC	セッション	YSC CookieはYoutubeによって設定され、Youtubeページに埋め込まれたビデオのビューを追跡するために使用されます。
yt-リモート接続デバイス	決して	YouTubeは、埋め込まれたYouTubeビデオを使用して、ユーザーのビデオ設定を保存するためにこのCookieを設定します。
yt-リモートデバイスID	決して	YouTubeは、埋め込まれたYouTubeビデオを使用して、ユーザーのビデオ設定を保存するためにこのCookieを設定します。
yt.innertube :: nextId	決して	YouTubeによって設定されたこのCookieは、ユーザーが見たYouTubeの動画に関するデータを保存するための一意のIDを登録します。
yt.innertube ::リクエスト	決して	YouTubeによって設定されたこのCookieは、ユーザーが見たYouTubeの動画に関するデータを保存するための一意のIDを登録します。

クッキー	演奏時間	説明
_chtbl	セッション	説明はありません。
_dtses	30 minutes	説明はありません。
_dtuid	10年	説明はありません。
BIGipServersj30web-nginx-app_https	セッション	全く説明しない
email	過去	説明はありません。
gclid	過去	全く説明しない
ハンドル ip	1月	説明はありません。
handle_landing_page	1月	説明はありません。
handle_original_ref	過去	説明はありません。
ハンドル参照	過去	説明はありません。
handle_url	1月	説明はありません。
li_gc	2年	全く説明しない
muc_ads	2年	全く説明しない
ユーザ名	過去	説明はありません。

Rescale プラットホーム

概要

HPC & AI ソフトウェア

HPC & AI アーキテクチャ

セキュリティ&コンプライアンス

エコシステム統合

価格（英語）

HPC as a Service

インテリジェントバッチ

エラスティック・クラウド・ワークステーション

ストレージ・ファブリック

エンタープライズ管理

チーム管理

パフォーマンス管理

持ち込みソフトウェアをクラウドで利用

デジタルエンジニアリング

AI の物理学

データ管理

計算パイプライン

著者