|

あなたに最適なクラウド上でディープラーニングを実行


ディープラーニングはまだ初期段階にありますが、自動運転、ロボット制御、機械翻訳、顔認識などの分野ですでに大幅に進歩しています。 ディープ ラーニングは、大量のデータを抽象化し、パターンを認識し、モデル化して分類できるため、今後数年間で破壊とイノベーションを推進できるようになります。 では、ディープ ラーニングとディープ ニューラル ネットワークが複雑なタスクにとって適切なソリューションであるかどうかを評価するには、どのような質問をする必要があるでしょうか?
十分なデータがありますか? 深層学習のモデルとアーキテクチャにはさまざまなものがありますが、それらすべてに共通するテーマは深層構造です。 深いとは、相互依存するモデル パラメーターが多数あることを意味します。 オプティマイザーがこれらすべてのパラメーターの適切な値を見つけ出すには、オプティマイザーに実行させたいタスクの複数のトレーニング サンプルが必要です。 一部例外を除き、以下の場合に適用されます。 転移学習大量のデータがない場合、または多数のサンプルを迅速に生成できない場合は、より小さく「浅い」モデルをトレーニングする方が良いでしょう。
教師あり、半教師あり、または教師なし? 収集したデータには、タスクの望ましい結果がラベル付けされていますか? データがすべてラベル付けされている場合は、教師あり学習手法を利用できます。 これはディープ ニューラル ネットワークの「従来の」アプリケーションであり、画像認識、自然言語翻訳、音声認識などのタスクに使用されます。 畳み込みネットワーク 通常、画像ベースのタスクに使用されますが、 リカレントネットワーク 言語ベースのタスクに使用されます。
データにラベルが付けられていない場合でも、教師なし学習を利用して、データ内の隠れた特徴や構造を学習できます。 ノイズ除去オートエンコーダー は教師なし深層学習モデルの例です。
最後のカテゴリである半教師あり深層学習または強化深層学習は、この分野で最も新しいものであり、 ディープマインド。 この場合、データはまばらにラベル付けされており、モデルはシステムへの新しい入力をテストしてフィードバックを取得できる可能性があります。 決定的な例は次のとおりです Atari ゲームのプレイを学ぶしかし、それ以来、ロボット工学や自動運転車への応用が行われています。
あなたのシステムはその決定を説明する必要がありますか? 深層学習モデルは伝統的に、それが行う予測に関してブラックボックスとみなされてきました。 深いモデルでトレーニングされるパラメーターの数を考慮すると、モデルが与える答えの背後にある「推論」を再構築することは一般に不可能です。 「なぜ?」を提供する必要がある場合は、 「何?」という疑問とともに、特定の答えを提供するために行われた一連の決定を与える、デシジョン ツリーやランダム フォレストのようなモデルを選択することをお勧めします。
ディープ ラーニング モデルが正しい選択である場合、次のような新たな課題に直面することになります。

  • ディープ ラーニングには、特殊な GPU ハードウェアと大量のハードウェアが必要です。 機械学習に慣れていない多くの IT 組織は、オンプレミスで適切な GPU リソースを確保するための設備投資をまだ行っていません。
  • ディープ ラーニング ライブラリは非常に急速に進化しているため、最新の状態を維持するには頻繁に更新する必要があります。 ディープ ラーニング パイプラインは、すぐに相互依存するソフトウェア パッケージのスタックになり、同期を保つことが困難になる可能性があります。
  • 大規模なデータセットをどのように管理していますか? そうしたデータはどこにあるのでしょうか?

Rescale の Deep Learning Cloud は、IBM と提携して、上記の問題を解決するための統合プラットフォームを提供します。 IBM Cloud のベアメタル NVIDIA K80 サーバーを活用する Rescale のインタラクティブ デスクトップは、大規模なデータセットを視覚化および探索し、ディープ ニューラル ネットワーク モデルを設計するための強力なハードウェアを提供します。 スケールアップして大規模なデータセットでトレーニングする準備ができたら、GPU コンピューティング クラスターに即座にアクセスし、時間単位の料金で使用した分だけ支払うことができます。
Deep Learning Cloud は、TensorFlow や Torch などの人気のディープ ラーニング ソフトウェアの最新バージョンに加え、SPSS などの IBM ライセンスの分析製品で構成されています。 すべてのソフトウェアは、CUDA および cuDNN を介して NVIDIA GPU を最大限に活用するようにすでに構成されています。
最後に、Rescale のワークフロー管理およびコラボレーション ツールを IBM のストレージおよびデータ転送テクノロジーと組み合わせることで、大規模なデータセットをクラウドに移行し、クラウドに保存されたデータを管理する負担が軽減されます。
では、Rescale でディープ ラーニング タスクを実行するとどうなるでしょうか? 新しいディープ ニューラル ネットワークを最初からトレーニングするためにユーザーが実行する手順は次のとおりです。データセット: 最適化されたデータ転送ツールを使用して画像データセットをアップロードするか、データがすでに IBM クラウドでホストされている場合は、それを直接添付できます。

  •  : Rescale Web インターフェースを介してクラスターをセットアップし、トレーニングする IBM Cloud GPU の数、使用するディープラーニング ソフトウェア、および実行するトレーニング スクリプトを構成します。
  • 起動する: 30 分以内にトレーニング クラスターが利用可能になり、トレーニング スクリプトが実行されます。
  • モニター: Web または直接 SSH アクセス経由でトレーニングの進行状況を表示し、TensorBoard (TensorFlow の一部) などの GUI に接続し、いつでも必要なときにトレーニング クラスターを停止できます。
  • レビュー: トレーニング結果は永続ストレージに自動的に同期されます。 Rescale ポータルから結果を確認したり、使用するモデルをダウンロードしたり、自分の IBM Cloud ストレージ アカウントに同期したり、または単に Rescale を使用して既存のモデルでさらに推論やトレーニングを実行したりすることができます。

IBM Cloud を活用した Rescale を今すぐ無料でお試しください。 https://rescale.com/ibm/

著者

  • マーク·ホイットニー

    Mark Whitney は、Rescale のエンジニアリング ディレクターです。 彼の専門分野には、ハイ パフォーマンス コンピューティング アーキテクチャ、量子情報研究、クラウド コンピューティングが含まれます。 彼はカリフォルニア大学バークレー校でコンピューター サイエンスの博士号を取得しています。

類似の投稿