AI 画像認識を使用した乳がんの検出と分類

概要
人工知能 (AI) とは、問題解決などの認知機能の点で人間の知能を模倣できるアルゴリズムとプロセスを指します。 機械学習と深層学習は AI のサブカテゴリです。 機械学習には、データまたは システムの数値的、記号的、または論理的表現... その他 深層学習には、前処理されたデータを必要とせずに人間のニューラル ネットワークを模倣する試みが含まれます。 AI の主な用途には、音声検索と音声認識、パーソナライズされたショッピングの推奨などが含まれます。
このチュートリアルでは、深層学習のサブセットである転移学習の概念を Rescale プラットフォームに適用する方法を学習します。 転移学習は、ベース データセットとベース タスクでモデルをトレーニングし、そのトレーニングからモデルが学習した内容を別のデータセットとタスクに転送することに重点を置いています。 転移学習には XNUMX つのアプローチがあります。モデルを自分で開発する方法と、事前トレーニングされたモデルを使用する方法です。 自分でモデルを開発する場合、最初に予測モデルを選択する必要があります。 モデリングモデリングとは、数学的または概念的な表現を作成することです。 その他 トレーニングするためのデータが豊富にある問題。 次に、モデルが基本タスクから何かを学習する、ただし学習しすぎないように、熟練したモデルを開発する必要があります。そうしないと、XNUMX 番目のタスクがあまり学習しなくなります。 次に、基本タスクから学習したモデルを XNUMX 番目のタスクの開始点として使用します。 ただし、事前トレーニング済みモデルを使用する場合は、予測モデリング問題を開発して基本タスクでトレーニングするのではなく、オープンソースの事前トレーニング済みモデルを選択し、それを XNUMX 番目のタスクの開始点として使用するだけで済みます。
Microsoft ResNet50 や Google Inception Model など、大量の事前トレーニング済みモデルがインターネット上で入手できます。 今日は、大規模な画像データセットで事前トレーニングされた画像分類モデルである Microsoft ResNet50 を使用します。このモデルは多数のクラスで予測を行う必要があります。 これにより、モデルは写真から特徴を抽出する方法を学習し、入力画像が何を示しているかをユーザーに伝えることができます。
より具体的には、このチュートリアルでは、Microsoft ResNet50 の事前トレーニング済みモデルを使用して、780 年に以下の年齢の女性から取得した 2018 枚の乳がん超音波画像の大規模なデータセット (トレーニングとも呼ばれます) のサブセットでモデルをさらにトレーニングする方法を示します。 25 歳と 75 歳の場合、同じデータセットから別の乳房超音波画像を入力して、画像内の乳房が悪性、良性、または正常 (別名: 検証は、製品、システム、または... その他)。 Rescale Workstation でこのチュートリアルを実行するには、Google Chrome Interactive ソフトウェアと Conda Miniconda Interactive ソフトウェアを使用します。 Rescale Workstation は、リアルタイムでモデルを操作するのに役立ち、分類する画像を変更したり、コードを変更したりすることができます。 このチュートリアルでは、コードのすべてのブロックを確認するのではなく、Rescale でのセットアップと結果に焦点を当てます。
このチュートリアルはから引用されました Kaggle の「ResNet50 を使用した乳がん検出」 (Khizar Khan 著)。 乳房超音波画像データセットは以下から取得されました。 Al-Dhabyani W、Gomaa M、Khaled H、Fahmy A。乳房超音波画像のデータセット。 データの概要。 2020 28 月;104863:10.1016。 DOI: 2019.104863/j.dib.XNUMX。
ビデオチュートリアル
ワークステーションの構成
次のセクションを読んで、適切に設定してください。 ワークステーションは、プロ向けに設計された強力なコンピュータ システムです。 その他.
ワークステーションの監視
ワークステーションのホーム画面からワークステーションの進行状況を監視できるようになりました。
ソフトウェア設定ページで、下図のように ワークステーション ホーム画面、あなたは見ることができます 私のワークステーション Rescale ユーザーとして作成したすべてのワークステーションを表示するには、次のようにします。

または、見ることができます アクティブなワークステーション 現在実行しているワークステーションを確認するには:

Coretype Explorer によるワークロードの改善
オプションで、最適化を支援できます。 ワークロードワークロードとは、コンピューティング タスクの量と種類を指します。 その他 Rescale の Coretype Explorer を使用して、パフォーマンスやコストを向上させます。
Rescale の機能 Coretype Explorer は、プロジェクトを完了するときにどのコア タイプといくつのコアを使用するかを決定するときに役立ちます。 Coretype Explorer を使用すると、コア/ノード、メモリ/ノード、ストレージ/ノード、 GPUGPU (グラフィックス プロセッシング ユニット) は、特殊な電子プロセッサです。 その他/ノード、価格 - オンデマンド、および価格 - オンデマンドの優先順位は、財務、メモリ、プロジェクトのニーズに最適なコア タイプを選択するのに役立ちます。 Coretype Explorer を使用するには、次の場所にアクセスする必要があります。 ハードウェアの設定 セクションに 。 の右下隅にあるはずです。 ハードウェア設定の指定 テーブル:

以下に示すように、Citrine、Iolite-1、Emerald、Ruby の 1 つの異なるコアタイプが、コア/ノード、メモリ/Dode、ストレージ/ノード、価格 - ODP (オンデマンド優先) に基づいて比較されました。 これら 1 つのコアタイプが比較対象として選択された理由は、Emerald はコストが安いためジョブやワークステーションの実行に非常に人気があり、Citrine、Iolite-XNUMX、および Ruby はすべて互いに同様のコストを持っているため、メモリ、ストレージ、およびコアがテストされる。 この特定のチュートリアルのために Ruby が選択されたのは、Citrine や Iolite-XNUMX と同じ価格で Emerald よりも高価ですが、他のすべてのコア タイプよりも大幅に高いコア/ノード、メモリ/ノード、およびストレージ/ノードを備えているためです。これは、大量のメモリ使用量を必要とするプロジェクトや、Rescale Workstation のような対話型環境でコードを実行する必要があるプロジェクトに最適です。 ただし、メモリ、ストレージ、コアよりも価格を重視する場合は、おそらく Emerald を選択するでしょう。
要約
このチュートリアルでは、2018 年に収集され、Microsoft ResNet50 画像分類モデルを使用してトレーニングされた特定の乳房超音波画像データセットから画像を分類する方法を説明します。 将来的には、別の画像ファイル パスをコピーしてコードの最後のブロックに貼り付けることで、画像データセットから分類する画像を変更できます。 同じ原理と Microsoft ResNet50 を使用して、異なる画像データセットをトレーニングして、画像の異なるトピックを分類してみることもできます。
さらに、次を使用して、異なるコアタイプを相互に比較できます。 ワークステーションを実行するために使用するものを選択するのに役立ちます。 セットアップ: ハードウェア設定 あなたのプロジェクトと財務上のニーズに応じて。 参照してください さらなる(オプションの)ステップ このオプションを操作する方法の詳細については、「」を参照してください。 画像分類モデルは、衛星画像での物体識別、動物分類、医療画像処理、ブレーキライト検出などの人工知能や機械学習で広く使用されています。
Rescale でこのチュートリアルを完了すると、高いコンピューティング能力を活用し、さまざまなタイプのハードウェアとソフトウェアにアクセスして、同じ単純なワークステーションのスケーラビリティと多様性をテストできるようになります。また、リアルタイムでコードを操作し、分類する入力画像を変更できるようになります。また、コンピュータ上のローカル Python プログラムでコードを実行する場合と比較して、コードの実行時間は半分以下に短縮されます。