目次
Capstone プロジェクトの設計目標
プロジェクト データ セット ソース
画像出典
最終的な診断はどこで行われますか?
翻訳者紹介
ホームページ テクノロジー周辺機器 AI 網膜画像分類のためのディープアンサンブル学習アルゴリズム

網膜画像分類のためのディープアンサンブル学習アルゴリズム

Apr 12, 2023 am 10:37 AM
ディープラーニング 統合モデル

翻訳者 | Zhu Xianzhong

改訂 | Sun Shujuan

網膜画像分類のためのディープアンサンブル学習アルゴリズム

写真 1 :原作者自身がデザインしたイルミナド プロジェクトの表紙

2019 年、世界保健機関は、世界には視覚障害のある人が約 22 億人いると推定し、そのうち少なくとも 1 人は視覚障害者であると推定しました。 10億人が予防できたかもしれない、あるいは今も視覚障害に苦しんでいる。眼科医療に関しては、世界は予防、治療、リハビリテーションサービスの適用範囲や質の不平等など、多くの課題に直面しています。訓練を受けた眼科医療スタッフが不足しており、眼科医療サービスは主要な医療システムに十分に統合されていません。私の目標は、これらの課題に一緒に対処するための行動を促すことです。この記事で紹介するプロジェクトは、私の現在のデータ サイエンスの頂点プロジェクトである Iluminado の一部です。

Capstone プロジェクトの設計目標

このプロジェクトを作成する目的は、深層学習アンサンブル モデルをトレーニングし、最終的にはそのモデルを低コストで非常に簡単に実装することです。所得世帯が利用でき、低コストで初期の疾病リスク診断が可能です。私のモデル手順を使用することで、眼科医は網膜眼底写真に基づいて即時の介入が必要かどうかを判断できます。

プロジェクト データ セット ソース

OphthAI は、複数の疾患に対応した眼底画像データ セット (網膜眼底複数疾患画像データセット、「RFMiD」と呼ばれる) を提供しています。一般公開されています。画像データセット。このデータセットには、3 台の異なる眼底カメラで撮影され、2 人の上級網膜専門家によって判断されたコンセンサスに基づいて注釈が付けられた 3,200 枚の眼底画像が含まれています。

これらの画像は、2009 年から 2010 年の間に実施された数千件の検査から抽出され、高品質の画像とかなりの数の低品質の画像の両方を選択してデータセットをより困難にしました。

データセットは、トレーニング セット (60% または 1920 枚の画像)、評価セット (20% または 640 枚の画像)、テスト セット (20% または 640 枚の写真) の 3 つの部分に分割されています。 )。平均して、トレーニングセット、評価セット、およびテストセットにおける疾患のある人の割合は、それぞれ60±7%、20±7%、および20±5%でした。このデータセットの基本的な目的は、日常の臨床診療で発生するさまざまな眼疾患に対処することであり、合計 45 のカテゴリの疾患/病状が特定されています。これらのラベルは、RFMiD_Training_Labels.CSV、RFMiD_Validation_Labels.SSV、RFMiD_Testing_Labels.CSV という 3 つの CSV ファイルにあります。

画像出典

下の画像は、眼底カメラと呼ばれるツールを使用して撮影されました。眼底カメラは、フラッシュ カメラに取り付けられた特殊な低倍率顕微鏡で、眼底、つまり目の奥の網膜層を撮影するために使用されます。

現在、ほとんどの眼底カメラは手持ち式なので、患者はレンズを直接見るだけで済みます。このうち、明るいフラッシュ部分は眼底像が撮影されたことを示している。

ハンドヘルド カメラには、さまざまな場所に持ち運べ、車椅子ユーザーなど特別なニーズを持つ患者にも対応できるという利点があります。さらに、必要なトレーニングを受けた従業員であれば誰でもカメラを操作できるため、十分な治療を受けていない糖尿病患者が迅速、安全、効率的に年次検査を受けることができます。

眼底イメージングシステムの撮影状況:

網膜画像分類のためのディープアンサンブル学習アルゴリズム

図 2: それぞれの視覚特性に基づいて撮影された画像:(a)糖尿病性網膜症(DR)、(b)加齢黄斑変性症(ARMD)、および(c)中程度のヘイズ(MH)。

最終的な診断はどこで行われますか?

最初のスクリーニングプロセスはディープラーニングによって支援されますが、最終的な診断は細隙灯検査を使用して眼科医によって行われます。

生体顕微鏡診断としても知られるこのプロセスには、生きた細胞の検査が含まれます。医師は顕微鏡検査を行って、患者の目に異常があるかどうかを判断します。

網膜画像分類のためのディープアンサンブル学習アルゴリズム

図 3: 細隙灯検査の図

#網膜画像分類における深層学習の応用

従来の機械学習アルゴリズムとは異なり、深さ畳み込みニューラルネットワーク (CNN) は、多層モデルを使用して、生データから特徴を自動的に抽出して分類できます。

最近、学術コミュニティは、糖尿病性網膜症や異常転帰 (AUROC) などのさまざまな眼疾患を特定するための畳み込みニューラル ネットワーク (CNN) の使用に関する多数の論文を発表しました。 >0.9) 緑内障など

データ メトリクス

AUROC スコアは、ROC 曲線を数値に要約し、複数のしきい値を同時に処理するときにモデルがどの程度うまく機能するかを示します。 AUROC スコア 1 は完全なスコアを表し、AUROC スコア 0.5 はランダムな推測に対応することに注意してください。

網膜画像分類のためのディープアンサンブル学習アルゴリズム

#図 4: ROC 曲線表示の概略図

使用した方法 - クロスエントロピー損失関数

クロス エントロピーは、機械学習の損失関数としてよく使用されます。クロス エントロピーは、エントロピーの定義に基づいた情報理論の分野の指標であり、通常 2 つの確率分布間の差を計算するために使用されます。一方、クロス エントロピーは 2 つの分布間の合計エントロピーを計算するものと考えることができます。

クロスエントロピーは、対数損失と呼ばれるロジスティック損失にも関連します。これら 2 つの測定値は異なるソースから得られますが、分類モデルの損失関数として使用される場合、どちらの方法も同じ数量を計算するため、互換的に使用できます。

(具体的な詳細については、https://machinelearningmastery.com/logistic-regression-with-maximum-likelihood-estimation/ を参照してください)

クロスエントロピーとは?

クロスエントロピーは、確率変数または一連のイベントが与えられた場合の 2 つの確率分布間の差の尺度です。情報は、イベントのエンコードと送信に必要なビット数を数値化したものであることを思い出してください。低確率のイベントにはより多くの情報が含まれる傾向がありますが、高確率のイベントには含まれる情報が少なくなります。

情報理論では、出来事の「驚き」を表現することが好きです。出来事が起こる可能性が低いほど、その出来事はより驚くべきものであり、より多くの情報が含まれていることを意味します。

    低確率イベント (驚くべき): 詳細。
  • 高確率のイベント (当然のこと): 情報が少ない。
  • #イベント P(x) の確率が与えられると、イベント x の情報 h(x) は次のように計算できます。

h(x) = -log(P(x))
ログイン後にコピー

網膜画像分類のためのディープアンサンブル学習アルゴリズム図 4: 完璧な図 (画像提供: Vlastimil Martinek)

エントロピーは、確率分布からのランダム性の伝達です。選択したイベントに必要なビット。歪んだ分布はエントロピーが低くなりますが、イベントの確率が等しい分布は一般にエントロピーが高くなります。

# 図 5: ターゲット確率と予測確率の比率の完璧な図 (画像提供: Vlastimil Martinek) 網膜画像分類のためのディープアンサンブル学習アルゴリズム

歪んだ確率分布では「驚き」が少なく、起こり得る出来事が支配的になるため、エントロピーが低くなります。相対的に言えば、平衡分布はより驚くべきものであり、イベントが発生する可能性が等しいため、エントロピーが高くなります。

歪んだ確率分布 (当然のこと): エントロピーが低い。

  • バランスの取れた確率分布 (驚くべきことに): 高いエントロピー。
  • エントロピー H(x) は、次の図に示すように、x 個の離散状態の集合 x とその確率 P(x) を持つ確率変数に対して計算できます。

網膜画像分類のためのディープアンサンブル学習アルゴリズム

図 6: マルチレベルのクロスエントロピー式 (画像出典: Vlastimil Martinek)

マルチカテゴリー分類 - 私たちは複数のカテゴリカル クロス エントロピーの使用は、ターゲットがワンホット エンコーディング ベクトル スキームを使用するクロス エントロピーの特定のアプリケーション ケースです。 (興味のある読者は Vlastimil Martinek の記事を参照してください)

網膜画像分類のためのディープアンサンブル学習アルゴリズム

図 7: パンダとネコの損失計算の完全な分解図 (画像出典: Vlastimil Martinek)

網膜画像分類のためのディープアンサンブル学習アルゴリズム

#図 8: 損失値の完全な分解図 1 (画像出典: Vlastimil Martinek)

網膜画像分類のためのディープアンサンブル学習アルゴリズム

##図 9: 損失値の完全な分解図 2 (画像出典: Vlastimil Martinek)

網膜画像分類のためのディープアンサンブル学習アルゴリズム

図 9:確率と損失の視覚的表現 (画像出典: Vlastimil Martinek)

バイナリのクロスエントロピーについてはどうですか?

網膜画像分類のためのディープアンサンブル学習アルゴリズム

図 10: カテゴリカルクロスエントロピー式の図 (画像ソース: Vlastimil Martinek)

プロジェクト 私たちはバイナリ分類、つまりバイナリ クロス エントロピー スキーム、つまりターゲットが 0 または 1 のクロス エントロピー スキームを使用することを選択しました。ターゲットをそれぞれ [0,1] または [1,0] のホット エンコーディング ベクトルに変換して予測すると、クロス エントロピー式を使用して計算できます。

網膜画像分類のためのディープアンサンブル学習アルゴリズム

図 11: バイナリ クロス エントロピー計算式の図 (画像提供: Vlastimil Martinek)

非対称性の使用損失アルゴリズムは不均衡なデータを処理します

典型的なマルチラベル モデル環境では、データ セットの特徴に不均衡な数の正のラベルと負のラベルが含まれる可能性があります。この時点で、負のラベルを好むデータセットの傾向が最適化プロセスに大きな影響を及ぼし、最終的には正のラベルの勾配が強調されなくなり、予測結果の精度が低下します。

これは、私が現在選択しているデータセットが直面している状況とまったく同じです。

このプロジェクトでは、BenBaruch らが開発した非対称損失アルゴリズムを使用しています (図 12 を参照)。これは、マルチラベル分類を解決する手法ですが、重大な問題もあります。カテゴリー. 偏った分布状況。

私が考える方法は、クロスエントロピーの正と負の成分を非対称に変更することで、負のラベル部分の重みを減らし、最終的に上記のことを強調することです。処理がより困難なポジティブラベル。

網膜画像分類のためのディープアンサンブル学習アルゴリズム

#図 12: 非対称マルチラベル分類アルゴリズム (2020、著者: Ben-Baruch et al.)

テスト対象のアーキテクチャ

要約すると、この記事のプロジェクトでは、次の図に示すアーキテクチャが使用されます。

網膜画像分類のためのディープアンサンブル学習アルゴリズム##図 13 (画像提供: Sixu)

上記のアーキテクチャで使用される主要なアルゴリズムには、主に次のものが含まれます。

  • DenseNet-121
  • InceptionV3
  • Xception
  • MobileNetV2
  • VGG16

さらに、上記のアルゴリズム関連のコンテンツは、この記事の Capstone プロジェクトを完了した後に必ず更新されます。興味のある読者はぜひご期待ください!

翻訳者紹介

Zhu Xianzhong 氏、51CTO コミュニティ編集者、51CTO エキスパートブロガー、講師、濰坊市の大学のコンピューター教師、そしてフリーランスプログラミング業界のベテラン。

#元のタイトル: ##網膜画像分類のための深層アンサンブル学習 (CNN) キャシー・カム著

以上が網膜画像分類のためのディープアンサンブル学習アルゴリズムの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Python での感情分析に BERT を使用する方法と手順 Python での感情分析に BERT を使用する方法と手順 Jan 22, 2024 pm 04:24 PM

BERT は、2018 年に Google によって提案された事前トレーニング済みの深層学習言語モデルです。正式名は BidirectionEncoderRepresentationsfromTransformers で、Transformer アーキテクチャに基づいており、双方向エンコードの特性を備えています。従来の一方向コーディング モデルと比較して、BERT はテキストを処理するときにコンテキスト情報を同時に考慮できるため、自然言語処理タスクで優れたパフォーマンスを発揮します。その双方向性により、BERT は文内の意味関係をより深く理解できるようになり、それによってモデルの表現能力が向上します。事前トレーニングおよび微調整方法を通じて、BERT は感情分析、命名などのさまざまな自然言語処理タスクに使用できます。

一般的に使用される AI 活性化関数の分析: Sigmoid、Tanh、ReLU、Softmax のディープラーニングの実践 一般的に使用される AI 活性化関数の分析: Sigmoid、Tanh、ReLU、Softmax のディープラーニングの実践 Dec 28, 2023 pm 11:35 PM

活性化関数は深層学習において重要な役割を果たしており、ニューラル ネットワークに非線形特性を導入することで、ネットワークが複雑な入出力関係をより適切に学習し、シミュレートできるようになります。活性化関数の正しい選択と使用は、ニューラル ネットワークのパフォーマンスとトレーニング結果に重要な影響を与えます。この記事では、よく使用される 4 つの活性化関数 (Sigmoid、Tanh、ReLU、Softmax) について、導入、使用シナリオ、利点、欠点と最適化ソリューション アクティベーション関数を包括的に理解できるように、次元について説明します。 1. シグモイド関数 シグモイド関数の公式の概要: シグモイド関数は、任意の実数を 0 と 1 の間にマッピングできる一般的に使用される非線形関数です。通常は統一するために使用されます。

ORB-SLAM3を超えて! SL-SLAM: 低照度、重度のジッター、弱いテクスチャのシーンはすべて処理されます。 ORB-SLAM3を超えて! SL-SLAM: 低照度、重度のジッター、弱いテクスチャのシーンはすべて処理されます。 May 30, 2024 am 09:35 AM

以前に書きましたが、今日は、深層学習テクノロジーが複雑な環境におけるビジョンベースの SLAM (同時ローカリゼーションとマッピング) のパフォーマンスをどのように向上させることができるかについて説明します。ここでは、深部特徴抽出と深度マッチング手法を組み合わせることで、低照度条件、動的照明、テクスチャの弱い領域、激しいセックスなどの困難なシナリオでの適応を改善するように設計された多用途のハイブリッド ビジュアル SLAM システムを紹介します。当社のシステムは、拡張単眼、ステレオ、単眼慣性、ステレオ慣性構成を含む複数のモードをサポートしています。さらに、他の研究にインスピレーションを与えるために、ビジュアル SLAM と深層学習手法を組み合わせる方法も分析します。公開データセットと自己サンプリングデータに関する広範な実験を通じて、測位精度と追跡堅牢性の点で SL-SLAM の優位性を実証しました。

潜在空間の埋め込み: 説明とデモンストレーション 潜在空間の埋め込み: 説明とデモンストレーション Jan 22, 2024 pm 05:30 PM

潜在空間埋め込み (LatentSpaceEmbedding) は、高次元データを低次元空間にマッピングするプロセスです。機械学習と深層学習の分野では、潜在空間埋め込みは通常、高次元の入力データを低次元のベクトル表現のセットにマッピングするニューラル ネットワーク モデルです。このベクトルのセットは、「潜在ベクトル」または「潜在ベクトル」と呼ばれることがよくあります。エンコーディング」。潜在空間埋め込みの目的は、データ内の重要な特徴をキャプチャし、それらをより簡潔でわかりやすい形式で表現することです。潜在空間埋め込みを通じて、低次元空間でデータの視覚化、分類、クラスタリングなどの操作を実行し、データをよりよく理解して活用できます。潜在空間埋め込みは、画像生成、特徴抽出、次元削減など、多くの分野で幅広い用途があります。潜在空間埋め込みがメイン

1 つの記事で理解: AI、機械学習、ディープラーニングのつながりと違い 1 つの記事で理解: AI、機械学習、ディープラーニングのつながりと違い Mar 02, 2024 am 11:19 AM

今日の急速な技術変化の波の中で、人工知能 (AI)、機械学習 (ML)、および深層学習 (DL) は輝かしい星のようなもので、情報技術の新しい波をリードしています。これら 3 つの単語は、さまざまな最先端の議論や実践で頻繁に登場しますが、この分野に慣れていない多くの探検家にとって、その具体的な意味や内部のつながりはまだ謎に包まれているかもしれません。そこで、まずはこの写真を見てみましょう。ディープラーニング、機械学習、人工知能の間には密接な相関関係があり、進歩的な関係があることがわかります。ディープラーニングは機械学習の特定の分野であり、機械学習

超強い!深層学習アルゴリズムのトップ 10! 超強い!深層学習アルゴリズムのトップ 10! Mar 15, 2024 pm 03:46 PM

2006 年にディープ ラーニングの概念が提案されてから、ほぼ 20 年が経過しました。ディープ ラーニングは、人工知能分野における革命として、多くの影響力のあるアルゴリズムを生み出してきました。では、ディープラーニングのトップ 10 アルゴリズムは何だと思いますか?私の考えでは、ディープ ラーニングのトップ アルゴリズムは次のとおりで、いずれもイノベーション、アプリケーションの価値、影響力の点で重要な位置を占めています。 1. ディープ ニューラル ネットワーク (DNN) の背景: ディープ ニューラル ネットワーク (DNN) は、多層パーセプトロンとも呼ばれ、最も一般的なディープ ラーニング アルゴリズムです。最初に発明されたときは、コンピューティング能力のボトルネックのため疑問視されていました。最近まで長年にわたる計算能力、データの爆発的な増加によって画期的な進歩がもたらされました。 DNN は、複数の隠れ層を含むニューラル ネットワーク モデルです。このモデルでは、各層が入力を次の層に渡し、

Elasticsearch ベクトル検索の開発の歴史を基礎から実践まで振り返ります。 Elasticsearch ベクトル検索の開発の歴史を基礎から実践まで振り返ります。 Oct 23, 2023 pm 05:17 PM

1. はじめに ベクトル検索は、最新の検索および推奨システムの中核コンポーネントとなっています。テキスト、画像、音声などの複雑なオブジェクトを数値ベクトルに変換し、多次元空間で類似性検索を実行することにより、効率的なクエリ マッチングとレコメンデーションが可能になります。基本から実践まで、Elasticsearch の開発の歴史を確認します。この記事では、各段階の特徴と進歩に焦点を当てて、Elasticsearch ベクトル検索の開発の歴史を振り返ります。歴史をガイドとして考慮すると、Elasticsearch ベクトル検索の全範囲を確立するのは誰にとっても便利です。

AlphaFold 3 が発売され、タンパク質とすべての生体分子の相互作用と構造をこれまでよりもはるかに高い精度で包括的に予測します。 AlphaFold 3 が発売され、タンパク質とすべての生体分子の相互作用と構造をこれまでよりもはるかに高い精度で包括的に予測します。 Jul 16, 2024 am 12:08 AM

エディター | Radish Skin 2021 年の強力な AlphaFold2 のリリース以来、科学者はタンパク質構造予測モデルを使用して、細胞内のさまざまなタンパク質構造をマッピングし、薬剤を発見し、既知のあらゆるタンパク質相互作用の「宇宙地図」を描いてきました。ちょうど今、Google DeepMind が AlphaFold3 モデルをリリースしました。このモデルは、タンパク質、核酸、小分子、イオン、修飾残基を含む複合体の結合構造予測を実行できます。 AlphaFold3 の精度は、これまでの多くの専用ツール (タンパク質-リガンド相互作用、タンパク質-核酸相互作用、抗体-抗原予測) と比較して大幅に向上しました。これは、単一の統合された深層学習フレームワーク内で、次のことを達成できることを示しています。

See all articles