banner
ホームページ / ニュース / 眼底画像からの自動緑内障スクリーニングのための一般化可能な深層学習回帰モデル
ニュース

眼底画像からの自動緑内障スクリーニングのための一般化可能な深層学習回帰モデル

Jun 07, 2023Jun 07, 2023

npj デジタルメディスン 第 6 巻、記事番号: 112 (2023) この記事を引用

2068 アクセス

5 オルトメトリック

メトリクスの詳細

近年、眼底画像から緑内障を検出するための多数の分類モデルが提案されています。 多くの場合、単一の緑内障クリニックからのデータを使用してトレーニングされており、内部テスト セットでは優れたパフォーマンスを報告していますが、外部セットに一般化するのに苦労する傾向があります。 このパフォーマンスの低下は、緑内障の有病率、眼底カメラ、緑内障のグラウンドトゥルースの定義におけるデータの変化に起因すると考えられます。 この研究では、以前に説明した緑内障紹介回帰ネットワーク (G-RISK) がさまざまな困難な設定で優れた結果を得ることが確認されました。 ラベル付けされた眼底画像の 13 の異なるデータ ソースが利用されました。 データ ソースには、2 つの大規模な人口コホート (オーストラリアのブルー マウンテンズ眼科調査、BMES およびドイツのグーテンベルク健康調査、GHS) と 11 の公的に利用可能なデータセット (AIROGS、ORIGA、REFUGE1、LAG、ODIR、REFUGE2、GAMMA、RIM-ONEr3、RIM- ONE DL、アクリマ、パピラ)。 入力データのデータシフトを最小限に抑えるために、元のデータからディスク中心の 30 度の画像を取得する標準化された画像処理戦略が開発されました。 モデルのテストには合計 149,455 枚の画像が含まれました。 BMESおよびGHS集団コホートの受信者動作特性曲線下面積(AUC)は、参加者レベルでそれぞれ0.976 [95% CI: 0.967-0.986]および0.984 [95% CI: 0.980-0.991]でした。 特異度を 95% に固定すると、感度はそれぞれ 87.3% と 90.3% となり、Prevent Blindness America が推奨する最低基準である感度 85% を上回りました。 公的に入手可能な 11 個のデータセットの AUC 値の範囲は 0.854 ~ 0.988 でした。 これらの結果は、単一の三次紹介センターからの均質なデータを使用してトレーニングされた緑内障リスク回帰モデルの優れた一般化可能性を裏付けています。 前向きコホート研究を使用したさらなる検証が保証されます。

緑内障は不可逆的な視力障害の主な原因であり、世界人口の高齢化によりさらに増加すると考えられています1。 この増加は、先進国および発展途上国における未検出症例の 50% 以上という現在の高い割合にさらに加わるだけです 2,3,4,5。

現在の原発開放隅角緑内障(POAG)スクリーニング方法は、40~80歳の人口における有病率が3.5%であり、多数の偽陽性を引き起こすため、人口ベースの設定では費用対効果が高くありません6、7、8。 。 これは、現在その能力以上で稼働している医療システムに過剰な負荷を与えることになります。 診断は現在、患者が眼科医の診察を受けるたびに便宜的に行われています。 このシナリオでは、現在の未診断患者の割合を改善することはできず、同時に失明のリスクが高い患者を特定することもできません。 眼圧 (IOP) 測定の形式でのスクリーニング ソリューションでは、POAG7、9、10 の高い割合を表す可能性がある正常眼圧の緑内障症例が見逃されます。 一方、視野検査は時間がかかり、非常にばらつきのある結果が得られます11。 デジタル眼底画像の人工知能 (AI) 分析に基づく緑内障紹介は、このモダリティの広範な利用可能性、関連コストの低さ、および非侵襲性の特性を考慮すると、潜在的な解決策として提案されています 12。 さらに、畳み込みニューラル ネットワーク (CNN) は、網膜神経線維層の厚さ (RNFL) 13 の定量的推定や眼底から視神経乳頭が除去された場合の緑内障の検出など、ほとんどの人間の専門家の能力を超える眼底画像から緑内障情報を抽出できます。画像14.

AI ベースの緑内障検出は、内部検証では高いパフォーマンスが報告されていますが、外部テスト条件、より具体的には現実世界の設定ではパフォーマンスが低下しました 15、16、17。 単一の医療センターからのラベル付き眼底画像でトレーニングされた効果的な AI モデルは、分布外 (OoD) データを特徴とする新しい環境に導入された場合、分布の変化に対して堅牢である必要があります18。 この要件は、トレーニング データとテスト データが同じ分布から得られるという機械学習の古典的な前提を超えています19。 このようなデータのシフトは、モデルが特定の眼底カメラで撮影された画像でトレーニングされ、2 番目のデバイスからの画像でテストされた場合に発生する可能性があります。 眼底画像におけるこの中心間の不均一性は、視野 (FOV)、色分布、照明、関心領域 (椎間板中心または黄斑中心) の変化に起因する可能性があります。 民族、近視の有病率、緑内障の有病率などの人口の違いも、パフォーマンスの低下につながるデータシフトの一般的な原因です。 さらに、緑内障の定義は多岐にわたり、OoD データに関連する課題を悪化させています。 ドメイン適応などのデータシフトに対抗するソリューションは、網膜画像解析の文脈で説明されており、一般化可能性の向上につながります 20,21。 ただし、これらのアプローチは多くの場合、モデル開発中にターゲット セットからラベル付き画像が利用できるかどうかに依存します。 これらのモデルは新しいソースからの見込みデータを処理する必要があるため、実際のアプリケーションでは通常、これは発生しません。

50%) of images containing the optic nerve head (ONH). Both the imaging protocol and the definition of glaucoma varied considerably across the test sets./p>0.3), (5) and when gonioscopic results indicated no angle closure./p>