成人糖尿病患者の網膜基底部の画像評価について、ディープラーニングをベースとした診断アルゴリズムは、糖尿病網膜症の検出に関し、高い感度、特異度を示したことを、米国・Google社のVarun Gulshan氏らが発表した。ディープラーニングは、コンピュータアルゴリズムのプログラムに、自身で膨大な症例から学び適切な行動を示すことを容認する人工知能(AI)技術の1つで、プログラムに明確なルールを記述する必要がない。研究グループは、この技術を医学画像診断に適用できるか、評価と検証試験を行った。JAMA誌オンライン版2016年11月29日号掲載の報告。
12万8,175枚の網膜写真を使って画像診断を訓練
研究グループは、網膜基底部写真で糖尿病網膜症と糖尿病黄斑浮腫を自動検出する、ディープラーニングを適用したアルゴリズムの開発を行った。
開発用に用意した12万8,175枚の網膜写真を用いて、画像分類を至適化するために深層畳み込みニューラルネットワーク(deep convolutional neural network、回路の一部を多層とすることでデータの特徴を深く学習する)と呼ばれる訓練プログラムをアルゴリズムに施した。使用した網膜像については、2015年5~12月に米国の眼科医と眼科シニアレジデント54人のパネルメンバーによって、糖尿病網膜症、糖尿病黄斑浮腫、および画像階調性について従来どおりのグレード付けが3~7回にわたって行われた。
構築されたアルゴリズムを、2016年1~2月に、2つのデータセット(EyePACS-1、Messidor-2)を用いて検証した。いずれのデータセットも、7人以上の米国委員会認定眼科医によってグレード付けが行われていた。
眼科医パネルの多数決で標準化した参照をベースに、アルゴリズムの、関係する糖尿病網膜症(RDR、中等症~重症の糖尿病網膜症として定義)、関係する糖尿病黄斑浮腫のいずれかもしくは両方の検出について感度と特異度を算出して評価した。アルゴリズムは、開発セットから選択された2つのオペレーティングポイント(1つは高特異度、もう1つは高感度のオペレーティングポイント)で評価された。
検出の感度は87.0~97.5%、特異度93.4~98.5%
EyePACS-1には、画像写真9,963枚、患者4,997例(平均年齢54.4歳、女性62.2%、RDR有病率は完全にグレード付けされた画像写真で7.8%[683/8,878例])のデータが含まれた。Messidor-2には、1,748例、患者874例(57.6歳、42.6%、14.6%[254/1,745例])が含まれた。
結果、アルゴリズムの検出能は良好であることが示された。評価に用いたROC曲線下面積は、EyePACS-1検証試験では0.991(95%信頼区間[CI]:0.988~0.993)、Messidor-2検証試験では0.990(0.986~0.995)であった。
最初の高感度オペレーティングカットポイントを用いた評価における感度、特異度は、EyePACS-1では感度90.3%(95%CI:87.5~92.7)、特異度98.1%(97.8~98.5)であり、Messidor-2ではそれぞれ87.0%(81.1~91.0)、98.5%(97.7~99.1)であった。
次の開発セットの高感度オペレーティングポイントを用いた評価では、EyePACS-1における感度は97.5%、特異度は93.4%であり、Messidor-2はそれぞれ96.1%、93.9%であった。
これらの結果を踏まえて著者は、「さらなる研究で、このアルゴリズムの臨床への適用の可能性を確認すること、またこのアルゴリズムを用いることで治療やアウトカムが、従来の眼科学的評価と比較して改善可能かどうかを確認する必要がある」と述べている。
(ケアネット)