悪性黒色腫、個人情報を共有せずにAI診断は可能か?

提供元:ケアネット

印刷ボタン

公開日:2024/04/17

 

 悪性黒色腫の人工知能(AI)診断モデルの開発には通常、大規模かつ集中化されたデータセットが必要であり、各施設による患者データの提供が求められ、これによりプライバシーに関する重大な懸念が生じている。そこで、ドイツがん研究センター(DKFZ)のSarah Haggenmuller氏らは、こうした懸念の払拭が可能とされる新たな機械学習の連合学習(federated learning)アプローチを取り入れた検討を行った。その結果、分散化された状態でのデータセット上で、浸潤性悪性黒色腫と母斑の分類が可能であることが示唆された。結果を踏まえて著者は、「連合学習は、悪性黒色腫のAI診断におけるプライバシー保護を改善すると同時に、機関や国をまたいだコラボレーションの促進が可能である。さらに、デジタルパソロジーやその他の画像分類タスクにも拡張できるだろう」と述べている。JAMA Dermatology誌2024年3月号掲載の報告。

 研究グループは、悪性黒色腫のAI診断において、プライバシー保護の向上に寄与する連合学習アプローチが、従来の集中型(すなわち単一モデル)およびアンサンブル型の学習アプローチと同等の診断パフォーマンスを達成できるか検討した。

 2021年4月~2023年2月に、ドイツの6つの大学病院で前向きに取得されたwhole-slide image(WSI、バーチャルスライド)を用いて、悪性黒色腫と母斑を病理診断するための連合学習モデルを開発。ホールドアウト検証データセットおよび外部検証データセットを用いて、同モデルのベンチマークを行った。データ分析は後ろ向きに2023年2~4月に実施した。

 主要エンドポイントは、受信者動作特性曲線下面積(AUROC)で評価した各モデルの診断能。副次エンドポイントは、平均正解率(balanced accuracy)、感度、特異度などであった。

 主な結果は以下のとおり。

・本試験には923例から得られた臨床的に悪性黒色腫が疑われる皮膚病変のWSIが1,025件含まれた。内訳は、組織病理学的に確認された浸潤性悪性黒色腫388件と、母斑637件であった。
・診断時の年齢中央値(範囲)は、トレーニングセットは58歳(18~95)、ホールドアウト検証データセットは57歳(18~93)、外部検証データセットは61歳(18~95)であった。
・Breslow厚の中央値(範囲)は、トレーニングセット0.70mm(0.10~34.00)、ホールドアウト検証データセット0.70mm(0.20~14.40)、外部検証データセット0.80mm(0.30~20.00)。
・ホールドアウト検証データセットでは、AUROCで評価した診断能は、連合学習アプローチ(0.8579、95%信頼区間[CI]:0.7693~0.9299)が、従来の集中型アプローチ(0.9024、0.8379~0.9565)と比べて有意に低かった(ペアワイズWilcoxon符号順位検定のp<0.001)。
・しかし、外部検証データセットでは、連合学習アプローチ(0.9126、95%CI:0.8810~0.9412)が、従来の集中型アプローチ(0.9045、0.8701~0.9331)よりも有意に診断能が高かった(ペアワイズWilcoxon符号順位検定のp<0.001)。
・連合学習アプローチは、ホールドアウト検証データセットおよび外部検証データセットの両者で、アンサンブルアプローチよりも診断能が低かった(それぞれ0.8579 vs.0.8867、0.9126 vs.0.9227)。

(ケアネット)