ディープラーニング(深層学習)アルゴリズムによる頭部CTスキャン検査データの読影は、頭蓋内出血や頭頂部骨折、正中偏位などを高い精度で検出可能なことが明らかにされた。インド・Qure.ai社のSasank Chilamkurthy氏らが、約29万例のデータを基に検出アルゴリズムを開発し、2万例超のデータで検証した結果で、Lancet誌オンライン版2018年10月11日号で発表した。結果を踏まえて著者は、「頭部CTスキャン検査の読影にアルゴリズムを活用した、自動トリアージシステム実現の可能性が出てきた」とまとめている。
深層学習アルゴリズムによる頭部CT読影の検証に31万例超のデータを集計
研究グループは2011年1月~2017年6月にかけて、インドの20ヵ所の医療機関から、31万3,318例の頭部CTスキャン検査データと臨床報告書を、後ろ向きに集計した。同データセットの中から無作為に2万1,095例分のデータセット(Qure25k)を抽出し、深層学習アルゴリズムによる頭部CT読影の検証に用いた。また、残りのデータセットは同アルゴリズムの開発に活用した。さらに、開発や検証に用いた入手先とは異なる医療機関から集めた2つの追加データをセットし(CQ500)、アルゴリズムによる頭部CT読影の検証に使った。なお、術後と7歳未満の患者の検査データは除外した。
評価の指標となる標準基準は、「Qure25k」では臨床放射線診断レポート、「CQ500」では3人の放射線科医の合意とした。ROC曲線下の面積(AUC)により、開発した深層学習アルゴリズムによる頭部CT読影の検出能を検証した。
深層学習アルゴリズムによる頭部CT読影の頭蓋内出血検出に関するAUCは0.92~0.94
「Qure25k」データセットに含まれる2万1,095例の平均年齢は43歳、女性は43%だった。「CQ500」データセットの1つ目は214例分から成り、平均年齢は43歳、女性は44%、2つ目は277例分で平均年齢は52歳、女性は30%だった。
「Qure25k」による検証では、今回開発した深層学習アルゴリズムによる頭部CT読影の、頭蓋内出血検出に関するAUCは0.92(95%信頼区間[CI]:0.91~0.93)だった。内訳をみると、実質内出血のAUCは0.90(同:0.89~0.91)、脳室内出血は0.96(0.94~0.97)、硬膜下出血は0.92(0.90~0.93)、硬膜外出血は0.93(0.91~0.95)、クモ膜下出血は0.90(0.89~0.92)だった。
「CQ500」による深層学習アルゴリズムによる頭部CT読影の検証では、頭蓋内出血検出に関するAUCは0.94(95%CI:0.92~0.97)で、内訳はそれぞれ、0.95(同:0.93~0.98)、0.93(0.87~1.00)、0.95(0.91~0.99)、0.97(0.91~1.00)、0.96(0.92~0.99)だった。
そのほか「Qure25k」による、頭頂部骨折の検出に関するAUCは0.92(95%CI:0.91~0.94)、正中偏位は0.93(0.91~0.94)、圧排効果は0.86(0.85~0.87)で、「CQ500」による検証では、それぞれ0.96(0.92~1.00)、0.97(0.94~1.00)、0.92(0.89~0.95)だった。
(医療ジャーナリスト 當麻 あづさ)