自然言語処理(NLP)は、人工知能(AI)の一分野であり、コンピュータによって人間の言語を理解、生成、操作することを可能にする技術全般を指す。NLPを使って初診の診断書を解析し、がん患者の予後を予測することが可能であることを示唆する研究が、JAMA Network Open誌2023年2月27日号に掲載された。
ブリティッシュ コロンビア大学(カナダ)のJohn-Jose Nunez氏らによる本研究では、2011年4月1日~2016年12月31日に、ブリティッシュ・コロンビア州にある6つのがんセンターのいずれかでがん治療を開始した患者のデータを使用した。死亡率データは2022年4月6日まで更新され、更新から2022年9月30日までのデータを分析した。診断から180日以内に作成された腫瘍内科医または放射線医の診断書を持つすべての患者を対象とし、診断書は診断日に最も近い文書を選択した。複数のがんで受診した患者は除外した。
初診時の診断書は、従来の言語モデルとニューラル言語モデルを用いて分析された。主要評価項目は、機械学習モデルの性能をはかる指標の1つであるAUC(曲線下面積、1に近いほど性能が高いとされる)を含む、予測モデルの性能であった。副次評価項目として、モデルがどのような単語を使用したかを調査した。
主な結果は以下のとおり。
・患者5万9,800例中4万7,625例が解析対象となった。うち2万5,428例(53.4%)が女性、2万2,197例(46.6%)が男性で、平均(SD)年齢は64.9(13.7)歳であった。
・初回の診察から計算して、4万1,447例(87.0%)が6ヵ月、3万1,143例(65.4%)が36ヵ月、2万7,880例(58.5%)が60ヵ月後時点で生存していた。
・最良のモデルは、ホールドアウト検証において、6ヵ月生存の予測で0.856(AUC:0.928)、36ヵ月生存で0.842(AUC:0.918)、60ヵ月生存で0.837(AUC:0.918)という精度を達成した。
・6ヵ月生存と60ヵ月生存の予測において、重要となる単語は異なることが判明した。
著者らは「このモデルがこれまでのがん生存予測モデルと同等かそれ以上の性能を持ち、複数のがん種において予測が可能だった。複雑なデータ処理やデータマイニングを行うことなく一般的で容易に入手できる診断書を用いて、生存率を予測できる可能性があることを示唆している。さらに複数施設のデータを用いることで一般的ながん患者集団が対象となり、より一般化できるモデルの性能を調査することができた」としている。
(ケアネット 杉崎 真名)