既存の心血管疾患リスク予測モデルは有用であり、これらモデルの直接比較はベネフィットをもたらすと考えられるが、比較試験の論文はアウトカムの選択バイアスや楽天主義バイアスの影響を受けていることが、ギリシャ・Ioannina大学のGeorge C M Siontis氏らの検討で示された。臨床での使用が推奨されている心血管疾患リスク予測モデルの中には、異なる集団やアウトカムに関して開発され、妥当性の検証が行われているものがある。最も一般的で広く普及しているリスクモデルでも、その識別、キャリブレーション、再分類に関する予測能はほとんど知られていないという。BMJ誌2012年6月2日号(オンライン版2012年5月24日号)掲載の報告。
予測モデルを比較した試験を系統的にレビュー
研究グループは、確立された心血管リスク予測モデルの比較に関するエビデンスの評価を行い、相対的な予後予測能の比較情報を収集するために、予測モデルの比較試験を系統的にレビューした。
2011年7月までにMedlineに登録され、2つ以上のモデルを比較した論文を検索した。適格論文の引用文献や参考文献の調査も行った。
試験デザイン、リスクモデル、アウトカムに関する情報を抽出して、モデルの相対的な検出能(識別能、キャリブレーション、リスクの再分類)を評価し、アウトカムの決定や、新規導入モデルおよび著者開発モデルに有利に働く楽天主義バイアス(optimism bias)の検討を行った。
8モデルの比較論文を解析、バイアスの影響は明らか
8つのモデルの56種の一対比較に関する20の論文が解析の対象となった。8つのモデルは以下のとおり。Framinghamリスクスコアの2つの改訂版、assessing cardiovascular risk to Scottish Intercollegiate Guidelines Network to assign preventative treatment(ASSIGN)スコア、systematic coronary risk evaluation(SCORE)スコア、Prospective Cardiovascular Münster (PROCAM)スコア、QRESEARCH cardiovascular risk(QRISK1、QRISK2)アルゴリズム、Reynoldsリスクスコア。
識別能については、56の比較のうち受信者動作特性(ROC)曲線下面積(AUC)に基づく相対的な誤差が5%を超えたのは10のみであったが、これ以外の識別能の評価指標は一致率が低かった。キャリブレーション能は38の比較について報告されていたが、一貫性はまったくなかった。リスクの分類/再分類の報告は少なく、10の比較のみだった。
比較された2つのモデルの双方が、当該アウトカム用に独自に開発され妥当性の検証が行われていたのは13の比較のみで、32の比較では一方のみが独自開発であり、残りの11の比較ではいずれのモデルも独自開発ではなかった。
一方のみ独自開発のモデルの比較のうち25の比較(78%)では、アウトカム適合モデルのほうが、比較されるモデルよりもAUCが有意に良好だった(p<0.001)。さらに、独自開発モデルの論文の筆者は、常に自分が開発したモデルのAUCが優れると報告していた(新規導入モデルに関する5論文とその後の評価を行った3論文)。
著者は、「これらの心血管疾患リスクの予測モデルは十分に確立されたものである。これらの直接比較はベネフィットをもたらすと考えられるが、論文がアウトカムの選択バイアスや楽天主義バイアスの影響を受けていることも明らかだ」と結論し、「新規モデルと既存の確立されたモデルの比較による改良は、理想的にはいずれのモデルの開発からも独立した研究者によって行われるべきである」としている。
(菅野守:医学ライター)