複合アウトカムを信用してはいけない?

提供元:ケアネット

印刷ボタン

公開日:2010/09/03

 

 臨床試験で使用される複合アウトカム(composite outcome)は、多くの場合、個々のアウトカムを組み合わせる根拠が不十分で、定義に一貫性がなく、報告も正確性を欠いていることが、デンマーク・コペンハーゲン大学のGloria Cordoba氏らによる系統的なレビューによって明らかとなった。複合アウトカムによる評価では、個々のアウトカムのうち最も重要な項目の有効性が最低だったり、重要性が低い項目の有効性が最も高くなる場合が多いが、複合アウトカムの結果が統計学的に有意な場合、このデータを見た臨床医は有効性が低いにもかかわらず重要アウトカムを予測しがちだという。複合アウトカムを用いる主な利点は、統計学的に十分なイベント数を確保してサンプル数を少なくし、コストと時間を節減することだが、統計学的な有意性を確実なものにするには、複合アウトカムに含める個々のアウトカムの選択基準を確立すべきとの見方もある。BMJ誌2010年8月21日号(オンライン版2010年8月18日号)掲載の報告。

複合アウトカムの定義、報告、解釈を系統的にレビュー

 複合アウトカムは、いつくかのアウトカムを統合して単一の測定項目とした指標である。研究グループは、複合アウトカムがいかに定義され、報告され、解釈されたかについて系統的なレビューを行った。

 2008年に発表され、数値データとして表記された測定項目から成る複合アウトカムが設定されたパラレルグループ無作為化臨床試験の論文を解析の対象とした。2名の研究者が標準化されたデータシートを用いて個々にデータの抽出を行った。さらに、別の2名の研究者が、当該試験の結果を知らされない状態で、最も重要なアウトカムを選定した。

複合アウトカムの定義が試験中に変更されていた

 対象となった40試験のうち29試験(73%)が循環器領域の研究で、24試験(60%)は資金のすべてあるいは一部が製薬会社の拠出であった。

 複合アウトカムに含まれた個々のアウトカム数の中央値は3(範囲:2~9)であった。33試験(83%)では、死亡あるいは心血管死が最も重要なアウトカムとされていたが、個々のアウトカムの選択に関する十分な理論的根拠が示された論文はわずか1編のみであった。

 28試験(70%)については、個々のアウトカムの重要度に関する見解が、論文の筆者とレビューを行った評価者で一致しなかった。このうち20試験では、「死亡」と「入院」が一つの複合アウトカムに統合されていた。

 さらなる重大な問題点としては、(1)抄録、方法、結果のそれぞれに記載された複合アウトカムの定義が変更されている(13試験)、(2)データが消失、あいまい、解釈不能(9試験)、(3)事後的に複合アウトカムを設定(4試験)、が挙げられた。

 複合アウトカムと個々のアウトカムについて信頼性の高い評価が行われていたのは24試験(60%)のみであり、個々のアウトカムの臨床的重要性が同等あるいは同等と推察され、かつ信頼に足る評価が行われていたのは6試験(15%)にすぎなかった。

 複合アウトカムに統計学的有意差を認めたとする16試験のうち11試験では、抄録の結論において、個別の最重要アウトカムの有効性は低かったにもかかわらず、有効であったかのように虚偽の印象を与える表現がなされていた。

 これらの知見を踏まえ、著者は「臨床試験における複合アウトカムの使用には問題がある。多くの場合、個々のアウトカムを組み合わせる根拠が不十分であり、定義に一貫性がなく、報告に正確性を欠いている」と結論し、「これらの問題は多くの読者を混乱に陥れ、介入による効果の程度について実際よりも誇大な印象を与えかねない」と指摘している。

(菅野守:医学ライター)