英国インペリアル・カレッジ・ロンドンのGraham D Cole氏らは、盲検化ケースコントロール試験により、取り下げ vs.非取り下げの臨床試験報告における矛盾点の出現頻度を調べた。その結果、取り下げ論文で、有意に多くの矛盾点が確認されたことを報告した。検討は取り下げの有無を知らされていない専門外のサイエンティストによって行われた。著者は「矛盾点は、信頼に値しない臨床試験報告を早期にかつすみやかに発見するシグナルといえそうだ」とまとめている。BMJ誌オンライン版2015年9月20日号掲載の報告。
取り下げ論文と非取り下げ論文の矛盾点数を比較
研究グループは、PubMedで取り下げに分類された臨床試験報告50本を無作為に選択し、対となるようにそれぞれ同一のジャーナルから、先行の非取り下げ臨床試験報告を50本選び検討を行った。試験報告は、2012年12月以降のものを対象とした。
取り下げに関する情報をすべて削除した100本の論文の矛盾点を、取り下げ情報について伏せられた3人のサイエンティストが評価。矛盾点をプールし、クロスチェックを行い、あらかじめ規定したカテゴリでカウントした。その後、取り下げ情報を公開し分析した。
主要評価項目は、各論文の総矛盾点数(数学的、論理的な矛盾ステートメントで定義)とした。
とくに多いのは、事実の食い違い、計算エラー、p値のミス
評価論文100本において、479件の矛盾点が発見された。348件は取り下げ論文で見つかり、非取り下げ論文では131件だった。
平均すると、取り下げ論文1本につき認められた矛盾点は、非取り下げ論文のそれよりも有意に多かった。中央値比較で4(四分位範囲:2~8.75) vs.0(0~5)であった(p<0.001)。
矛盾がみられたペーパーは、取り下げ論文のほうが有意に多いようであった(オッズ比:5.7、95%信頼区間[CI]:2.2~14.5、p<0.001)。とくに、非取り下げ論文と比べて取り下げ論文では次の3タイプの矛盾の発生頻度が有意に高かった。事実の食い違い(p=0.002)、計算エラー(p=0.01)、p値のミス(p=0.02)。
後ろ向き解析の結果、引用とジャーナルのインパクトファクターは、上記の結果には影響していないと思われた。
これらを踏まえて著者は、「発表試験報告における矛盾点は重要ではないと看過すべきではない。盲検化された専門外のサイエンティストでも、非取り下げ論文と比べて取り下げ論文で有意に多くの矛盾点を確認した。矛盾点は、信頼に値しない臨床試験報告を早期かつすみやかに発見するシグナルだといえる」とまとめている。