無作為化試験で効果が非常に大きい(VLE:相対リスクが0.2以下または5以上)結果が示された場合は、その後の試験は行わなくてもよいのではないか。この疑問について、英国インペリアル・カレッジ・ロンドンのMyura Nagendran氏らが、公表されている無作為化試験データをメタ疫学的評価で調べる検討を行った。その結果、大規模試験でVLEが示される頻度は、ほぼゼロに近く、そのことからVLEは信頼性のあるマーカーとはなりえず、実質的なものでも有用なものでもないと報告している。さらに著者は、「小規模試験のVLEを解釈する場合は注意をしなければならない」と指摘している。BMJ誌2016年10月27日号掲載の報告。
その後の大規模無作為化試験での結果を評価
研究グループは、Cochrane Database of Systematic Reviews(2010年issue 7)と以降の2015年issue 12までの大規模試験のデータを用いて検討を行った。包含されたのは、すべての2項(バイナリ)アウトカムのフォレストプロットが選択されており、指標として無作為化試験のVLEが名目上の統計的有意差(p<0.05)を示しているもの、その効果の検証としてその後に大規模無作為化試験(イベント・非イベント数がいずれも200例以上)が行われているもの、主要アウトカム評価がされているレビューで、サブグループ解析または感度解析ではないものとした。
その後の大規模無作為化試験における効果はほぼゼロ値に近いものに
8万5,002のフォレストプロットデータを含む3,082件のレビューのうち、包含基準を満たしたのは44件(0.005%)であった。指標試験は概して小規模で、サンプル数の中央値は99例(イベント中央値14例)であった。また、バイアスリスクについて評価した試験はほとんどなかった(9/44件、20%)。
43/44例で、以降の大規模試験での相対リスクはほぼゼロに近いものであった。その後の大規模試験データで、同様の効果を統計的有意差(p<0.05)をもって見い出すことができたのは、19/44例(43%、95%信頼区間[CI]:29~58%)であった。
その後の大規模試験で同様の効果が見い出された場合でも、その追加の主要アウトカムをもってしても、その介入を使用することを決定する前に考慮が必要になると思われた。なお、指標試験の評価でp<0.001も用いられている場合は19/21例の試験で、その後の大規模試験で同様の効果が認められるとのデータが示された。