生物統計

多重比較法の基礎と活用〜多重性の問題と代表的手法を図解で理解する〜

複数の評価変数が存在する場合、治療群間の比較や中間解析など臨床試験の様々な場面で検定の多重性が生じます。そこでType 1 FWER(familywise error rate)を強く制御する方法として、様々な方法が開発されています。そこで、今回は多重性の基礎とどのような方法があるかを紹介していきます。

多重性とは何か

統計解析では、複数の仮説検定を同時に行う場面が少なくありません。例えば、3種類の新薬とプラセボを比較する場合、各薬剤とプラセボの比較だけでなく、薬剤同士の比較も行うことがあります。
しかし、検定を繰り返すとFWERが上昇してしまうという問題が生じます。これを多重性(multiplicity)と呼びます。

FWERとは、複数の仮説検定の内、1つ以上の仮説検定で本当は正しい帰無仮説を誤って棄却される確率

具体例を用いて説明しますと、2つの検定でそれぞれ有意水準5%で行った場合のFWERは
\[{1-(1-0.05)^2}\times 100(\%) = 9.75%\]
3つの検定でそれぞれ有意水準5%で行った場合のFWERは
\[{1-(1-0.05)^3}\times 100(\%) = 14.26% \]
N個の検定では
\[{1-(1-0.05)^N}\times 100(\%) \]
となります。

多重性のイメージ
  • 1つの検定を有意水準5%で行った場合のFWER→5%
  • 3つの検定をそれぞれ有意水準5%で行った場合のFWER→14.26%
  • N個の検定では\({1-(1-0.05)^N}\times 100(\%) \)

このように、検定回数が増えると、FWERが急上昇します。臨床試験や品質評価など、誤判定が重大な影響を及ぼす分野では、この多重性を制御することが不可欠です。

なぜ多重比較法が必要か

多重比較法(multiple comparison procedures)は、複数の検定を行う際に全体の誤り率を制御するための統計的手法です。
目的は、FWERや、棄却した仮説の中での誤りの割合(False Discovery Rate: FDR)を一定以下に抑えることです。

FDR制御:棄却した仮説の中で誤りの割合を制御(探索的解析に適用)

FWER制御:少なくとも1つの真の帰無仮説を誤って棄却する確率を制御(検証的解析に適用)

全体の誤り率を抑える(FWER) → 保守的で安全
誤りの割合を抑える(FDR) → 検出力を確保しやすい

代表的な多重比較法

多重性を制御するための代表的な方法を紹介していこうと思います。

Bonferroni法

  • 方法:各検定の有意水準を \(\frac{\alpha}{m}\) に設定
    (m:検定回数, \(\alpha\):有意水準)
  • 特徴:単純で汎用性が高い。分布の仮定が不要
  • 欠点:検定回数が多いと検出力が低下

Holm法(逐次Bonferroni法)

  • 方法:p値を昇順に並べ、小さい順から順に有意水準を調整
  • 特徴:Bonferroniより検出力が高い
  • 用途:FWER制御を保ちつつ、やや緩やかな補正をしたい場合

Tukey-Kramer法

  • 方法:全てのペア間比較を同時に行い、分散分析の結果を利用
  • 特徴:サンプルサイズが異なる場合にも対応
  • 用途:平均値の全ペア比較(パラメトリック)

Dunnett法

  • 方法:特定の対照群と他群を比較
  • 特徴:比較回数が少なく、検出力が高い
  • 用途:プラセボ対複数治療群の比較など

Steel-Dwass法

  • 方法:ノンパラメトリックな全ペア比較
  • 特徴:正規性を仮定できない場合に有効
  • 用途:順位データや外れ値の多いデータ

以下多重比較法のフローチャートを載せておきます。

  • 正規性あり+全ペア → Tukey-Kramer法
  • 正規性あり+対照群のみ → Dunnett法

また最近ではGatekeeping法という手法もございます。自分の体感ですが、こちらがよく見かける手法となります。(こちらについてはまた別の記事で紹介していこうと思います。)

  • 方法:複数の仮説群(仮説族)をあらかじめ優先順位や構造に沿って検定し、上位の仮説群で有意が得られた場合のみ次の仮説群を検定する手法
  • 種類
    • Serial Gatekeeping:固定順序で次の仮説群へ進む
    • Parallel Gatekeeping:仮説群内のいずれかが有意なら次へ進む
    • Tree Gatekeeping:階層的・分岐的な構造で進む
  • 特徴:複雑な評価項目構造や主要・副次評価項目の組み合わせでも、FWERを厳密に制御可能
  • 用途:臨床試験の主要評価項目と主要副次評価項目の両方を承認申請に含めたい場合など

実務での留意点

可視化:結果は信頼区間や効果量と併せて提示すると理解しやすい

事前計画:臨床試験では、解析計画書(SAP)に多重比較法を明記

検出力のバランス:過度に保守的な補正は有意差を見逃すリスク

ソフトウェア活用:R, SAS, JMPなどで自動計算可能

まとめ

多重比較法は、複数の検定を行う際に誤判定を防ぐための必須ツールです。多重性の問題として 第一種の過誤が増加することにあります。そのため多重比較法の目的として 誤り率(FWERやFDR)の制御が必要となってきます。
手法選択の際にはデータ特性・比較目的・分布仮定に応じて選択していくことが必要となります。

ABOUT ME
tomokichi
外資系製薬会社で生物統計家として働ている1児のパパ。生物統計家とは何か、どのようなスキルが必要か、何を行っているのかを共有していきたいと思っております!生物統計に関する最新情報を皆様にお届けすべく、日々奮闘中です。趣味は筋トレ、温泉巡り、家族と散歩。