はじめに

臨床試験では、患者さんの症状やバイオマーカーを複数の時点で測定し、治療効果を評価することが一般的です。こうした 経時測定データ(longitudinal data) には必ずと言ってよいほど「欠測」が発生します。例えば、患者が途中で来院しなくなったり、副作用で脱落したりするケースです。
このような欠測を伴うデータ解析において、近年広く用いられているのが MMRM(Mixed-Effects Model for Repeated Measures) です。MMRM は「欠測がランダムに発生する(MAR: Missing At Random)」という前提のもと、欠測を含むデータでも妥当な推測を可能にします。
しかし、小標本(例数が少ない試験)や欠測が多い状況では、従来の推測手法(REML や Kenward-Roger 法など)が 第1種過誤率(Type I error)を制御できず、誤って有意と判定してしまう ことが知られています。そこで、並べ替え法(Permutation test) を MMRM に応用する新しい推測手法を提案されています。本稿ではその手法を紹介していきたいと思います。
従来の手法であるMMRMについては下記記事で紹介しておりますので是非ご一読ください。

MMRM(反復測定混合モデル)とは― 臨床試験での柔軟な時系列解析手法 ―MMRM(Mixed Model for Repeated Measures)です。この手法は、欠測値に強く、時系列の相関構造をモデル化できるため、近年の臨床試験では標準的な解析法として広く用いられています。本記事ではMMRMについて解説していきます。...

MMRM の基本構造

MMRM は、線形混合モデルを周辺化した形で表現されます。

線形混合モデル

まず、従来の線形混合モデルは以下の式で表されます:

\[Y_i=X_i\beta +Z_ib_i+\varepsilon _i\]

  • \(Y_i\):被験者 i の観測値ベクトル
  • \(X_i\):固定効果のデザイン行列
  • \(\beta\) :固定効果パラメータ
  • \(Z_i\):変量効果のデザイン行列
  • \(b_i\sim MVN(0,D)\):変量効果
  • \(\varepsilon _i\sim MVN(0,\Sigma )\):誤差項

これを周辺化すると、

\[Y_i\sim MVN(X_i\beta ,V_i),\quad V_i=Z_iDZ_i^T+\Sigma\]

となります。

MMRM では、変量効果の分布を明示的にモデル化せず、周辺分散共分散行列 \(V_i\) を直接モデル化 します。これにより、変量効果の誤特定によるバイアスを回避し、固定効果 \(\beta\) の推定に集中できます。

並べ替え法による推測

並べ替え法は「データのラベルや残差をランダムに並べ替え、帰無仮説の下での分布を近似する」方法です。小標本でも有効で、古典的には Fisher (1935) によって提案されました。MMRM に対して以下の2つの並べ替え法を提案しています。

方法1:比較群指示変数の並べ替え

治療群の割付がランダムであることを利用し、群ラベル(治療群 vs プラセボ群)を並べ替える 方法です。

アルゴリズム概要

  1. 観測データから Wald 型統計量を計算
    \[T=\frac{\hat {\beta }_1-\beta _{\mathrm{null}}}{\sqrt{\mathrm{Var}(\hat {\beta }_1)}}\]
  2. 群ラベルをランダムに並べ替え、各並べ替えデータで同じ統計量を計算
  3. 並べ替え分布を参照分布とし、P値を算出
イメージ図

患者群ラベル: [治療, 治療, プラセボ, プラセボ]
↓ ランダムに並べ替え
[プラセボ, 治療, プラセボ, 治療]

この方法は「ランダム化の原理」に基づくため直感的でわかりやすいですが、MMRM のように共分散構造を含むモデルでは厳密な正確性は保証されません。ただし、経験的には小標本でも良好な性能を示します。

重み付き残差の並べ替え

もう一つの方法は、帰無仮説下で推定された残差を重み付けして並べ替える 方法です。

アルゴリズム概要

  1. 帰無仮説下でのモデルから予測値 \(\hat {Y}_i\) を計算
  2. 残差をコレスキー分解した行列\( U_i\) で標準化
    \[e_i=U_i^{-1}(Y_i-X_i\hat {\beta })\]
    → この残差は標準正規分布に従う
  3. 残差をランダムに並べ替え、予測値に加えて新しいデータを生成
  4. 各並べ替えデータで統計量を計算し、分布を構築
イメージ図

残差ベクトル e = [0.5, -1.2, 0.8, …]
↓ ランダムに並べ替え
e’ = [-1.2, 0.8, 0.5, …]
↓ 予測値に加算して新しいデータを生成

シミュレーション結果

著者らは、サンプルサイズが 各群10例(合計20例) という小標本条件でシミュレーションを行いました。

シナリオ

  • Scenario 1:群間差なし(帰無仮説が真) → 第1種過誤率の評価
  • Scenario 2:群間差あり(対立仮説が真) → 検出力の評価

欠測メカニズム

  • MCAR:完全にランダムな欠測
  • MAR:直前の値に依存する欠測

結果概要

  • 標準的な REML や ML 法では、欠測率が増えると第1種過誤率が膨張
  • Kenward-Roger 法は改善するが、依然として小標本では不安定
  • 提案した PermTrt(群ラベル並べ替え)PermWR(重み付き残差並べ替え) は、検出力も標準法と同等以上、第1種過誤率を良好に制御

まとめ

本稿では欠測を伴う経時測定データ解析に広く用いられている MMRM(Mixed-Effects Model for Repeated Measures) において、小標本や欠測が多い状況で従来の推測手法が第1種過誤率を制御できないという問題に対し、並べ替え法(Permutation test)を応用した新しい推測手法 を紹介しました

具体的には、

  1. 比較群指示変数の並べ替え法(PermTrt)
    • 治療群ラベルをランダムに並べ替え、帰無仮説下での統計量分布を近似する方法。
    • ランダム化の原理に基づき直感的で理解しやすい。
  2. 重み付き残差の並べ替え法(PermWR)
    • 帰無仮説下で推定された残差を標準化し、ランダムに並べ替えて新しいデータを生成する方法。
    • 群ラベルを保持しつつ残差のみを並べ替えるため、説明変数と結果変数の関係を維持できる。

シミュレーション実験では、各群10例という小標本条件下で、欠測率が20〜40%に達する状況を想定。結果として、従来の REML や ML 法では欠測率が増えると第1種過誤率が膨張する一方、Kenward-Roger 法は改善するものの安定性に欠けることが確認された。これに対し、提案した PermTrt と PermWR は第1種過誤率を良好に制御し、検出力も標準法と同等以上であることが示されました。

参考

欠測を伴う経時測定データにおけるMMRM(Mixed-Effects Model for Repeated Measures)の並べ替え法に基づく推測手法(2019, 右京)
https://www.jstage.jst.go.jp/article/jjb/40/1/40_15/_article/-char/ja

ABOUT ME
tomokichi
外資系製薬会社で生物統計家として働ている1児のパパ。生物統計家とは何か、どのようなスキルが必要か、何を行っているのかを共有していきたいと思っております!生物統計に関する最新情報を皆様にお届けすべく、日々奮闘中です。趣味は筋トレ、温泉巡り、家族と散歩。