生存時間

層別Cox比例ハザードモデル:理論から実務まで

はじめに

Cox比例ハザードモデルは、生存時間解析における標準的手法であり、製薬業界の臨床試験解析においても治療効果推定や予後因子評価に広く用いられます。
しかし、臨床試験や観察研究では、比例ハザード性が成立しない共変量や、パラメータ化せずに調整したい因子が存在します。このような場合に有効なのが層別Cox比例ハザードモデル(Stratified Cox Model)です。そこで、今回は層別Cox比例ハザードモデルについて解説していこうと思います。

標準Coxモデルの数式と部分尤度

標準Coxモデルは次式で表されます。

\[h(t|X) = h_0(t) \exp(\beta^\top X)\]

  • \(h(t|X)\):共変量 X を持つ被験者の時刻 t におけるハザード
  • \(h_0(t)\):ベースラインハザード(共変量がゼロのときのハザード)
  • \(\beta\):回帰係数ベクトル(\(\exp(\beta_j)\) がハザード比)

Coxモデルは h_0(t) の形を仮定せず、\beta のみを推定するセミパラメトリックモデルです。尤度は次の部分尤度で構築されます。

\[L(\beta) = \prod_{d=1}^D \frac{\exp(\beta^\top X_{(d)})}{\sum_{j \in R(t_{(d)})} \exp(\beta^\top X_j)}\]

Cox比例ハザードモデルについては下記記事でも紹介しておりますので、興味がありましたら、ご一読ください。

Cox比例ハザードモデル入門〜数式から実務応用まで〜Cox比例ハザードモデル(Cox Proportional Hazards Model)は、共変量を考慮しつつイベント発生リスクを推定できる柔軟な回帰モデルとして広く用いられています。...

層別Coxモデルの数式と導出

層別Coxモデルでは、層ごとに異なるベースラインハザードを許容します。

\[h(t|X, s) = h_{0s}(t) \exp(\beta^\top X)\]

  • s:層インデックス(例:施設、国、ベースライン疾患重症度)
  • \(h_{0s}(t)\):層 s に固有のベースラインハザード

部分尤度は層ごとに計算し、積を取ります。

\[L(\beta) = \prod_{s=1}^S \prod_{d=1}^{D_s} \frac{\exp(\beta^\top X_{(d,s)})}{\sum_{j \in R_s(t_{(d,s)})} \exp(\beta^\top X_j)}\]

層化変数は係数推定されず、ベースラインハザードの違いとして調整されます。

なぜ層別化が必要か

非パラメトリック調整:層化変数をパラメータ化せずに調整でき、主要因子(例:治療群)の解釈が明確になります。

比例ハザード性の破れ:層化変数が時間依存的にハザードへ影響する場合、通常Coxモデルに含めると推定が歪む可能性があります。

chrome-extension://efaidnbmnnnibpcajpcglclefindmkaj/https://waidai-csc.jp/updata/2019/05/20191114_%E7%AC%AC7%E5%9B%9E_%E8%B3%87%E6%96%99.pdf

製薬業界での典型的利用場面

  • 多施設共同試験(施設間差の調整)
  • 国際共同試験(国ごとの医療水準差の調整)
  • 層別ランダム化試験(ランダム化因子を解析でも層化)
  • ベースラインリスク層別(疾患重症度やバイオマーカー)

R言語での実装例

library(survival)
data(lung)
lung$status <- ifelse(lung$status == 2, 1, 0)

#通常Coxモデル
fit_cox <- coxph(Surv(time, status) ~ age + sex + inst, data = lung)

#層別Coxモデル
fit_strata <- coxph(Surv(time, status) ~ age + sex + strata(inst), data = lung)

summary(fit_cox)
summary(fit_strata)

モデル年齢(HR)性別(HR, 男性基準)instの効果対数尤度
通常Cox1.02 (p<0.01)0.59 (p<0.01)有意な施設効果あり-506.3
層別Cox1.02 (p<0.01)0.58 (p<0.01)推定なし(層化)-504.8

解釈

  • 年齢・性別の推定値はほぼ同じだが、層別化により施設効果のパラメータ推定は行われず、施設間のベースライン差が非パラメトリックに調整される。
  • 層別Coxモデルでは対数尤度が改善しており、モデル適合度が向上。

層別Coxモデルの利点、注意点

層別Coxモデルの利点としてはいくつかあります。

  • 比例ハザード性が成立しない変数を安全に調整可能:
    層化変数については層ごとにベースラインハザード \(h_{0s}(t)\) を許容するため、その変数が時間とともに影響を変える場合でも、主要因子の係数 \(\beta\) の推定は整合的でいられます。層内での比例ハザード性だけが仮定となり、モデルの当てはめが安定します。
  • 主要因子の推定値のバイアス低減:
    治療など主要因子のハザード比は、層ごとに異なるベースラインを条件付けた「層内共通の比」として解釈できます。二群比較の場合、Mantel–Haenszel型の条件付き推定に近い直観的な意味合いを持ちます
  • ベースラインハザードの層間差を許容:ランダム化時に用いた層(例:施設、国、重症度)を解析でも層化に反映することで、設計と解析の整合性が保たれ、推定のバイアス低減と精度向上に資します。

まとめ

層別Coxモデルは、比例ハザード性が破れる変数や、パラメータ化せずに調整したい因子を扱う上で有効な手法です。
製薬業界の臨床試験解析では、施設や国、ベースラインリスクなどを層化することで、より頑健で解釈可能な治療効果推定が可能になります。
実データ比較からも、層別化はモデル適合度の改善や推定の安定化に寄与することが確認できます。

ABOUT ME
tomokichi
外資系製薬会社で生物統計家として働ている1児のパパ。生物統計家とは何か、どのようなスキルが必要か、何を行っているのかを共有していきたいと思っております!生物統計に関する最新情報を皆様にお届けすべく、日々奮闘中です。趣味は筋トレ、温泉巡り、家族と散歩。
RELATED POST