Win Ratio法による複合エンドポイント解析 — Rでの実装と心血管試験での活用

記事の目次
Toggleこの記事でわかること
・Win Ratio法が従来のtime-to-first-event解析の限界をどう克服するかが理解できます
・「勝ち(Win)/負け(Loss)/引き分け(Tie)」という直感的な比較ルールの考え方を学べます
・階層的複合エンドポイントの数理的な定義と信頼区間の構成方法を整理できます
・Rでの実装に進むための理論的土台(Pocock et al. 2012の枠組み)を押さえられます
・心血管試験を中心としたWin Ratio法の活用シーンが具体的にイメージできます
はじめに
心血管領域の大規模臨床試験では、死亡・心不全による入院・心血管イベントといった複数のエンドポイントを「複合エンドポイント」としてまとめて評価することが一般的です。しかし従来の time-to-first-event 型の解析では、患者ごとに「最初に起こったイベント」だけを採用するため、軽症イベント(例:入院)と重篤イベント(例:心血管死)が同じ重みで扱われてしまうという問題が長年指摘されてきました。
そこで2012年、Pocock らによって European Heart Journal 誌で提案されたのが Win Ratio法 です。Win Ratio法は、治療群と対照群の患者をペアごとに比較し、「臨床的に重要なイベントから順に階層的に勝敗を判定する」という極めて直感的な発想に基づいています。重篤なイベントを優先的に評価できるため、規制当局・学術誌の双方から強い関心を集めており、近年は EMPULSE 試験や ATTR-ACT 試験など主要な心血管試験での主要解析として採用されています。
本記事は、製薬企業の生物統計担当者・臨床開発担当者・心血管領域の研究者の方を主な対象としています。Win Ratio法の理論的背景から R を用いた実装、そして結果の解釈・落とし穴・規制当局向けレポートでの記載方法までを一気通貫で解説していきます。
構成としては、まず本章でWin Ratio法の数理的な定義と階層比較の考え方を整理します。続く章でRパッケージ(WINS / WWR)を用いた具体的な実装手順を扱い、心血管試験を想定したシミュレーションデータでの解析例、結果の解釈、運用上の注意点へと進んでいきます。それでは早速、Win Ratio法の核心に踏み込んでいきましょう。

Win Ratio法とは — 階層的複合エンドポイントの新しい考え方
従来の複合エンドポイント解析、すなわち time-to-first-event 解析では、患者ごとに最初に発生したイベントのみを採用し、Cox 比例ハザードモデルなどでハザード比を推定します。この方法はシンプルで広く使われてきましたが、「死亡」と「入院」を同等に扱ってしまう という重大な制約があります。たとえば、ある患者で先に入院が起こった場合、その後の死亡情報は解析に反映されません。臨床的には死亡こそが最も重要なエンドポイントであるにも関わらず、軽症イベントが先に起これば重篤イベントが「埋もれてしまう」という不自然さが残ります。
この問題に対する一つの解決策として、Pocock, Ariti, Collier, Wang による2012年の論文 “The win ratio: a new approach to the analysis of composite endpoints in clinical trials based on clinical priorities”(European Heart Journal, 33, 176–182)でWin Ratio法が提案されました。発想は驚くほどシンプルです。治療群の患者一人と対照群の患者一人を1対1でペアにし、臨床的に重要なイベントから順番に勝敗を判定する というものです。
判定ルールは「勝ち(Win)」「負け(Loss)」「引き分け(Tie)」の3通りです。たとえば、最優先エンドポイントを「心血管死」、第2階層を「心不全による入院」とした場合、まずペア内で心血管死の発生有無・発生時期を比較します。治療群の患者の方が長く生存していれば「治療群の勝ち(Win)」、対照群の方が長く生存していれば「治療群の負け(Loss)」、両者とも死亡しなかった(または同時期に死亡した)場合は引き分けとなり、第2階層の「心不全による入院」の比較へと進みます。
このように、Win Ratio法は 重篤イベント>軽症イベント という臨床的優先順位を解析にそのまま反映できる点が最大の強みです。重要なイベントで先に勝敗がついたペアは、そこで判定確定となるため、軽症イベントが重篤イベントを覆い隠すことがありません。
Win Ratio法は「臨床医が患者2人を見比べて、どちらの予後が良かったか直感的に判断する」というプロセスを統計手法として定式化したものと考えると理解しやすくなります。ペアワイズ比較という発想自体は Mann-Whitney 検定や Gehan 検定とも共通する古典的なものですが、それを階層的に拡張した点がWin Ratio法の独創性です。
Win Ratioの数理的背景と算出方法
Win Ratio の定義式は極めてシンプルです。治療群の総勝利数を \( W_T \)、対照群の総勝利数を \( W_C \) としたとき、Win Ratio は次式で与えられます。
\[ \text{Win Ratio} = \frac{W_T}{W_C} \]
ここで \( W_T \) は、治療群と対照群の全ペア(\( N_T \times N_C \) 通り)のうち、階層比較の結果「治療群が勝ち」と判定されたペアの総数を指します。同様に \( W_C \) は「対照群が勝ち」と判定されたペア数です。引き分け(Tie)となったペアは分子・分母のいずれにもカウントされません。Win Ratio が 1 より大きければ治療群が優位、1 未満であれば対照群が優位 を意味します。
階層比較の手続きは、擬似コード的に書くと次のようになります。
\[ \text{For each pair }(i, j),\ i \in T,\ j \in C: \]
\[ \quad \text{Step 1: Compare endpoint 1 (e.g., CV death)} \]
\[ \quad \text{Step 2: If tie, compare endpoint 2 (e.g., HF hospitalization)} \]
\[ \quad \text{Step 3: If still tie, declare tie} \]
つまり、最優先エンドポイントで勝敗が決まればその時点で確定し、引き分けの場合のみ次階層のエンドポイントへ進むという流れです。この逐次的な判定こそが、階層的複合エンドポイントの本質となります。
信頼区間と検定統計量の構成については、Pocock らは Finkelstein-Schoenfeld 検定との関係性を示しつつ、非中心化U統計量(generalized U-statistic)に基づく分散推定を提案しています。具体的には、Win Ratio の対数 \( \log(W_T / W_C) \) が漸近的に正規分布に従うことを利用し、次のように95%信頼区間を構成します。
\[ \exp\left( \log\left( \frac{W_T}{W_C} \right) \pm 1.96 \times \text{SE}\left( \log\left( \frac{W_T}{W_C} \right) \right) \right) \]
ここで \( \text{SE} \) は U統計量の分散構造(Bebu & Lachin の方法、または bootstrap)から推定された標準誤差を表します。Rパッケージの WWR や WINS ではこの標準誤差計算が自動化されており、ユーザーは元データを与えるだけで Win Ratio と信頼区間・p値が得られる設計になっています。

具体的なペア判定例をストライプテーブルで整理します。最優先エンドポイントを「心血管死」、第2階層を「心不全による入院」と設定したケースです。
| ペア番号 | 治療群患者の状況 | 対照群患者の状況 | 判定 |
|---|---|---|---|
| 1 | 生存(追跡180日) | 90日目に心血管死 | 治療群の勝ち(Win) |
| 2 | 60日目に心血管死 | 生存(追跡180日) | 治療群の負け(Loss) |
| 3 | 生存/入院なし | 生存/120日目に心不全入院 | 階層2で治療群の勝ち |
| 4 | 生存/入院なし | 生存/入院なし | 引き分け(Tie) |
ペア比較では「打ち切り(censoring)」の扱いに細心の注意が必要です。たとえば治療群患者が追跡180日で打ち切られ、対照群患者が200日目に死亡した場合、180日時点での死亡有無は両者とも未発生のため、このペアは「比較不能(uninformative)」として引き分け扱いとなります。打ち切り時間の違いが Win Ratio に偏りを与える可能性があるため、追跡期間の設計段階から十分な検討が求められます。
以上が Win Ratio法の理論的な骨格となります。次章以降では、これらの数理的定義を実際のRコードに落とし込み、シミュレーションデータでの解析手順を一つずつ確認していきます。
RでWin Ratioを実装する(WWRパッケージ)
ここからは、RでWin Ratio法を実際に動かしてみます。CRANに公開されている WWR パッケージを利用すると、Pocock らが2012年に提案したWin Ratioの計算が数行で実行できます。なお、本章で示す数値はすべて典型例のシミュレーションであり、特定の臨床試験を再現したものではありません。実データ解析の際は試験プロトコルに合わせて適宜読み替えてください。
必要なパッケージのインストールと読み込み
最初に、WWR パッケージをCRANからインストールします。あわせて、データ整形に使う dplyr と可視化用の ggplot2 も読み込んでおきます。ここで WWR は Win-Win Ratio の略で、Pocock らのオリジナル手法を実装したパッケージを意味します。
# CRANから初回のみインストール
install.packages("WWR")
# パッケージ読み込み
library(WWR)
library(dplyr)
library(ggplot2)
set.seed(20260526) # 再現性のための乱数シード
> packageVersion("WWR")
[1] '1.1'
WWRパッケージはバージョンによって関数名や引数の順序が変わることがあります。本記事では擬似コードとして典型的な使い方を示していますので、実務で利用する際は必ず
?WWR::wwr で最新のドキュメントを確認してください。サンプルデータの作成
治療群 N=200、対照群 N=200 の心不全試験を想定したサンプルデータを作成します。エンドポイントは優先順位の高い順に、①心血管死亡、②心不全入院、③QOLスコア低下の3階層です。ここで「QOLスコア低下」とはベースラインからの変化量がマイナスに大きい(=悪化している)ことを意味します。
n_trt <- 200
n_ctrl <- 200
N <- n_trt + n_ctrl
dat <- data.frame(
id = 1:N,
trt = c(rep(1, n_trt), rep(0, n_ctrl)),
# ① 心血管死亡:観察時間と死亡フラグ
time_death = c(rexp(n_trt, rate = 0.04), rexp(n_ctrl, rate = 0.06)),
event_death = rbinom(N, 1, 0.18),
# ② 心不全入院:再入院までの時間
time_hosp = c(rexp(n_trt, rate = 0.10), rexp(n_ctrl, rate = 0.14)),
event_hosp = rbinom(N, 1, 0.32),
# ③ QOLスコア変化量(マイナスが悪化)
qol_change = c(rnorm(n_trt, mean = 3.0, sd = 8),
rnorm(n_ctrl, mean = -0.5, sd = 8))
)
head(dat, 3)
> id trt time_death event_death time_hosp event_hosp qol_change
> 1 1 1 28.32 0 12.45 1 6.21
> 2 2 1 9.81 1 4.07 1 -2.04
> 3 3 1 41.06 0 21.88 0 8.77
データ構造の解説
wwr() 関数に渡す前に、各変数の意味と型を整理しておきます。ここで「型」とは R 上の data class を意味します。
| 変数名 | 説明 | 型 |
|---|---|---|
| id | 患者ID | integer |
| trt | 治療群=1, 対照群=0 | integer/factor |
| time_death | 心血管死亡までの時間(月) | numeric |
| event_death | 心血管死亡フラグ(1=発生) | integer |
| time_hosp | 心不全入院までの時間(月) | numeric |
| event_hosp | 心不全入院フラグ(1=発生) | integer |
| qol_change | QOLスコア変化量(+が改善) | numeric |
wwr() 関数の実行
優先順位を「①心血管死亡 → ②心不全入院 → ③QOLスコア」の順に設定し、Win Ratioを計算します。ここで y は階層別エンドポイントのリスト、trt は治療群フラグを意味します。
# 優先順位の高い順にエンドポイントを並べる
res <- WWR::wwr(
y = list(
list(time = dat$time_death, event = dat$event_death), # 階層1
list(time = dat$time_hosp, event = dat$event_hosp), # 階層2
list(value = dat$qol_change) # 階層3
),
trt = dat$trt,
stratum = NULL # 層別なし
)
# 詳細はパッケージドキュメント参照
summary(res)
> Win Ratio Analysis (Pocock 2012)
> ----------------------------------------
> N (Treatment / Control) : 200 / 200
> Total pairs : 40000
> Wins (treatment) : 6512
> Losses(treatment) : 4836
> Ties : 28652
> ----------------------------------------
> Win Ratio : 1.347
> 95% CI : 1.082 - 1.677
> p-value : 0.0078
Win Ratio = 1.347(95%CI: 1.082-1.677, p=0.0078)という結果は、治療群が対照群と比較してペアごとに約35%多く「勝つ」ことを示しています。40,000ペアのうちタイ(引き分け)が28,652ペアと約72%を占めますが、これは観察期間内にいずれの階層でもイベントが発生しなかったペアが多いためです。Win 6,512 vs Loss 4,836 の比が1.347となり、95%CIの下限が1を上回ることから、有意水準5%で治療群が有意に優れていると結論できます。心血管試験では「死亡を最重要視しつつ、QOLまで含めて総合評価したい」というニーズに合致する結果と言えます。

階層を変えたときの感度分析
Win Ratio は階層の順序に依存するため、優先順位の妥当性を感度分析で確認することが推奨されます。ここで「感度分析」とは、解析仮定を一部変えたときに結論が大きく変わらないかを確認する解析を意味します。
| シナリオ | 階層構成 | Win Ratio (95%CI) | p値 |
|---|---|---|---|
| 主解析 | 死亡 → 入院 → QOL | 1.347 (1.082-1.677) | 0.0078 |
| 感度分析① | 死亡 → 入院(QOL除外) | 1.282 (1.029-1.598) | 0.027 |
| 感度分析② | 入院 → 死亡 → QOL(順序入替) | 1.193 (0.964-1.476) | 0.105 |
主解析(1.347)と感度分析①(1.282)はほぼ同水準で、QOLを除外しても結論は変わりません。一方で、入院を死亡より優先した感度分析②ではWin Ratioが1.193まで縮小し、p値も0.105と有意水準を下回ります。これは「重篤度の高いイベントを上位に置く」という臨床的原則がWin Ratioの数値に大きく影響することを示唆しており、解析計画書(SAP)で階層順序を事前に固定しておくことの重要性が確認できます。
結果の可視化
Win/Loss/Tie の内訳を棒グラフで可視化すると、ステークホルダーへの説明がスムーズになります。
plot_df <- data.frame(
category = factor(c("Win", "Loss", "Tie"), levels = c("Win", "Loss", "Tie")),
pairs = c(6512, 4836, 28652)
)
ggplot(plot_df, aes(x = category, y = pairs, fill = category)) +
geom_col(width = 0.6) +
geom_text(aes(label = scales::comma(pairs)), vjust = -0.4, size = 5) +
scale_fill_manual(values = c("Win" = "#2E86C1", "Loss" = "#E67E22", "Tie" = "#BDC3C7")) +
labs(title = "Win Ratio: ペア比較の内訳(全40,000ペア)",
x = NULL, y = "ペア数") +
theme_minimal(base_size = 14) +
theme(legend.position = "none")
WinとLossの棒の高さの比(6,512 / 4,836 ≈ 1.347)が、そのままWin Ratioの点推定値に対応しています。タイが28,652ペアと圧倒的多数を占めている点は、観察期間や追跡期間の延長によって解像度が上がる余地があることを示唆します。試験計画段階で「タイをどの程度許容するか」を事前に検討することが、Win Ratio解析の検出力を左右します。
既存手法(複合エンドポイント・Cox回帰・競合リスク)との比較
Win Ratio法の位置づけを正しく理解するためには、従来の臨床試験で広く用いられてきた既存手法との比較が欠かせません。ここでは、time-to-first-event型の複合エンドポイント、Cox比例ハザード回帰、競合リスク解析、RMSTの4つと対比しながら、それぞれの強みと弱みを整理していきます。
Time-to-first-event型複合エンドポイントの限界
心血管試験では、長らく「死亡・心不全入院・心筋梗塞のいずれか初発まで」のような複合エンドポイントが用いられてきました。サンプルサイズを抑えながら検出力を確保できる利点はあるものの、次の2つの限界が以前から指摘されています。
一つ目は、軽症イベントと重症イベントが等価に扱われる点です。心血管死と入院イベントが「いずれか初発」として一括りにされるため、患者にとって最も避けたい死亡イベントの重みが、結果として希薄化してしまいます。
二つ目は、複数イベントの情報損失です。同一患者が入院後に死亡しても、解析上は「初発の入院」だけがカウントされ、その後の死亡情報は活かされません。長期追跡の心血管試験では、この情報損失が無視できない規模になります。
Cox比例ハザード回帰との違い
Cox回帰は依然として臨床試験の中心的手法ですが、Win Ratioとは設計思想が大きく異なります。
Cox回帰は比例ハザード仮定に強く依存し、効果量はハザード比(HR)として表現されます。一方Win Ratioは比例ハザード仮定を必要とせず、勝敗の比という直感的な指標で効果を示します。比例ハザードが満たされない治療効果(例:効果が時間とともに増大するSGLT2阻害薬など)では、Win Ratioの解釈優位性が際立ちます。
また、Cox回帰のHRは「単位時間あたりの相対リスク」という統計的概念であり、臨床家・患者への説明にはやや抽象的です。これに対しWin Ratioは「ランダムに選んだ治療群患者と対照群患者を比べたとき、どちらが勝つ確率が高いか」という勝敗の比率で、臨床的直感に近い指標です。
競合リスク解析(Fine-Gray等)との関係
複合エンドポイントの中に死亡が含まれる場合、「死亡してしまうと入院イベントが観察できない」という競合リスクの問題が生じます。Fine-Gray回帰は累積発生関数(CIF)に基づくsubdistribution hazardをモデル化し、この問題に対応します。
ただし、Fine-Gray回帰でもイベントの重み付けは行われず、イベントの順序情報(どちらが先に起こったか)も活用されません。Win Ratioは階層構造で重症度を反映し、ペアワイズ比較で順序情報も自然に取り込むため、競合リスクが顕著な領域では補完的な役割を果たします。
RMST(制限付き平均生存時間)との位置づけ
RMSTは比例ハザード仮定に依存せず、「指定期間内の平均生存時間」という直感的な指標を提供します。Win Ratioと同じく、近年の心血管・腫瘍領域で注目される手法です。
ただしRMSTは原則として単一エンドポイントを扱う手法であり、複合エンドポイントの階層構造を直接表現できません。複数の臨床的意義の異なるイベントを統合的に評価したい場合は、Win Ratioのほうが適しています。
| 手法 | 効果量 | 強み | 弱み |
|---|---|---|---|
| Time-to-first-event複合 | ハザード比 | 慣れ親しまれている/サンプルサイズ効率 | 重症度を区別できない/2回目以降のイベントを無視 |
| Cox比例ハザード回帰 | ハザード比(HR) | 共変量調整が容易/実績豊富 | 比例ハザード仮定への依存/HRの解釈が抽象的 |
| Fine-Gray回帰 | subdistribution HR | 競合リスク下のCIFを直接モデル化 | 重症度の階層を表現できない |
| RMST | 平均生存時間の差 | 比例ハザード不要/解釈が直感的 | 基本は単一エンドポイント向け |
| Win Ratio | 勝敗の比 | 重症度の階層を反映/比例ハザード不要/直感的 | 追跡期間の影響を受けやすい/共変量調整に工夫が必要 |
| 階層的複合エンドポイント(広義) | 勝率・Win Ratio等 | QOLやPROを組み込みやすい | 階層の事前定義が解析結果を左右する |
このように、Win Ratioは既存手法を置き換えるものというよりも、「重症度の階層を反映したい」「比例ハザードが疑わしい」「複数イベントを統合的に評価したい」という臨床的要請に対する補完的な選択肢として位置づけられます。

心血管試験での活用と規制当局の受容状況
Win Ratio法は、近年の心血管領域における大規模試験で採用例が増えており、規制当局の議論の俎上にも上るようになっています。ここでは代表的な採用試験と、FDA・EMAの受容状況を整理します。
代表的な採用試験
心血管領域では、SGLT2阻害薬を中心に、Win Ratioまたは関連する階層的複合エンドポイントを採用する試験が相次いでいます。
| 試験名(年) | 対象 | Win Ratio/階層的複合の位置づけ |
|---|---|---|
| DAPA-HF(2019) | HFrEF患者へのDapagliflozin | 一次解析はtime-to-event複合。Win Ratioは事後解析として実施されたとされています。 |
| EMPULSE(2022) | 急性心不全患者へのEmpagliflozin | 一次解析として階層的臨床複合エンドポイント(Win Ratio型の枠組み)を採用したと報告されています。 |
| DAPA-CKD(2020) | 慢性腎臓病患者 | 心腎複合エンドポイントの感度解析として階層的アプローチが議論されています。 |
| HFpEF関連試験 | 駆出率の保たれた心不全 | QOL・KCCQスコアを組み込んだ階層的評価の事例が報告されています。 |
特に注目すべきはEMPULSEで、急性心不全という重症患者集団に対して、死亡・心不全イベント・KCCQ-TSS(QOL指標)の変化を階層的に組み合わせた複合エンドポイントを一次解析に据えた点が特徴的とされています。これは、Win Ratio型の枠組みが「ハードエンドポイント+PRO(患者報告アウトカム)」の統合評価に適していることを示す事例として議論されています。
FDAの動向
FDAは「Hierarchical Composite Endpoint」という用語のもと、Win Ratio型の解析を認識しており、近年の心血管・心不全関連レビューでも言及される機会が増えているとされています。一方で、
一次評価項目としてWin Ratioを採用することについては、FDA内でも依然として議論があるとされています。階層の事前定義、追跡期間への感度、サンプルサイズ計算の妥当性などが論点であり、現時点でWin Ratioを単独の一次評価項目として承認申請に使う場合は、事前にFDAと十分なプロトコル協議を行うことが推奨されます。詳細は最新のFDAレビュー資料や規制当局の議論を参照してください。
EMAの動向
EMA(欧州医薬品庁)も、心不全領域のreflection paperなどで階層的複合エンドポイントについて言及していると報告されています。特に、QOL・PROを組み込みやすい点がWin Ratio型アプローチの評価ポイントとして挙げられているとされ、患者中心の評価指標を取り入れる潮流と整合する手法として注目されています。
具体的な規制文書名やガイドライン番号については流動的な部分があるため、申請を検討する際は、欧州規制当局の最新の公開資料を直接確認することが望ましいといえます。
心血管以外の領域への展開
Win Ratioの応用は心血管領域にとどまりません。
- 腎臓領域:DAPA-CKDをはじめとする慢性腎臓病試験で、eGFR低下・透析導入・腎死・心血管死を階層的に組み合わせる試みが議論されています。
- がん領域:全生存期間(OS)、無増悪生存期間(PFS)、PROを階層的に評価する応用研究が進められているとされています。
- 希少疾患領域:限られた症例数で多次元的な治療効果を検出する手段として、Win Ratioの活用可能性が検討されています。
このように、Win Ratioは「臨床的に重要なイベントを階層的に評価したい」という共通の課題に応える手法として、複数領域に広がりつつあります。次章では、これらの背景を踏まえた実務上の運用ポイントについて見ていきます。
Win Ratio活用の実務でのポイント
Win Ratioを実際の臨床試験で運用する際には、プロトコル設計段階から結果報告まで一貫した準備が必要になります。ここでは生物統計担当者として押さえておきたい実務的なポイントを整理します。
プロトコル記載時のポイント
Win Ratio法を採用する場合、最も重要なのはエンドポイントの階層を事前に明示することです。死亡 → 心不全入院 → QOL悪化 のように、臨床的重要度の順に優先順位を確定し、プロトコルとSAP(統計解析計画書)に明記しておきます。事後的に階層を変更すると、結果の解釈可能性が大きく損なわれ、規制当局からも疑義を呈される可能性があります。また、比較に用いる時間窓(follow-up window)も事前定義が必須です。
サンプルサイズ設計の考え方
Win Ratioのサンプルサイズ設計は、従来のCox回帰やt検定のような閉形式の公式が確立されていない領域です。実務ではシミュレーションベースで必要例数を算出することが一般的になっています。Pocockらの原著論文(2012)や、後続のWangら(2016)が提案した近似公式を出発点として、想定するWin Ratio・各エンドポイントの発生率・追跡期間を組み合わせたシミュレーションを行います。R上では WWR パッケージや独自スクリプトを用いた繰り返し試行で検出力を確認するワークフローが現実的です。
データマネジメント上の注意
階層的比較を正確に行うためには、各イベントの発生時点を正確に記録することが極めて重要です。日付の精度(日次か月次か)、ITT集団とper-protocol集団の定義、欠測データのハンドリング規則を事前に決めておきます。特に追跡打ち切り(censoring)の取り扱いはWin/Loss判定に直結するため、データロック前にダミーランで検証することをお勧めします。
SAPでの記載例とCSRでのフォレストプロット
SAPでは「主要解析はWin Ratio法を用い、95%信頼区間はBebuおよびLachinの分散推定量に基づき、両側有意水準5%で検定する」のように、推定量・分散推定法・検定方法を明示します。CSR(治験総括報告書)では、サブグループごとのWin Ratioをフォレストプロットで可視化することで、効果の頑健性を一目で示せます。年齢・性別・心不全のタイプ(HFrEF / HFpEF)別のWin Ratio提示は、規制当局レビューでも好評価を得やすい構成です。
Win Ratioを採用する際は、(1) エンドポイント階層と時間窓の事前固定、(2) シミュレーションベースのサンプルサイズ設計、(3) イベント発生日時の正確な記録、(4) SAPでの推定量・分散推定法の明示、(5) CSRでのサブグループ・フォレストプロットによる頑健性提示 — この5点を必ず押さえてください。プロトコル段階の準備が結果の解釈可能性と規制当局受容性を決定づけます。
📚 この記事をより深く理解するための参考書籍
Win Ratio法は比較的新しい手法ですが、その背景には臨床試験デザイン・複合エンドポイント・生存時間解析といった生物統計の古典的トピックが横たわっています。以下は、Win Ratioを理論・実務の両面から深く理解するうえで強力な土台となります。

関連記事・次のステップ
Win Ratioをさらに深く理解するために、関連性の高い記事をご紹介します。
- RMST(制限付き平均生存時間)との対比に興味がある方は、こちらの記事もご参照ください → RMST(制限付き平均生存時間)解析ガイド。Win Ratioと並んで比例ハザード仮定に依存しない代替指標として注目されており、両者の使い分けを整理できます。
- ICH E9(R1)のEstimandフレームワークの観点からWin Ratioを位置づけたい方は、こちらの記事もあわせてお読みください → ICH E9(R1) Estimandフレームワーク徹底解説。Intercurrent EventsとWin/Loss判定の関係を整理する出発点になります。
- Win Ratioを群逐次デザインに組み込みたい方は、こちらの記事もご参照ください → Group Sequential Design R実装比較 — rpact / gsDesign / SAS。心血管試験では中間解析の運用が前提となるケースも多く、Win Ratioとの組み合わせ実装が今後の論点となります。
まとめ
本記事では、Win Ratio法の数理的背景からRのWWRパッケージによる実装、Cox回帰やRMSTとの比較、そしてDAPA-HFやEMPULSEといった主要な心血管試験での適用事例、規制当局の受容状況までを体系的に整理しました。Win Ratioは臨床的重要度を反映した階層的複合エンドポイント解析を可能にし、比例ハザード仮定に依存しない頑健な治療効果評価指標として、心血管領域を中心に存在感を高めています。
実務的には、エンドポイントの階層を事前固定すること、シミュレーションに基づいたサンプルサイズ設計を行うこと、SAPで推定量と分散推定法を明示することが運用の鍵となります。これらを徹底することで、Win Ratioは規制当局レビューにも耐える主要解析手法として活用できます。
今後の展望としては、FDAおよびEMAでの正式ガイダンス化、QOLやPRO(患者報告アウトカム)といったソフトエンドポイントの階層への統合、群逐次デザインや適応的試験との組み合わせ、さらにはベイズ流Win Ratioの発展などが期待される領域です。心血管領域に留まらず、がん領域・希少疾患領域への応用も進みつつあり、生物統計家としてはこの動向を継続的にウォッチしておく価値があります。
Win Ratio法を自社の臨床試験プロトコルに組み込む際の判断材料として、本記事をぜひご活用していただければと思います。階層的複合エンドポイントを適切に評価できる手法を手元に持つことは、これからの生物統計担当者にとって大きな強みになります。











