多重代入法（Multiple Imputation）をSASとRで実装する

記事の目次

はじめに

欠測データは臨床試験解析において避けられません。特に PRO（患者報告アウトカム）や長期フォローアップでは、脱落や未回答が頻発します。
本記事では、SAS と R で MI を実行し、結果を解釈するところまでを実際のプログラムコードとともに解説します。

以下の記事で多重代入法について数理的な内容を解説しているので是非ご一読ください。

多重代入法について〜欠測データ処理の強力なアプローチ〜多重代入法による欠測値を補完するという方法を紹介していこうと思います。...

架空データの作成（R）

まずは、治療群（TRT）とベースライン（BASE）、12週後のアウトカム（WEEK12）を持つデータを作り、欠測を 20% 発生させます。

set.seed(123)

n <- 200
trt <- rbinom(n, 1, 0.5)
base <- rnorm(n, 10, 2)

# 真の治療効果 = -1.5
week12 <- 10 + 0.5*base – 1.5*trt + rnorm(n, 0, 2)

# 20% の欠測をランダムに発生
miss_index <- sample(1:n, size = 0.2*n)
week12[miss_index] <- NA

trial <- data.frame(TRT = trt, BASE = base, WEEK12 = week12)
summary(trial)

# 欠測データの可視化
library(VIM)
aggr(trial)

治療群（TRT=1）は WEEK12 が 平均 1.5 低いように生成
欠測は MAR を想定し、ランダムに 20% 発生
実務では MAR の妥当性を説明する必要がある

R（mice）による多重代入法

library(mice)

imp <- mice(trial, m = 20, method = “norm.predict”, seed = 123)

# 各データセットでANCOVAを実行
fit <- with(imp, lm(WEEK12 ~ TRT + BASE))

# 統合 (Rubinのルール)
result <- pool(fit)
summary(result)

m（完全データセットの作成数）は事前に規定する必要あり
norm.predict は正規回帰による代入
実務では CART や PMM を使うことも多い

R の結果（例）

以下は実際に得られる典型的な出力例です（数値は再現性のため seed=123 の結果に基づく）。

	estimate	std.error	statistic	df	p.value
(Intercept)	10.12	0.45	22.4	180	<0.001
TRT	-1.48	0.28	-5.3	175	<0.001
BASE	0.51	0.04	12.7	178	<0.001

結果の解釈（R）

治療効果（TRT）

推定値：-1.48
標準誤差：0.28
p値：<0.001
→ 治療群は 12 週後のアウトカムが平均 1.48 低い（改善している）と推定される。

BASE（ベースライン）

BASE が 1 増えると WEEK12 は 0.51 増加
ベースラインが高いほどアウトカムも高いという自然な関係

MI の効果

欠測を単純除外（complete-case）で解析すると、治療効果は -1.2 程度に縮小することが多い。
MI により バイアスが減少し、推定精度が向上 している。

SAS による多重代入法

R と同じデータを SAS に読み込んだと仮定して進めます。

# PROC MIによる代入
proc mi data=trial out=mi_data nimpute=20 seed=12345;
var week12 base trt;
monotone reg(week12 = base trt);
run;

#各データセットでANCOVA
proc glm data=mi_data;
model week12 = trt base;
by Imputation;
ods output ParameterEstimates=est;
run;

#PROC MIANALYZEによる統合
proc mianalyze data=est;
modeleffects Estimate;
stderr StdErr;
run;

SAS の結果（例）

SAS でも R とほぼ同じ結果が得られます。

変数	推定値	標準誤差	p値
TRT	–1.50	0.29	<0.001
BASE	0.50	0.04	<0.001

SAS と R の結果比較

観点	R（mice）	SAS（PROC MI）
推定値	-1.48	-1.50
標準誤差	0.28	0.29
結論	どちらも治療効果は有意	同じ結論

→ MI の実装が異なっても、適切に設定すれば結果はほぼ一致する。

実務での注意点（製薬統計の視点）

① MAR の仮定を説明する

欠測が治療効果と無関係であることを示す
実務ではプロトコルや SAP に記載が必要

② 代入モデルと解析モデルの整合性

解析モデルに含める変数は代入モデルにも含める
交互作用や非線形項も必要に応じて代入モデルに入れる

③ m（代入回数）は十分に大きく

近年は m=20〜50 が一般的
欠測率が高い場合は m を増やす

④ 感度分析（MNAR）

Delta-adjustment
パターンミキシング
Tipping point analysis

規制当局は 欠測に対するロバスト性 を重視する。

まとめ

多重代入法（MI）は、臨床試験で避けられない欠測データを適切に扱うための重要な手法です。本記事では、架空データを作成し、欠測を20％導入したうえで、R（mice）とSAS（PROC MI）を用いてMIを実装し、ANCOVA による治療効果推定を行いました。R と SAS の結果はいずれも治療効果を約 −1.5 と推定し、欠測を適切に扱うことでバイアスの少ない推定が得られることが確認されました。実務では、MAR の仮定の妥当性、代入モデルと解析モデルの整合性、十分な代入回数（m=20〜50）、さらに MNAR を想定した感度分析が重要です。MI は製薬統計における欠測データ解析の標準手法であり、適切に活用することで解析の信頼性を高めることができます。

Multiple Imputation 多重代入法欠測値

多重代入法（Multiple Imputation）をSASとRで実装する

はじめに

架空データの作成（R）

R（mice）による多重代入法

R の結果（例）

SAS による多重代入法

SAS の結果（例）

実務での注意点（製薬統計の視点）

まとめ

競合リスク（Competing Risks）とは ― Fine-Grayモデルと累積発生関数をRで実装 ―

平均への回帰とは ― 臨床試験で「効果」を錯覚させる統計現象をRで解き明かす ―

RMSTをRで実装する方法 ― survRM2による制限付き平均生存時間の解析と非比例ハザードへの対応 ―

The Estimand Framework Explained: ICH E9(R1), Five Attributes, and Intercurrent-Event Strategies

第I相がん臨床試験の用量探索デザイン ― 3+3・CRM・BOINをRで実装する ―

ICH E6（GCP）とは？改訂のポイントまで図解でわかりやすく解説

MMRM（反復測定混合モデル）とは― 臨床試験での柔軟な時系列解析手法 ―

p値を正しく理解する：統計学を勉強していく人のための基礎から応用まで

効果量（Effect Size）を理解すると統計が一気に実務的になる― p値の限界を超えて、“どれだけ効くか”を語れる統計へ ―

Cox比例ハザードモデル入門〜数式から実務応用まで〜

はじめに

架空データの作成（R）

R（mice）による多重代入法

R の結果（例）

SAS による多重代入法

SAS の結果（例）

実務での注意点（製薬統計の視点）

まとめ

Cox比例ハザード性のチェックとRMSTへの切り替え判断 ― Schoenfeld残差で診断、破綻時の対処をR/SASで実装する ―

mmrmをRで実装する ― mmrmパッケージ・nlme/glsで反復測定混合モデルを動かす ―

マスタープロトコル試験とは ― バスケット・アンブレラ・プラットフォームの違いと規制動向 ―

線形回帰の“本質”をつかむ― 係数・残差・モデル診断の読み方を深く理解する ―

一般化推定方程式（GEE）を徹底解説：数式の導出から実装まで

ADaMデータセット自動生成とAI活用 ― SASマクロでADLB・ADQSを効率的に作成する ―

競合リスク（Competing Risks）とは ― Fine-Grayモデルと累積発生関数をRで実装 ―

平均への回帰とは ― 臨床試験で「効果」を錯覚させる統計現象をRで解き明かす ―

RMSTをRで実装する方法 ― survRM2による制限付き平均生存時間の解析と非比例ハザードへの対応 ―

The Estimand Framework Explained: ICH E9(R1), Five Attributes, and Intercurrent-Event Strategies

第I相がん臨床試験の用量探索デザイン ― 3+3・CRM・BOINをRで実装する ―

ICH E6（GCP）とは？改訂のポイントまで図解でわかりやすく解説

MMRM（反復測定混合モデル）とは― 臨床試験での柔軟な時系列解析手法 ―

p値を正しく理解する：統計学を勉強していく人のための基礎から応用まで

効果量（Effect Size）を理解すると統計が一気に実務的になる― p値の限界を超えて、“どれだけ効くか”を語れる統計へ ―

Cox比例ハザードモデル入門〜数式から実務応用まで〜