はじめに
製薬業界において統計学は、臨床試験デザインからデータ解析、規制当局への申請資料作成に至るまで欠かせない基盤です。その中でもt検定(Student’s t-test)は、最も基本的かつ頻繁に用いられる統計手法の一つです。新薬とプラセボの効果比較、製剤間の溶出試験の差の検証、バイオアベイラビリティ試験など、日常的に登場します。
本記事では、t検定の数理的導入を丁寧に解説し、検定統計量がどのように導かれるかを確認した上で、Rを用いた具体例を示します。単なる「使い方」ではなく、「なぜその式になるのか」を理解することで、解析結果をより深く解釈できるようになることを目指します。
t検定の基本的な考え方
t検定は、母平均の差に関する仮説検定です。典型的には次のような問いを扱います。
- 一標本t検定:ある薬剤の平均効果が既知の基準値と異なるか
- 二標本t検定:新薬群とプラセボ群の平均効果に差があるか
- 対応のあるt検定:同一被験者における投与前後の変化に差があるか
ここではまず、最も基本的な「二標本t検定(等分散を仮定)」を題材に数理的導出を行います。
検定統計量の導出

上記のような場合を想定します。母集団から得られた標本集団の分布が判明しており、(例えば正規分布等)それぞれの集団の平均に差があるかを検証したいとします。
仮説の設定
新薬群の母平均を \(\mu_1\)、プラセボ群の母平均を \(\mu_2\) とします。検定したい仮説は次の通りです。
- 帰無仮説 \(H_0: \mu_1 = \mu_2\)
- 対立仮説 \(H_1: \mu_1 \neq \mu_2\)
標本平均の分布
各群の標本平均を \(\bar{X}, \bar{Y}\)、標本サイズを \(n_1, n_2\)、母分散を \(\sigma^2\)(等分散仮定)とします。
中心極限定理より、
\[\bar{X} \sim N\left(\mu_1, \frac{\sigma^2}{n_1}\right)\]
\[\bar{Y} \sim N\left(\mu_2, \frac{\sigma^2}{n_2}\right)\]
したがって差 \(\bar{X} – \bar{Y}\) は
\[\bar{X} – \bar{Y} \sim N\left(\mu_1 – \mu_2, \sigma^2\left(\frac{1}{n_1} + \frac{1}{n_2}\right)\right)\]
標準化
帰無仮説 \(H_0: \mu_1 = \mu_2\) の下では平均差は0となるため、
\[Z = \frac{(\bar{X} – \bar{Y}) – 0}{\sigma \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}\]
は標準正規分布N (0,1)に従います。
母分散が未知の場合
実際には \sigma^2 は未知です。そこで標本分散 \(S_1^2, S_2^2\) を用いて推定します。
\[S_1^2 = \frac{1}{n_{1}}\sum_{i=1}^{n_{1}}(X_{i} – \bar{X})^{2}\]
\[S_2^2 = \frac{1}{n_{2}}\sum_{i=1}^{n_{2}}(Y_{i} – \bar{Y})^{2}\]
これより、式変形すると以下のようなカイ二乗分布に従う。
\[\frac{n_{1}S_1^2}{\sigma^2} = \frac{1}{\sigma^2}\sum_{i=1}^{n_{1}}(X_{i} – \bar{X})^{2} \sim \chi^{2}_{\,n_{1}-1}\]
\[\frac{n_{2}S_2^2}{\sigma^2} = \frac{1}{\sigma^2}\sum_{i=1}^{n_{2}}(Y_{i} – \bar{Y})^{2} \sim \chi^{2}_{\,n_{2}-1}\]
よって、カイ二乗分布の加法性(再生性)より
\[\frac{n_{1}S_1^2}{\sigma^2} + \frac{n_{2}S_2^2}{\sigma^2} \;\sim\; \chi^{2}_{(n_{1}-1)+(n_{2}-1)}\]
分布の再生性とは,同一分布に従う複数の独立な確率変数の和が元の分布に従うことです。例えば,ある別々の正規分布に従う2つの独立な確率変数X, Yに対して,その和X+Yもまた正規分布に従うといったことです。
また\(\bar{X}, \bar{Y}\)が独立、\(\bar{X}, S_1^2\)、\(\bar{Y}, S_2^2\)がそれぞれ独立のため、下記t統計量がt分布に従う。
$$
\begin{eqnarray}
T &=& \frac{Z}{\sqrt{\frac{1}{n_1 + n_2 -2}\frac{1}{\sigma^2}(n_1S_1^2 + n_2S_2^2)}}\\
&=& \frac{\frac{(\bar{X} – \bar{Y}) – 0}{\sigma \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}}{\sqrt{\frac{1}{n_1 + n_2 -2}\frac{1}{\sigma^2}(n_1S_1^2 + n_2S_2^2)}}\\
&=&\sqrt{n_1 + n_2 -2} \frac{\bar{X} – \bar{Y}}{\sqrt{(\frac{1}{n_1}+\frac{1}{n_2})(n_1S_1^2 + n_2S_2^2)}} \sim t_{n_1 + n_2 -2}
\end{eqnarray}
$$
[t分布]
自由度m のカイ二乗分布に従う確率変数U と、標準正規分布に従う確率変数Zがあって、それぞれ独立とする。
\[T = \frac{Z}{\sqrt{U/m}}\]
を考えたとき、Tが従う確率分布を、自由度mのt分布と呼び、 \(t_{m}\)で表します。
有意水準を5%とすると、
- \(|T| > t_{n_{1} + n_{2} -2}(0.025)\)の場合、\(H_{0}\)を棄却
- \(|T| \leq t_{n_{1} + n_{2} -2}(0.025)\)の場合、\(H_{0}\)を棄却しない
と判断します。
製薬業界での実務的意義
t検定は単なる「平均の差の検定」以上の意味を持ちます。例えば:
- 第I相試験:薬物動態パラメータ(Cmax, AUC)の群間比較
- 第III相試験:主要評価項目(血圧低下量など)の新薬群 vs プラセボ群比較
- 製剤開発:異なる製造ロット間の品質一貫性の確認
規制当局(FDA, PMDA, EMA)は、統計的有意性だけでなく、解析手法の妥当性を重視します。したがって、t検定の数理的背景を理解していることは、単なる「p値の報告」にとどまらず、解析の正当性を説明する力につながります。
Rによる実装例
例として以下のような新薬群(n=15)とプラセボ群(n=15)の血圧低下量を想定します。
set.seed(123)
drug <- rnorm(15, mean = 8, sd = 3) # 新薬群
placebo <- rnorm(15, mean = 5, sd = 3) # プラセボ群
#基本統計量
mean(drug); mean(placebo)
sd(drug); sd(placebo)
#t検定の実行
t.test(drug, placebo, var.equal = TRUE)
Two Sample t-test
data: drug and placebo
t = 2.45, df = 28, p-value = 0.021
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval: 0.47 5.23
sample estimates:
mean of x mean of y
8.1 5.2
解釈
- t値 = 2.45
- 自由度 = 28
- p値 = 0.021 < 0.05 → 有意差あり
- 95%信頼区間 = [0.47, 5.23] → 新薬群の平均効果はプラセボ群より0.47〜5.23 mmHg大きい
この結果から「新薬はプラセボに比べて有意に血圧を下げる」と結論できます。
実務での注意点
t検定を実務で用いる際には、以下の点に注意が必要です。
多重検定の問題
複数の評価項目を同時に検定する場合、第一種過誤率(偽陽性)の増加に注意が必要です。Bonferroni補正やHolm法、FDR制御などを適用するなどの検討が必要です。
正規性の仮定
t検定は母集団が正規分布に従うことを前提とします。サンプルサイズが大きければ中心極限定理により頑健ですが、小規模試験ではShapiro-Wilk検定やQ-Qプロットで確認が必要です。
等分散性の仮定
等分散が疑わしい場合はWelchのt検定を用いるべきです(t.test(..., var.equal = FALSE)
)。製薬業界では群間の分散が異なるケースも多いため、事前に分散検定(F検定やLevene検定)を行うことが推奨されます。
まとめ
t検定は、母平均の差を評価するための基本的な統計手法であり、製薬業界では臨床試験や製剤評価など幅広く活用されます。本記事では、検定統計量の数理的導出を通じてt分布が生じる仕組みを確認し、Rによる実例解析で結果の解釈方法を示しました。実務では正規性や等分散性の仮定、多重検定の問題、効果量や信頼区間の提示が重要です。数理的理解を持つことで、単なるp値報告を超え、規制当局への説明責任に耐えうる解析が可能となります。