因果推論

第2回 因果推論とは何か?――製薬業界で働く人のための実践的ガイド

はじめに

製薬業界において、臨床研究や疫学研究は新薬開発から市販後調査(PMS)、リアルワールドエビデンス(RWE)の構築まで幅広く関わります。
しかし、研究を進める中で必ず直面するのが「因果関係をどう評価するか」という課題です。例えば、

  • 「この薬剤は本当に患者の生存率を改善するのか?」
  • 「副作用の発現は薬剤そのものによるものか、それとも患者背景によるものか?」

こうした問いに答えるために必要なのが因果推論(Causal Inference)です。
本稿では、因果推論について解説していきたいと思います。
以下の記事でなぜ因果推論を考えることが大事なのか因果推論入門として紹介しておりますので、興味がありましたら一読ください。

第1回 製薬業界のための因果推論入門――「理想」と「現実」をつなぐ研究デザインの考え方因果推論の考え方の前になぜ因果推論の考え方が必要なのか「製薬業界で働く方」に向けて解説します。特に、理想的な研究デザインを思い描き、そこから現実的な研究に落とし込むプロセスに焦点を当てます。...

因果推論とは何か

因果推論とは、曝露(治療や介入)がアウトカム(結果)に与える影響を推定するアプローチです。

統計学的な相関関係と因果関係は異なります。

  • 相関:2つの変数が同時に変動している。
    以下のように2つの変数が負に相関していたり、正に相関していることを正の相関といいます。

  • 因果:一方の変数が他方に直接的な影響を与えている

例えば上図の具体例ですと、

  • 「気温」と「アイスクリームの販売数」
    →気温が高くなればアイスクリームの販売数も増えるが、アイスクリームの販売数を増やしたところで気温が高くなることはない。
  • 子供の「身長」と「足の速さ」
    →身長が高い子ほど足が速い傾向があるが、足が速くなれば身長が高くなるわけではない。

https://mathlandscape.com/correlation/

相関関係との違いは、関係性を示す矢印が双方向ではなく片方向だけであることです。
そのため要素Aと要素Bが因果関係にある場合、要素Aが変化したときに要素Bが変化することはあっても、要素Bが変化したときに要素Aが変化することはありません。


製薬業界では、薬剤の有効性や安全性を評価する際に「因果効果」を正しく推定することが求められます。

EBMとの関係

EBM(Evidence-Based Medicine)は「最良のエビデンスに基づいて臨床判断を行う」ことを意味します。

ここでいう「エビデンス」とは、実は因果効果の推定結果です。
つまり、EBMを実践するためには、因果推論の考え方を理解し、研究デザインや解析に反映させる必要があります。

交絡の問題とその重要性

因果推論で最も重要な課題の一つが交絡(confounding)です。

例:糖尿病患者における保健指導と腎不全リスク

  • 保健指導を受けた群 → 腎不全リスクが低い
  • 保健指導を受けなかった群 → 腎不全リスクが高い

一見すると「保健指導が腎不全を防いでいる」と思えます。
しかし、実際には「若くて健康的な人ほど保健指導を受けやすい」という背景があるかもしれません。

この場合、年齢や生活習慣が交絡因子となり、因果効果を歪めてしまいます。

https://www.igaku-shoin.co.jp/paper/archive/y2021/3419_04

図解で理解する因果推論

因果推論を理解する際に変数間の因果関係に関する仮説を整理して伝える上で有用なアプローチである、DAG(Directed AcyclicGraph:非巡回有向グラフ)を用いて説明していきます。(DAGの詳細は次回の記事で紹介していこうと思います。)

交絡のある場合の因果関係

  • 年齢は保健指導の有無にも腎不全リスクにも影響
  • このまま比較すると「保健指導の効果」が過大評価される

条件付けによる解決

年齢を統計的に調整することで、「仮想的にランダム化した状況」を作り出し、因果効果を正しく推定できるようになります。

Rでの実装例

set.seed(123)

# サンプルサイズ
n <- 2000

# 交絡因子:年齢
age <- rnorm(n, mean = 60, sd = 10)

# 曝露:保健指導(年齢が若いほど受けやすい)
guidance <- rbinom(n, 1, plogis(-(age – 60)/10))

# アウトカム:腎不全(年齢↑でリスク↑、保健指導でリスク↓)
logit_p <- -7 + 0.05age – 0.8guidance
p <- plogis(logit_p)
renal_failure <- rbinom(n, 1, p)

df <- data.frame(age, guidance, renal_failure)

# 交絡を無視したモデル
model1 <- glm(renal_failure ~ guidance, data=df, family=binomial)
summary(model1)

# 年齢で調整したモデル
model2 <- glm(renal_failure ~ guidance + age, data=df, family=binomial)
summary(model2)

結果の解釈

  • model1(単純比較):保健指導の効果が過大評価される
  • model2(年齢で調整):真の因果効果に近づく

この例から、交絡因子を考慮することの重要性が直感的に理解できます。

製薬業界での実践的意義

製薬会社で因果推論を理解することは、以下の場面で特に重要です。

  • 新薬開発初期:RCTが困難な希少疾患領域での観察研究
  • 市販後調査(PMS):副作用リスクの評価に因果推論を導入
  • リアルワールドエビデンス(RWE):規制当局への申請資料に活用

近年、FDAやEMAもRWEの活用を推進しており、因果推論の理解は企業競争力を左右する要素になっています。

まとめ

今回は因果推論について解説しました。因果推論とは、曝露や介入がアウトカムに与える「因果効果」を推定するための考え方であり、EBMの実践に不可欠な基盤です。観察研究では交絡因子の影響により因果関係が歪められる危険がありますが、条件付けや統計的手法を用いることで「仮想的なランダム化」を再現し、より正確な推定が可能となります。製薬業界においては、新薬開発初期の希少疾患研究、市販後調査での副作用評価、リアルワールドエビデンスの構築など、因果推論の応用範囲は広く、規制当局への申請や臨床現場への還元に直結します。理論を理解し、Rなどで実装を試すことは、研究の質を高めるだけでなく、実務に直結する強力なスキルとなります。

ABOUT ME
tomokichi
外資系製薬会社で生物統計家として働ている1児のパパ。生物統計家とは何か、どのようなスキルが必要か、何を行っているのかを共有していきたいと思っております!生物統計に関する最新情報を皆様にお届けすべく、日々奮闘中です。趣味は筋トレ、温泉巡り、家族と散歩。