グラフで理解する統計:可視化の力― 製薬業界で役立つ“見える化”の基本と実装例 ―

記事の目次
Toggleはじめに
統計の理解を深めるうえで、グラフによる可視化は欠かせません。
特に統計を学び始めた人が最初に感じる壁は、「数字が多すぎてよくわからない」という感覚です。
しかし、グラフを描くと状況は一変します。
数字の羅列では見えなかった特徴が、視覚的に“ひと目で”理解できるようになるからです。製薬業界では、臨床試験データ、品質管理データ、製造工程データなど、膨大な数値を扱います。
そのため、データを正しく可視化する力は、統計スキルの中でも最重要のひとつです。
この記事では、
- ヒストグラム
- 箱ひげ図
- 散布図
という3つの基本グラフを中心に、実務で使える図表とR言語での実装例(サンプルデータ付き)を紹介します。
グラフを描くと統計がわかる理由
- 数字の羅列では見えない特徴が“形”として見える
- 外れ値や偏りが直感的に理解できる
- 平均値だけではわからない情報が得られる
- 統計モデルの前提を確認できる
特に製薬業界では、データの前提を誤ると解析結果が歪むというリスクがあるため、可視化は必須です。
ヒストグラム:データの“形”を見る最強ツール

library(ggplot2)
set.seed(123)
# サンプルデータ(収縮期血圧)
df <- data.frame(
sbp = rnorm(200, mean = 130, sd = 15)
)
ggplot(df, aes(x = sbp)) +
geom_histogram(binwidth = 5, fill = “#4C72B0”, color = “white”) +
labs(
title = “図1. 収縮期血圧の分布(N=200)”,
x = “収縮期血圧(mmHg)”,
y = “度数”
) +
theme_bw()
- ベースライン値の分布確認(年齢、血圧など)
- 製造工程のばらつき確認(錠剤重量、含量)
- 外れ値の初期チェック
箱ひげ図:外れ値と分布比較に最適

set.seed(123)
df2 <- data.frame(
group = rep(c(“Treatment”, “Placebo”), each = 100),
change = c(
rnorm(100, mean = -5, sd = 8), # 治療群:血圧が下がる
rnorm(100, mean = -1, sd = 8) # プラセボ群:変化が小さい
)
)
ggplot(df2, aes(x = group, y = change, fill = group)) +
geom_boxplot(outlier.color = “red”) +
labs(
title = “図2. 血圧変化量の群間比較(箱ひげ図)”,
x = “群”,
y = “血圧変化量(mmHg)”
) +
scale_fill_brewer(palette = “Set2”) +
theme_bw()
- 治療群 vs プラセボ群の比較
- ロット間の品質比較
- 外れ値の確認(工程異常の兆候)
散布図:2変数の関係を見る

set.seed(123)
generate_pk_data <- function(n = 150, dose_min = 10, dose_max = 100) {
dose <- runif(n, dose_min, dose_max)
conc <- 0.8 * dose + rnorm(n, sd = 10)
data.frame(dose = dose, conc = conc)
}
df3 <- generate_pk_data()
ggplot(df3, aes(x = dose, y = conc)) +
geom_point(alpha = 0.7, color = “#4C72B0”) +
geom_smooth(method = “lm”, se = FALSE, color = “red”) +
labs(
title = “図3. 用量と血中濃度の関係(散布図)”,
x = “用量(mg)”,
y = “血中濃度(ng/mL)”
) +
theme_bw()
- PK解析(用量と血中濃度)
- 工程パラメータの因果探索
- 臨床データの探索解析(年齢と効果など)
まとめ
計を理解するうえで、グラフによる可視化は最も強力な手段のひとつです。数字の羅列では見えなかった特徴が、ヒストグラム・箱ひげ図・散布図といった基本的な図を描くだけで“形”として立ち上がり、データの本質が直感的に理解できるようになります。これは、統計を学び始めた初学者にとっても、日々膨大なデータを扱う製薬業界の実務者にとっても同じです。
ヒストグラムは分布の形を、箱ひげ図は外れ値や群間比較を、散布図は変数間の関係性を明確に示します。これらのグラフは、臨床試験データの品質確認、製造工程のばらつき評価、PK解析など、製薬業界のあらゆる場面で欠かせないツールです。
可視化は統計の入口であると同時に、データ解析の本質でもあります。
「まずグラフを描く」というシンプルな習慣が、データ理解を深め、解析の質を高め、実務の精度を大きく向上させます。今回の記事で紹介した考え方とコードを活用し、ぜひ日々の業務や学習の中で“見える化”の力を最大限に活かしてみてください。











