💡 この記事でわかること
・統計検定準1級におけるベイズ統計の出題範囲と頻出パターン
・事前分布の3分類と共役事前分布の典型3パターン(Beta-二項/Gamma-ポアソン/正規-正規)
・損失関数と最適点推定量の対応、信用区間(HDI/等裾)の使い分け
・MCMC(メトロポリス・ヘイスティングス法/ギブスサンプリング)の原理と収束診断
・過去問風の典型出題3問とその解法のコツ

はじめに

統計検定準1級の出題範囲のなかで、ベイズ統計は「概念理解」と「計算スキル」の両方が同時に問われる総合的なテーマです。事前分布・事後分布・共役事前分布・MAP推定・信用区間・MCMC ── キーワードを並べただけでも幅広く、頻度論一辺倒で勉強してきた受験者にとっては最初の壁になりがちな分野です。

ところが出題パターン自体はかなり限定的で、典型問題のテンプレートを押さえれば、ベイズ統計は 準1級の安定した得点源 に変えられます。本記事は統計検定準1級「時系列解析」攻略に続く準1級攻略シリーズの第2弾として、ベイズ統計の典型出題パターンを「事前分布・事後分布の更新」「点推定と信用区間」「MCMCの基礎」の3軸で体系的に解説します。

ベイズ統計が準1級で問われる理由

準1級の公式範囲表を開くと、「ベイズ法」は確率モデルや多変量解析と並んで独立した一節を占めており、近年は毎回1〜2問が安定して出題される定番テーマになっています。

📌 ポイント
準1級のベイズ問題は「公式の暗記」より「事前×尤度=事後」の流れを手で追えるかが勝負です。理屈さえ通れば、選択肢問題は消去法でほぼ確実に絞り込めます。

出題形式と配点感覚

準1級はPBT(紙ベース)形式が中心で、ベイズ統計は 多枝選択の小問 と、まれに 部分記述問題 として登場します。小問では「事後分布の形を選べ」「共役事前分布として正しいものはどれか」といったストレートな問い方が多く、計算量は決して多くありません。一方、論述パートに食い込んだ年度では、ベータ−二項モデルの事後平均やMAP推定値を導出させる出題例もあり、配点が高くなる傾向にあります。実際に過去問を解いてみた印象では、ベイズの大問が出た年は ここを落とすと合格ラインが一気に遠のく ため、捨て分野にするのは得策ではありません。

頻出キーワードと学習の優先順位

押さえるべきキーワードは、事前分布/事後分布/共役事前分布/MAP推定/信用区間/MCMC の6つに集約されます。学習の順番としては、まず 事前→事後の更新計算 を手で書けるようにし、次に 共役分布の対応関係(ベータ−二項、ガンマ−ポアソン、正規−正規)を暗記、そのうえで 信用区間の解釈、最後に MCMCの概念問題 という流れが効率的です。

\[ p(\theta \mid x) \propto p(x \mid \theta)\, p(\theta) \]

この一本の式さえ腹落ちすれば、出題の8割は地続きで解けます。MCMCは計算ではなく「なぜサンプリングで事後分布が近似できるのか」という概念理解が問われるので、ギブスサンプラーとメトロポリス・ヘイスティングス法の違いを言語化できれば十分です。

なぜ今ベイズを学ぶのか

試験対策にとどまらず、ベイズ統計はいま実務で最も需要が伸びている分野です。医薬分野では FDAが2026年に改訂したベイズ流臨床試験ガイダンス により、希少疾患・小児領域での事前情報活用が一気に現実的になりました。機械学習側でも、ベイズ最適化や変分推論はMLOpsの定番ツールになっています。準1級の勉強をきっかけにベイズの土台を作っておくと、合格後のキャリアにもそのまま接続できる ── これが、本シリーズで腰を据えてベイズを扱う最大の理由です。

事前分布の選び方と共役事前分布

ベイズ統計の出題で最初の壁となるのが「事前分布をどう選ぶか」と「事後分布をどう計算するか」です。準1級では、ここを理解していれば即答できる典型問題が頻出します。本章では分類と共役関係を整理し、計算が一発で終わる手順を身につけましょう。

ベイズの定理の復習と事前分布の3分類

ベイズ統計の基本式は、観測データ \(x\) とパラメータ \(\theta\) について次のように書けます。

\[ p(\theta \mid x) \propto p(x \mid \theta)\, p(\theta) \]

つまり 事後 ∝ 尤度 × 事前 です。準1級ではこの「比例関係」だけで答えが決まる問題が多く、規格化定数を計算する必要はほとんどありません。事前分布は大きく次の3つに分類されます。

  • 無情報事前分布:事前知識がない状況で用いる分布。一様分布や Jeffreys 事前分布が代表例
  • 主観的事前分布:専門家の知見や過去データから決める分布。製薬の臨床試験などで使われる
  • 共役事前分布:尤度と組み合わせると事後分布が事前と同じ族になる分布。計算が閉形式で済むため出題の中心

共役事前分布の典型3パターン

準1級で覚えておくべき共役の組み合わせは、次の3つに集約されます。

尤度共役事前分布事後分布
ベルヌーイ/二項Beta(α, β)Beta(α+k, β+n−k)
ポアソンGamma(α, β)Gamma(α+Σx, β+n)
正規(分散 \(\sigma^2\) 既知)Normal(μ₀, τ₀²)Normal(下記更新式)

正規 ─ 正規モデルの平均の更新式は次のとおりです。

\[ \mu_{\text{post}} = \frac{\frac{\mu_0}{\tau_0^2} + \frac{n\bar{x}}{\sigma^2}}{\frac{1}{\tau_0^2} + \frac{n}{\sigma^2}}, \quad \frac{1}{\tau_{\text{post}}^2} = \frac{1}{\tau_0^2} + \frac{n}{\sigma^2} \]

分散ではなく 精度(precision = 1/分散)が足し算で増えていく と覚えると忘れません。

例題:二項試行 \(n = 10\)、成功 \(k = 7\)、事前分布が \(\text{Beta}(2, 2)\) のとき、事後分布を求めなさい。

解答:表の更新式に当てはめるだけです。
\(\alpha_{\text{post}} = \alpha + k = 2 + 7 = 9\)
\(\beta_{\text{post}} = \beta + (n – k) = 2 + 3 = 5\)
よって事後分布は Beta(9, 5) となります。

無情報事前分布と Jeffreys 事前分布の違い

「情報がない」事前分布にも複数の流儀があります。二項分布の成功確率 \(\theta\) を例にすると、

  • 一様事前分布:\(\text{Beta}(1, 1)\)。\(\theta\) の値に依存せず一定
  • Jeffreys 事前分布:\(p(\theta) \propto \sqrt{I(\theta)}\) で定義され、二項では \(\text{Beta}(1/2, 1/2)\) になる

Jeffreys 事前分布の最大の特長は パラメータの変換に対して不変 である点です。たとえば \(\theta\) を \(\log \theta/(1-\theta)\) に変換しても、Jeffreys 事前分布なら同じ「無情報」を表現できます。一様分布はこの不変性をもたないため、変換するだけで「情報を持った」事前になってしまいます。準1級では「Jeffreys = 変換不変・フィッシャー情報量の平方根に比例」という対応を押さえておけば十分です。

ベイズ推定の点推定・区間推定

事後分布が得られた後、それをどう要約するかが実務上の最後の関門です。準1級では「点推定(点で代表させる)」と「区間推定(信用区間)」の両方が出題され、損失関数との対応や信頼区間との哲学的違いが問われます。

損失関数と最適な点推定量

ベイズ推定では、推定量 \(\hat{\theta}\) を選ぶ基準として「事後期待損失」を最小化する考え方を採ります。損失関数 \(L(\theta, \hat{\theta})\) の取り方によって、最適な点推定量が変わるのがポイントです。

\[ \hat{\theta}^{*} = \arg\min_{\hat{\theta}} \; E_{\theta \mid x}\bigl[L(\theta, \hat{\theta})\bigr] \]

代表的な3つの損失関数と対応する最適推定量を整理すると、次の表のようになります。

損失関数数式最適な点推定量
二乗誤差損失\((\theta – \hat{\theta})^2\)事後平均
絶対誤差損失\(|\theta – \hat{\theta}|\)事後中央値
0-1損失\(\mathbb{1}(\theta \neq \hat{\theta})\)MAP推定値(事後モード)

「事後平均は二乗誤差、事後中央値は絶対誤差、MAPは0-1損失」という対応はそのまま出題されるので、丸暗記しておきましょう。

📚 より深く学ぶなら:ベイズ推定の数理的基礎は記事末尾の参考書籍セクション(特に『現代数理統計学の基礎』)でじっくり追えます。

信用区間 ─ Equal-tailed と HDI

ベイズ流の区間推定が信用区間(Credible Interval)です。「真の \(\theta\) がこの区間に入る確率が \(1-\alpha\)」とパラメータに対する確率として直接解釈できる点が、頻度論の信頼区間との決定的な違いです。信頼区間は「同じ手続きを繰り返したとき \(1-\alpha\) の割合で真値を含む」という長期頻度の解釈しか持たない点に注意しましょう。準1級で押さえるべき信用区間は2種類です。

  • Equal-tailed interval:事後分布の \(\alpha/2\) 分位点と \(1-\alpha/2\) 分位点で挟む区間。計算が簡単で対称分布に向く
  • HDI(Highest Density Interval):事後密度が高い領域から順に確率 \(1-\alpha\) になるまで集めた区間。区間幅が最小になる

左右に歪んだ事後分布(Beta分布や対数正規分布など)では、Equal-tailedだと密度の低い裾を含んでしまうため、HDIが好まれます。一方、対称な事後分布なら両者は一致します。

例題:事後分布が \(\mathrm{Beta}(9, 5)\) のとき、MAP推定値と事後平均を求めよ。

解答:Beta分布 \(\mathrm{Beta}(\alpha, \beta)\)(\(\alpha, \beta > 1\))のモードと平均の公式から、

\[ \mathrm{MAP} = \frac{\alpha – 1}{\alpha + \beta – 2} = \frac{9-1}{9+5-2} = \frac{8}{12} \approx 0.667 \]

\[ E[\theta \mid x] = \frac{\alpha}{\alpha + \beta} = \frac{9}{9+5} \approx 0.643 \]

左に歪んだ分布のためMAPの方がやや大きくなります。

MCMCの基礎 ─ マルコフ連鎖モンテカルロ法

ベイズ統計の最大の壁は、事後分布 \(\pi(\theta \mid D) \propto \pi(D \mid \theta)\pi(\theta)\) の正規化定数を解析的に計算できないことです。共役事前分布が使えるケースでは事後分布が閉じた形で得られますが、現実のモデル(階層モデル・非線形モデル・多パラメータモデル)では事後分布が高次元積分を含み、解析解は得られません。この困難を回避するため、事後分布から直接サンプルを生成し、その経験分布で推論を行うのがMCMC(マルコフ連鎖モンテカルロ法)です。

マルコフ連鎖の3性質と定常分布

MCMCの理論的基盤は、適切に設計したマルコフ連鎖が定常分布として目的の事後分布 \(\pi\) を持つように仕向けることにあります。そのために必要な3条件が以下です。

  • 既約性(irreducibility):任意の状態から任意の状態へ有限ステップで到達可能
  • 非周期性(aperiodicity):特定の周期で同じ状態に戻る構造を持たない
  • 正再帰性(positive recurrence):有限の期待時間で再訪する

これら3条件を満たす連鎖は、初期値によらず一意の定常分布へ収束します(エルゴード定理)。さらに、サンプラーが目的分布 \(\pi\) を定常分布に持つことを保証する十分条件が詳細釣り合い条件(detailed balance)です。

\[ \pi(x)\, P(x \to y) = \pi(y)\, P(y \to x) \]

この式は「\(x\) から \(y\) への確率流」と「逆向きの流れ」が釣り合っていることを意味し、これが成り立てば \(\pi\) は不変分布になります。

メトロポリス・ヘイスティングス法

最も汎用的なMCMCアルゴリズムがメトロポリス・ヘイスティングス法(MH法)です。提案分布 \(q(y \mid x)\) から候補点 \(y\) を生成し、以下の受理確率で採否を決めます。

\[ \alpha(x, y) = \min\left\{1,\ \frac{\pi(y)\, q(x \mid y)}{\pi(x)\, q(y \mid x)}\right\} \]

正規化定数が分子分母で打ち消されるため、規格化されていない事後密度さえあれば実装可能です。

メトロポリス・ヘイスティングス法のアルゴリズム

  1. 初期値 \(x_0\) を設定する
  2. 提案分布 \(q(y \mid x_t)\) から候補 \(y\) をサンプル
  3. 受理確率 \(\alpha = \min\{1, \pi(y)q(x_t \mid y) / \pi(x_t)q(y \mid x_t)\}\) を計算
  4. \(u \sim U(0,1)\) を生成し、\(u < \alpha\) なら \(x_{t+1}=y\)、そうでなければ \(x_{t+1}=x_t\)
  5. 2〜4 を十分回数繰り返す

ギブスサンプリングとMH法の比較

ギブスサンプリングは多変量分布に対し、各変数の条件付き分布から順番にサンプルを引く手法で、受理確率は常に1(必ず採用)です。条件付き分布が既知の形で書ける階層モデルで強力に機能します。

項目メトロポリス・ヘイスティングス法ギブスサンプリング
必要な分布事後分布(非正規化でOK)各変数の完全条件付き分布
受理確率\(\alpha < 1\) のことが多い常に1
提案分布の調整必要(ステップ幅のチューニング)不要
適用範囲汎用的条件付き分布が既知のモデル

収束診断とサンプル処理

MCMCは初期値の影響を受けるため、得られたサンプルが本当に事後分布を代表しているか診断が必須です。

  • トレースプロット:横軸イテレーション・縦軸サンプル値。定常状態では「毛虫が這うような」一様な揺らぎになる
  • Gelman-Rubin統計量 \(\hat{R}\):複数の独立鎖の鎖間分散と鎖内分散の比。1.1未満で許容、1.01未満が望ましい
  • バーンイン:初期の過渡期サンプル(数百〜数千)を捨てる
  • thinning(間引き):自己相関を減らすため数ステップに1サンプルだけ採用

Rでのメトロポリス法最小実装

標準正規分布 \(N(0,1)\) からMH法でサンプリングする最小例を示します。

# メトロポリス法でN(0,1)からサンプリング
set.seed(123)
n <- 10000              # サンプル数
x <- numeric(n)         # サンプル格納用
x[1] <- 0               # 初期値
for (t in 2:n) {
  y <- x[t-1] + rnorm(1, 0, 1)             # 提案:ランダムウォーク
  alpha <- min(1, dnorm(y) / dnorm(x[t-1])) # 受理確率
  x[t] <- if (runif(1) < alpha) y else x[t-1]
}
plot(x, type = "l", main = "トレースプロット")  # 収束確認

わずか10行で、解析的にサンプル可能な分布も含め任意の目的分布から擬似サンプルを得られるのがMCMCの威力です。

典型出題パターンで実戦演習

ここまで学んだ事前分布・事後分布・MCMCの知識を、過去問風の3問で確認しましょう。手を動かして解くことで、出題パターンと解答プロセスが自然に身につきます。

問題①:共役事前分布の更新
あるコインを10回投げたところ、表が7回出た。表が出る確率 \(p\) の事前分布として \(\mathrm{Beta}(2, 2)\) を仮定したとき、事後分布は何になるか。
解答
二項尤度は \(\mathcal{L}(p) \propto p^{k}(1-p)^{n-k}\)、ベータ事前分布は \(\pi(p) \propto p^{\alpha-1}(1-p)^{\beta-1}\) なので、事後分布は次のように更新されます。

\[ p \mid \text{データ} \sim \mathrm{Beta}(\alpha+k,\ \beta+n-k) = \mathrm{Beta}(2+7,\ 2+3) = \mathrm{Beta}(9,\ 5) \]

共役事前分布の威力は「パラメータの足し算だけで事後分布が得られる」点にあります。

問題②:事後平均と95%等裾信用区間
問題①で得られた事後分布 \(\mathrm{Beta}(9, 5)\) について、事後平均と95%等裾信用区間を求めよ。
解答
ベータ分布の平均は \(\alpha/(\alpha+\beta)\) なので、

\[ E[p \mid \text{データ}] = \frac{9}{9+5} = \frac{9}{14} \approx 0.643 \]

95%等裾信用区間はベータ分布の0.025・0.975分位点から求めます。Rで以下のように計算できます。

qbeta(c(0.025, 0.975), 9, 5)
# [1] 0.3902984 0.8631797

したがって95%信用区間は概ね \([0.391,\ 0.864]\) です。「真の \(p\) が95%の確率でこの区間に入る」とそのまま解釈できる点が、頻度論の信頼区間との大きな違いです。

問題③:MH法の受理確率
メトロポリス・ヘイスティングス法で対称な提案分布 \(q(y \mid x) = q(x \mid y)\) を用いる。現在の状態 \(x = 1.0\) から候補 \(y = 2.0\) が提案され、目標分布の比が \(\pi(y)/\pi(x) = 0.4\) のとき、受理確率 \(\alpha\) はいくらか。
解答
MH法の受理確率は次式で与えられます。

\[ \alpha = \min\!\left\{1,\ \frac{\pi(y)\,q(x \mid y)}{\pi(x)\,q(y \mid x)}\right\} \]

対称提案分布では \(q(x \mid y)/q(y \mid x) = 1\) となり、メトロポリス法の特殊形に簡約されます。

\[ \alpha = \min\{1,\ 0.4 \times 1\} = 0.4 \]

すなわち候補 \(y=2.0\) は40%の確率で受理されます。

実務でのポイント

ベイズ統計は試験対策にとどまらず、医薬・機械学習・金融の実務で広く活用されています。製薬業界ではベイズ統計の解析手法と製薬業界での活用で詳しく解説しているとおり、FDAの2026年ドラフトガイダンスを受けてベイズ流臨床試験デザインの採用が一気に進んでいます。

実務でベイズ推定を扱う際の鉄則は次の3点です。第一に、事前分布の選択を必ず正当化すること。無情報事前分布を採用する場合でも「なぜJeffreys事前を選んだのか」「過去試験データはどの程度ダウンウェイトしたか」を試験計画書に明記する必要があります。第二に、事後分布の感度分析を行うこと。事前分布のハイパーパラメータを動かして事後推論がどれだけ変化するかを必ず確認します。第三に、MCMCの収束診断を省略しないこと。\(\hat{R} < 1.01\)・有効サンプルサイズ(ESS)が十分大きいことを確認してから推論結果を報告するのが標準的なプロトコルです。 これらの考え方は試験勉強のなかでも自然に身につけられます。準1級で「事前分布の選び方」が問われたら、実務での感度分析を思い出す ── そんな往復ができるようになれば、ベイズ統計はあなたの強力な武器になります。

📚 この記事をより深く理解するための参考書籍

統計検定準1級のベイズ統計を体系的に学ぶには、以下の書籍が定番です。

現代数理統計学の基礎 久保川 達也
数理統計学の標準的な教科書で、ベイズ推定・損失関数・事後分布の章は準1級レベルを超えて深掘りされています。本記事で扱った「損失関数と最適推定量」の理論的背景や、共役事前分布の導出を厳密に追いたい受験者に最適。確率・統計の足腰を鍛えたい数理派には1冊目に推したい定番です。
『StanとRでベイズ統計モデリング』松浦 健太郎
通称「アヒル本」。MCMCの実装をRとStanで体験できる名著です。本記事のMH法の最小コードから一歩進んで、ハミルトニアンモンテカルロ(HMC)・NUTSサンプラー・階層ベイズモデルまで「動かしながら理解する」スタイルで学べます。準1級の概念理解にとどまらず、実務で使えるベイズモデリングの腕を鍛えたい方に必携の1冊です。
『日本統計学会公式認定 統計検定 準1級 公式問題集』日本統計学会 出版企画委員会 編
準1級の過去問・解説が収録された公式問題集。ベイズ統計の章では、本記事で整理した典型出題パターンが実際にどのような形で出題されているかを確認できます。テキストで概念を学んだあと、過去問演習で確実な得点力を養いましょう。テキスト+過去問の二刀流が合格への王道です。

関連記事・次のステップ

biostat4869.com にはベイズ統計と統計検定に関する記事を多数公開しています。本記事と併せて読むと、理解がさらに立体的になります。

まとめ

本記事では、統計検定準1級のベイズ統計パートを「事前分布の更新」「点推定・信用区間」「MCMC」の3つの柱で体系的に整理しました。

ベイズ統計の出発点は ベイズの定理 \(p(\theta \mid x) \propto p(x \mid \theta)\, p(\theta)\) です。この比例関係さえ手で追えれば、準1級の小問の8割は地続きで解けます。続いて学んだ 共役事前分布 は計算上の最大の武器で、ベルヌーイ/二項にBeta、ポアソンにGamma、正規(分散既知)にNormalという3つの対応を覚えてしまえば、事後分布はパラメータの足し算だけで求まります。

点推定では 損失関数と最適推定量の対応(二乗誤差→事後平均、絶対誤差→事後中央値、0-1損失→MAP)を、区間推定では HDIと等裾信用区間の使い分け を押さえることが重要でした。頻度論の信頼区間との哲学的な違い(直接確率解釈ができるか)も頻出の論点です。

MCMCについては、詳細釣り合い条件メトロポリス・ヘイスティングス法の受理確率を式で書けるレベル、ギブスサンプリングとの違いを言語化できるレベル、そして Gelman-Rubin \(\hat{R}\) による収束診断まで押さえれば準1級の出題範囲を十分にカバーできます。

ベイズ統計を準1級の得点源に変える最短ルートは、本記事の 典型出題3問 をスラスラ解けるようにし、そのうえで公式問題集の過去問演習に進むことです。試験対策の枠を超えて、ベイズ統計は医薬・機械学習・金融の最前線で必須スキルになっています。準1級の勉強を入り口に、ぜひベイズの世界に踏み込んでみてください。最後までお読みいただきありがとうございました。

ABOUT ME
tomokichi
外資系製薬会社で生物統計家として働ている1児のパパ。生物統計家とは何か、どのようなスキルが必要か、何を行っているのかを共有していきたいと思っております!生物統計に関する最新情報を皆様にお届けすべく、日々奮闘中です。趣味は筋トレ、温泉巡り、家族と散歩。