点推定値の基礎から学ぶ：推定量の性質とその意義

記事の目次

はじめに

統計学において「推定」とは、母集団の未知のパラメータを標本データから推測することを指します。その中でも「点推定値」は、母数の値を一つの数値として推定する方法です。例えば、母平均 $\mu$ を標本平均 $\bar {X}$ で推定するのは典型的な点推定です。
本記事では、点推定の基礎から始め、推定量の重要な性質である 普遍推定量（不偏性）、有効推定量、漸近有効性、十分性、一致性 を体系的に解説します。数式や図解を交え、初心者から専門家まで理解しやすいように解説していきます。

点推定の基礎

母集団のパラメータ $\theta$ を推定するために、標本データ $X_1,X_2,\dots ,X_n$ を用います。推定量 $\hat {\theta }$ は標本データの関数であり、確率変数です。

例：母平均の推定
\[\hat {\mu }=\bar {X}=\frac{1}{n}\sum _{i=1}^{n}X_i\]
例：母分散の推定
\[\hat {\sigma }^2=\frac{1}{n}\sum _{i=1}^{n}(X_i-\bar {X})^2\]

推定量は「どのような性質を持つか」によって評価されます。以下でその代表的な性質を解説します。

不偏推定量（Unbiased Estimator）

推定量 $\hat {\theta }$ の期待値が真の母数 $\theta$ に一致するとき、不偏推定量と呼びます。

\[E[\hat {\theta }]=\theta\]

例：標本平均
\[E[\bar {X}]=\mu\]
よって \bar {X} は母平均の不偏推定量。
例：標本分散
\[\hat {\sigma }^2=\frac{1}{n}\sum _{i=1}^{n}(X_i-\bar {X})^2\]
は不偏ではなく、修正標本分散
\[S^2=\frac{1}{n-1}\sum _{i=1}^{n}(X_i-\bar {X})^2\]
が不偏推定量となります。

統計学の基礎：標本分布を理解しよう標本分布とは何かを統計の基礎からやさしく解説。母集団と標本の関係、標本平均がしたがう分布、中心極限定理の意味と、推定・検定につながる考え方を初学者向けに具体例で整理します。...

有効推定量（Efficient Estimator）

不偏推定量の中で、分散が最小のものを有効推定量といいます。
分散が0またはそれに近い不偏推定量を見つけていきたいが、実際は不可能です。

推定量の分散には理論的な下限があり、それを満たす推定量は「最良不偏推定量（MVUE）」と呼ばれます。このとき、クラメール・ラオ(Cramer-Rao)の不等式という定理を用います。

\[Var (\hat{\theta} \geq \frac{1}{I(\theta)})\]

ここで$I(\theta)$はフィッシャー情報量と呼び、

\[I(\theta) = E \left[\frac{\partial log(f(X|\theta))}{\partial \theta} \right]\]

以下ではクラメール・ラオの不等式について証明していきます。

今回は連続型の場合を考えていきます。

$E(T)= \theta$より、

\[\theta = \int_{- \infty}^{\infty} \dotsi \int_{- \infty}^{\infty} t(x_1 \cdots x_n) \prod_{i=1}^{n}f(x_i|\theta) dx_1 \cdots dx_n —(i)\]

\[1 =\int_{- \infty}^{\infty} \dotsi \int_{- \infty}^{\infty} \prod_{i=1}^{n}f(x_i|\theta) dx_1 \cdots dx_n —(ii) \]

(i),(ii)を両辺$\theta$で微分します。

\[1 = \int_{- \infty}^{\infty} \dotsi \int_{- \infty}^{\infty} t(x_1 \cdots x_n) \frac{\partial}{\partial \theta} \prod_{i=1}^{n}f(x_i|\theta) dx_1 \cdots dx_n —(iii)\]

\[0 =\int_{- \infty}^{\infty} \dotsi \int_{- \infty}^{\infty} \frac{\partial}{\partial \theta} \prod_{i=1}^{n}f(x_i|\theta) dx_1 \cdots dx_n —(iv) \]

(iii) – $\theta \times $ (iv)を行い、

$$
\begin{eqnarray}
1 &=& \int \cdots \int (t(x_1, \ldots, x_n) – \theta)
\frac{\partial}{\partial \theta}
\prod_{i=1}^{n} f(x_i|\theta) \, dx_1 \cdots dx_n \\
&=& \int \cdots \int (t(x_1, \ldots, x_n) – \theta)
\frac{\partial}{\partial \theta}
\log \left( \prod_{i=1}^{n} f(x_i|\theta) \right)
\prod_{i=1}^{n} f(x_i|\theta) \, dx_1 \cdots dx_n \\
&=& E \left[ (T – \theta)
\frac{\partial}{\partial \theta}
\log \left( \prod_{i=1}^{n} f(X_i|\theta) \right) \right]
\quad \text{— (v)}
\end{eqnarray}
$$

\[\because \frac{\partial f(x|\theta)}{\partial \theta} = \frac{\partial log f(x|\theta)}{\partial \theta} f(x|\theta)\]

$E \left[\frac{\partial}{\partial \theta}log(\prod_{i=1}^{n}f(X_i|\theta)) ^{2}\right] $が存在するとして、(v)にコーシーシュワルツの不等式を適用します。

コーシーシュワルツの不等式

任意のtの実数に対して、

$$
\begin{eqnarray}
E[t(X-Y)^{2}] \geq 0 \\
\leftrightarrow t^{2}E(X^{2}) – 2tE(XY) + E(Y^2) \geq 0
\end{eqnarray}
$$

判別式を用いて、
$$
\begin{eqnarray}
\frac{D}{4} = (E(XY))^{2} – E(X^2)E(Y^2) \leq 0 \\
\leftrightarrow (E(XY))^{2} \leq E(X^2)E(Y^2)
\end{eqnarray}
$$

$$
\begin{eqnarray}
1 &=& \left[E(T – \theta)\frac{\partial}{\partial \theta}log (\prod_{i=1}^{n}f(x_i|\theta)) \right]^2\\
&\leq& E[(T- \theta)^2] E[(\frac{\partial}{\partial \theta}log (\prod_{i=1}^{n}f(x_i|\theta)))^2]
\end{eqnarray}
$$

ここで、

\[E[(T- \theta)^2] = V(T)\]

$$
\begin{eqnarray}
E[(\frac{\partial}{\partial \theta}log (\prod_{i=1}^{n}f(x_i|\theta)))^2] &=& E[(\sum_{i=1}^{n}\frac{\partial}{\partial \theta}log f(x_i|\theta))^2]\\
&=& \sum_{i=1}^{n}E[(\frac{\partial}{\partial \theta} log f(x_i|\theta))^2] + \sum_{i=1}^{n}\sum_{j=1}^{n}E \left[(\frac{\partial log f(x_i|\theta)}{\partial \theta})(\frac{\partial log f(x_j|\theta)}{\partial \theta})\right]\\
&=& n I(\theta)
\end{eqnarray}
$$

となることから、$V(T) \geq \frac{1}{nI(\theta)}$となる。 Q.E.D

漸近有効性（Asymptotic Efficiency）

標本サイズ$n$が大きくなるとき、推定量の分布が正規分布に近づき、その分散がクラメール・ラオの不等式に一致する場合、漸近有効性をもつといいます。

例：最尤推定量（MLE）
\[\tilde{\theta_{MLE}} ~ N\left(\theta, \frac{1}{nI(\theta)} \right)\]
大標本では最尤推定量が漸近的に最良となります。

十分性（Suffiiency）

統計量$T(X)$が母数$\theta$に関して十分であるとは、標本データの情報をすべて保持していることを意味しています。

定義

統計量$T(X)$が母数$\theta$が十分統計量であるとは、標本の分布が

\[f(x|\theta) = g(T(x),\theta) h(x)\]

と分解できます。

例：正規分布 平均$\mu$の推定において、標本平均$\bar{X}$は十分統計量。

一致性（Consistency）

推定量$\tilde{\theta_n}$が標本サイズ$n \rightarrow \infty$のとき、母数$\theta$に収束する性質を一致性といいます。

まとめ

点推定とは、母集団の未知のパラメータを標本データから一つの数値として推定する方法であり、統計学の基礎を成す重要な概念です。推定量にはいくつかの性質があり、それらを理解することで推定の信頼性や妥当性を評価できます。まず、不偏推定量は平均的に正しい推定を行う性質を持ち、有効推定量は不偏推定量の中で分散が最小となるものを指します。さらに、標本サイズが大きくなるときに理論的に最良の推定量となる漸近有効性も重要です。また、十分統計量は母数に関する情報を失わずにデータを要約できる統計量であり、一致性は標本サイズが増えるにつれて推定量が真の値に収束する性質を意味します。これらの性質は、推定量を選択・評価する際の基本的な基準であり、特に医薬品開発や規制科学の分野では、臨床試験の解釈や承認に直結するため不可欠です。総じて、点推定の理解は統計学の理論的基盤を支えると同時に、実務における意思決定の精度を高める役割を果たします。

参考書籍

入門・演習数理統計

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

入門・演習数理統計 [ 野田一雄 ]
価格：3,850円（税込、送料無料) (2025/12/11時点)

楽天で購入

Amazon

楽天市場

クラメール・ラオの不等式一致性不偏推定量十分推定量有効推定量点推定値統計検定

点推定値の基礎から学ぶ：推定量の性質とその意義

はじめに

点推定の基礎

不偏推定量（Unbiased Estimator）

有効推定量（Efficient Estimator）

漸近有効性（Asymptotic Efficiency）

十分性（Suffiiency）

一致性（Consistency）

まとめ

参考書籍

COMMENT コメントをキャンセル

マルチステートモデル（Multi-state Model）とは ― illness-death モデルと状態遷移確率をRで実装する ―

サブグループ解析と交互作用検定を正しく行う ― 効果修飾の評価・多重性・forest plotの落とし穴をRで実装する ―

ポアソン回帰とは ― 件数・発生率データをRで解析する一般化線形モデル入門 ―

MCP-Mod（多重比較とモデリング）で用量反応を解析する ― 第II相試験の用量選択をRのDoseFindingパッケージで実装 ―

順序ロジスティック回帰（比例オッズモデル）とは ― 順序カテゴリのアウトカムをRで解析する ―

ICH E6（GCP）とは？改訂のポイントまで図解でわかりやすく解説

MMRM（反復測定混合モデル）とは― 臨床試験での柔軟な時系列解析手法 ―

p値を正しく理解する：統計学を勉強していく人のための基礎から応用まで

効果量（Effect Size）を理解すると統計が一気に実務的になる― p値の限界を超えて、“どれだけ効くか”を語れる統計へ ―

統計検定準1級・1級攻略ガイド ― 試験範囲・学習ステップ・よく出るテーマを完全整理 ―

はじめに

点推定の基礎

不偏推定量（Unbiased Estimator）

有効推定量（Efficient Estimator）

漸近有効性（Asymptotic Efficiency）

十分性（Suffiiency）

一致性（Consistency）

まとめ

参考書籍

モデル選択の基礎：AIC・BICを“情報量”として理解する— 過学習を避け、汎化性能を高めるための実務的ガイド —

平均への回帰とは何か：統計学初学者のためのやさしい解説

連続分布のp値と離散分布のp値、そしてmid-p値の意義―製薬統計における応用を中心に―

グラフで理解する統計：可視化の力― 製薬業界で役立つ“見える化”の基本と実装例 ―

製薬業界におけるFisherの正確検定〜数理的導出からR実装まで〜

ベイズ統計の信用区間と頻度論の信頼区間の違いについて

COMMENT コメントをキャンセル

マルチステートモデル（Multi-state Model）とは ― illness-death モデルと状態遷移確率をRで実装する ―

サブグループ解析と交互作用検定を正しく行う ― 効果修飾の評価・多重性・forest plotの落とし穴をRで実装する ―

ポアソン回帰とは ― 件数・発生率データをRで解析する一般化線形モデル入門 ―

MCP-Mod（多重比較とモデリング）で用量反応を解析する ― 第II相試験の用量選択をRのDoseFindingパッケージで実装 ―

順序ロジスティック回帰（比例オッズモデル）とは ― 順序カテゴリのアウトカムをRで解析する ―

ICH E6（GCP）とは？改訂のポイントまで図解でわかりやすく解説

MMRM（反復測定混合モデル）とは― 臨床試験での柔軟な時系列解析手法 ―

p値を正しく理解する：統計学を勉強していく人のための基礎から応用まで

効果量（Effect Size）を理解すると統計が一気に実務的になる― p値の限界を超えて、“どれだけ効くか”を語れる統計へ ―

統計検定 準1級・1級 攻略ガイド ― 試験範囲・学習ステップ・よく出るテーマを完全整理 ―

統計検定準1級・1級攻略ガイド ― 試験範囲・学習ステップ・よく出るテーマを完全整理 ―