二項分布の性質(期待値・分散・確率関数・モーメント母関数・ポアソン近似・正規近似)




1. 二項分布とは

二項分布は、独立なベルヌーイ試行(成功か失敗の二つの結果のみを持つ試行)を複数回行ったときの成功回数の確率分布です。


ベルヌーイ分布は、単一の試行(例えば、コイン投げ)での成功または失敗をモデル化したもので、二項分布はこのベルヌーイ分布を複数回( n 回)の試行に一般化したものです。


二項分布 B(n, p) は、2つのパラメータ n  p によって定義されます。

ここで n  p は次にように定義されます。

  •  n は試行回数を表し、正の整数です。
  •  p は各試行で成功する確率で、  0≤p≤1 の範囲の実数です。


各試行は独立しており、成功確率 p は全ての試行で同じです。

二項分布に従う確率変数 X の値 k (成功回数)の確率は、次の確率質量関数によって与えられます。

\displaystyle{
\begin{align}
P(X=k) = {}_{n}C_{k}p^k(1-p)^{n-k}
\end{align}
}




2. 期待値と分散

二項分布の期待値と分散は次のようになります。

\displaystyle{
\begin{align}
E[X] &= np \\
V[X] &= np(1-p)
\end{align}
}


確率質量関数から期待値と分散を導出する詳細な内容は、次の記事で解説しています。

venoda.hatenablog.com




3. モーメント母関数

二項分布のモーメント母関数は次のようになります。

\displaystyle{
\begin{align}
M_X(t) = (e^tp + 1-p)^n
\end{align}
}


詳細な導出は次の記事で解説しています。

加えて、モーメント母関数から期待値と分散の導出も解説しています。

venoda.hatenablog.com




4. 確率母関数の導出

二項分布の確率母関数は次のようになります。

\displaystyle{
\begin{align}
G_X(s) &= \big(ps + 1-p \big)^n
\end{align}
}


詳細な導出は次の記事で解説しています。

加えて、確率母関数から期待値と分散の導出も解説しています。

venoda.hatenablog.com




5. 二項分布のポアソン近似

 n が大きく p が小さい場合、二項分布はポアソン分布に近似されることがあります。

二項分布のポアソン近似に関しては、次の記事で解説しています。

venoda.hatenablog.com




6. 二項分布の正規近似

二項分布は、独立なベルヌーイ試行の成功回数をカウントする分布です。

ベルヌーイ試行は、成功確率 pと失敗確率 1-pを持ちます。

 n回の独立したベルヌーイ試行の成功回数を表す確率変数を X _ iとします。


確率変数 X _ iは、 X _ i=1は成功を、 X _ i=0は失敗を示します。

したがって、

\displaystyle{
\begin{align}
E[X_i] &= p \\
V[X_i] &= p(1-p)
\end{align}
}

となります。


 \bar{X} = \frac{1}{n}(X _ 1 + X _ 2 + ... + X _ n)の分布は、中心極限定理から \bar{X}~N(p, \frac{p(1-p)}{n})に従います。

これは次の式が成り立つことを意味します。

\displaystyle{
\lim_{n→∞}P\Bigg(\frac{\bar{X}-p}{\sqrt{\frac{p(1-p)}{n}}} \leq x\Bigg) = \int_{-∞}^{x}e^{-\frac{t^2}{2}} dt
}


右辺は標準正規分布確率密度関数になります。


ここで X = X _ 1 + X _ 2 + \cdots + X _ nおきます。

ベルヌーイ試行である X_iは成功を X _ i=1とし、失敗を X _ i=0とするため、 X _ iの合計となる Xは成功回数としてとらえることができます。

つまり、 Xは二項分布 Bin(n, p)​とみることができます。


これを踏まえると \bar{X}は次のように表すことができます。

\displaystyle{
\begin{align}
\bar{X} &= \frac{1}{n}(X_1 + X_2 + ... + X_n)\\
&= \frac{X}{n}
\end{align}
}


これを用いて、次ように変形することができます。

\displaystyle{
\begin{align}
P\Bigg(\frac{\bar{X}-p}{\sqrt{\frac{p(1-p)}{n}}} \leq x\Bigg) &= P\Bigg(\frac{\frac{X}{n}-p}{\sqrt{\frac{p(1-p)}{n}}} \leq x\Bigg) \\

&= P\Bigg(\frac{(\frac{X}{n}-p)×\sqrt{n}}{\sqrt{p(1-p)}} \leq x\Bigg) \\

&= P\Bigg(\frac{(X-np)}{\sqrt{np(1-p)}} \leq x\Bigg)

\end{align}
}


したがって、 nが十分に大きければ、二項分布 Bin(n, p)は期待値 npと分散 np(1−p)正規分布によって、下記のように近似できます。

\displaystyle{
\begin{align}
\lim_{n→∞} P\Bigg(\frac{(X-np)}{\sqrt{np(1-p)}} \leq x\Bigg) &= \int_{-∞}^{x}e^{-\frac{t^2}{2}} dt \\
\end{align}
}


※正規近似はスターリングの公式などを使用することによって、証明することができます。

 しかし、計算量が非常に多く、統計検定1級の試験時間内で解ききるのは非常に難しいです。

 そのため、試験でスターリング公式から求める可能性は低いと思います。

 上記内容は中心極限定理が成り立つことを前提として説明になります。




7. 連続修正

二項分布は離散的な値を取りますが、正規分布は連続的な値を取ります。

離散分布の確率を連続分布で近似する際、実際の離散的な値と連続分布の確率密度関数との間には微妙な不一致が生じます。

連続修正は、この不一致を緩和するために、離散分布の確率計算において微小な調整を加えることです。

この修正により、離散分布を連続分布で近似した際の精度が向上します。


具体的には次のように計算します。

\displaystyle{
\begin{align}
P(Z \leq x) \approx  \Phi \bigg( \frac{x + \frac{1}{2} - np}{\sqrt{np(1-p)}} \bigg)
\end{align}
}


 xにいつも \frac{1}{2}を足すということではなく、次のような場合には \frac{1}{2}を引いて計算します。

\displaystyle{
\begin{align}
P(Z \ge x) &= 1 - P(Z \leq x - 1) \\
&\approx 1 - \Phi \bigg( \frac{x - \frac{1}{2} - np}{\sqrt{np(1-p)}} \bigg)
\end{align}
}




8. まとめ

  • 確率質量関数

    \displaystyle{
\begin{align}
P(X=k) = {}_{n}C_k p^k(1-p)^{n-k}
\end{align}
}

  • 期待値

    \displaystyle{
\begin{align}
E[X] = np \
\end{align}
}

  • 分散

    \displaystyle{
\begin{align}
V[X] = np(1-p)
\end{align}
}

  • モーメント母関数

    \displaystyle{
\begin{align}
M_X(t) = (e^tp + 1-p)^n
\end{align}
}

  • 確率母関数

    \displaystyle{
\begin{align}
G_X(s) = \big(ps + 1-p \big)^n
\end{align}
}