確率母関数の導出と性質

確率母関数は、離散確率変数に対して定義される関数で、その確率分布の特性を表します。

特に、非負の整数値を取る離散確率変数に対して用いられます。

確率母関数は、確率変数のモーメント(特に平均や分散など)を求めるのに役立ち、また、確率変数の和の分布を扱う際に特に有用です。

確率母関数は統計検定1級の試験範囲に含まれています。




1. 確率母関数の定義

確率変数 X が取り得る全ての非負整数値 k に対する確率 P(X=k) を用いて、確率母関数 G_X(s) は次のように定義されます。

\displaystyle{
\begin{align}
G_X(s) &= E[s^X]\\
&= \sum_{k=0}^{∞}P(X=k)s^k
\end{align}
}


ここで、 E[⋅] は期待値を示します、 s は実数で、通常は |s|≤1 の範囲で考えられます。




2. 確率母関数の使いどころ

確率母関数の n 導関数 s=1 で評価することにより、確率変数 X  n 次モーメントを求めることができ、ここから期待値と分散を求めることができます。


実際に G_X(s) 微分して確認してみます。

\displaystyle{
\begin{align}
G_X(s) &= E[s^X] \\
G_X'(s) &= E[Xs^{X-1}] \\
G_X''(s) &= E[X(X-1)s^{X-2}]
\end{align}
}


上記の微分した結果に s=1 を代入すると、次のようになります。

\displaystyle{
\begin{align}
G_X'(1) &= E[X]\\
G_X''(1) &= E[X(X-1)]
\end{align}
}


期待値は G'_X(1) となります。

分散は公式を使って次の計算で求めることができます。

\displaystyle{
\begin{align}
V[X] &= E[X^2] - E[X]^2 \\
&= E[X^2] - E[X] + E[X] - E[X]^2 \\
&= E[X^2 - X] + E[X] - E[X]^2 \\
&= E[X(X-1)] + E[X] - E[X]^2 \\
&= G_X''(1) + G_X'(1) - G_X'(1)^2
\end{align}
}




3. 確率母関数の導出

実際に二項分布を例に確率母関数を導出します。


二項分布 B(n, p) の確率質量関数は、次のように定義されます。

\displaystyle{
P(X=k) = {}_nC_k p^k (1-p)^{n-k}
}


確率母関数の定義に従って、二項分布の場合の G_X(s) を設定します。

\displaystyle{
\begin{align}
G_X(s) &= E[s^X]\\
&= \sum_{k=0}^{n}P(X=k)s^k
\end{align}
}


二項分布の確率質量関数を代入します。

\displaystyle{
\begin{align}
G_X(s) &= \sum_{k=0}^{n}{}_nC_{k}p^k(1-p)^{n-k}s^k
\end{align}
}


ここで、 s^k  p^k を組み合わせて (ps)^k として、式を変形させます。

\displaystyle{
\begin{align}
G_X(s) &= \sum_{k=0}^{n}{}_nC_{k}(ps)^k(1-p)^{n-k}
\end{align}
}


下記の二項定理を使用して、式を整理します。

\displaystyle{
(a + b)^n = \sum_{k=0}^{n}{}_nC_ka^{n-k}b^k
}


 a=1-p b=ps とした場合、次のように整理されます。

\displaystyle{
\begin{align}
G_X(s) &= \big((1-p) + ps \big)^n
\end{align}
}


以上が二項分布の確率母関数の導出になります。




4. 期待値の導出

期待値は確率母関数の一階微分 G_X'(s)  s=1 を代入することで得られます。

\displaystyle{
E[X] = G_X'(1)
}


先ほど求めた二項分布の確率母関数を使用して、二項分布の期待値を求めてみます。

\displaystyle{
\begin{align}
G_X'(s) &= \frac{d}{ds} \big((1-p) + ps \big)^n \\
&= n(1-p+ps)^{n-1}・p
\end{align}
}


 s=1 を代入すると次のように求めることができます。

\displaystyle{
\begin{align}
G_X'(1) &= n(1-p+p・1)^{n-1}・p\\
&= np
\end{align}
}


 G_X'(1)=E[X] となるため、このように確率母関数から期待値を求めることができました。




5. 分散の導出

分散は確率母関数の二階微分 G_X''(s)  s=1 ​を代入した値を使用して、次のように求めることができます。

\displaystyle{
\begin{align}
V[X] &= E[X^2] - (E[X])^2\\
&= G_X''(1) + G_X'(1) - G_X'(1)^2
\end{align}
}


先ほど求めた二項分布の確率母関数と期待値を使用して、二項分布の分散を求めてみます。

\displaystyle{
\begin{align}
G_X''(s) &= \frac{d^2}{ds^2} \big((1-p) + ps \big)^n \\
&= n(n-1)p^2(1-p+ps)^{n-2}
\end{align}
}


 s=1 を代入すると次のように求めることができます。

\displaystyle{
\begin{align}
G_X''(1) &= n(n-1)p^2(1-p+p・1)^{n-2} \\
&= n(n-1)p^2
\end{align}
}


これを利用して分散の公式にあてはめます。

\displaystyle{
\begin{align}
V[X] &= G_X''(1) + G_X'(1) - G_X'(1)^2 \\
&= n(n-1)p^2 + np - n^2p^2\\
&= n^2p^2 - np^2 + np - n^2p^2 \\
&= np - np^2 \\
&= np(1-p)
\end{align}
}


このようにして確率母関数から分散を求めることができました。