カイ二乗分布の性質(期待値・分散・モーメント母関数・確率密度関数の導出・指数分布との関係・ガンマ分布との関係・不偏分散が従う分布)




1. カイ二乗分布とは

カイ二乗分布は、 n個の独立な標準正規分布の確率変数 Z _ 1, Z _ 2, ..., Z _ nの二乗和が従う確率分布です。

すなわち、確率変数 Xが自由度 nカイ二乗分布に従う場合、 Xは次のように表されます。

\displaystyle{
X = Z_1^2 + Z_2^2 + \cdots + Z_n^2
}


カイ二乗分布は、独立性や適合度の検定など、多くの統計的検定に使用されます。

自由度 nに依存して、その形状は大きく変わりますが、常に右側に長い尾を持つ非対称な形状をしています。

自由度が大きくなるにつれて、分布の形状は正規分布に近づきます。


自由度 nカイ二乗分布に従う確率変数 X確率密度関数は、次の式によって与えられます。

\displaystyle{
f(x; n) = \frac{1}{\Gamma(n/2)}\left(\frac{1}{2}\right)^{n/2}x^{n/2-1}\exp(-x/2), \quad x > 0
}


ここで、  \Gamma(n)はガンマ関数を表します。



※以下、ガンマ関数 \Gamma(n)について補足します。

ガンマ関数 \Gamma(n)は階乗を一般化したもので、次のように定義されます。

\displaystyle{
\begin{align}
\Gamma(n) &= \int_{0}^{∞} x^{n-1}・e^{-x} \ dx
\end{align}
}


ガンマ関数は次の性質を持ちます。

\displaystyle{
\begin{align}
\Gamma(n) &= (n-1)\Gamma(n-1)\\
&= (n-1)!\\
\\

\Gamma \bigg(\frac{1}{2}\bigg) &= \sqrt{\pi} \\
\\

\Gamma(1) &= 1 \\
\\

\Gamma \bigg(\frac{1}{2}+n\bigg) &= \frac{(2n-1)!!}{2^n}\sqrt{\pi} & (nは自然数)\\
\\

\Gamma \bigg(\frac{1}{2} -n\bigg) &= \frac{(-2)^n}{(2n-1)!!}\sqrt{\pi}  & (nは自然数)\\
\end{align}
}




2. 期待値と分散

カイ二乗分布の期待値と分散は次のようになります。

\displaystyle{
\begin{align}
E[X] &= n \\
V[X] &= 2n
\end{align}
}


確率密度関数から期待値と分散を導出の詳細は、次の記事で解説しています。

venoda.hatenablog.com




3. モーメント母関数

カイ二乗分布のモーメント母関数は次のようになります。

\displaystyle{
\begin{align}
M_X(t) = \left( \frac{1}{1-2t} \right)^{\frac{n}{2}}
\end{align}
}


詳細な導出は次の記事で解説しています。

加えて、モーメント母関数から期待値と分散の導出も解説しています。

venoda.hatenablog.com




4. カイ二乗分布確率密度関数の導出

標準正規分布の二乗和がカイ二乗分布に従う証明と、実際にカイ二乗分布の導出方法を解説しています。

venoda.hatenablog.com




5. 指数分布との関係

自由度2のカイ二乗分布は、パラメータ \lambda = 1/2の指数分布 Exp(\lambda)となります。


実際にカイ二乗分布に対して n=2としたときの確率密度関数を確認してみます。

\displaystyle{
\begin{align}
f(x; 2) &= \frac{1}{\Gamma(2/2)}\left(\frac{1}{2}\right)^{2/2}x^{2/2-1}\exp(-x/2) \\

&= \frac{1}{2} \exp ( - x / 2)
\end{align}

}


これは、パラメータ \lambda 1/2のときの指数分布の確率密度関数と等しくなることがわかります。




6. ガンマ分布との関係

ガンマ分布は、形状パラメータ  kと尺度パラメータ \theta​​を持つ連続確率分布となります。

\displaystyle{
\begin{align}
f(x; k, \theta) &= \frac{1}{\Gamma(k) \theta^k}x^{k-1} e^{-\frac{x}{\theta}}
\end{align}
}


自由度の nカイ二乗分布は、パラメータ k=n/2,  \theta=2のガンマ分布 Ga(k, \theta)となります。

カイ二乗分布はガンマ分布の特別なケースと見なすことができます。


実際にパラメータ k=n/2,  \theta=2としたときの、ガンマ分布の確率密度関数を確認してみます。

\displaystyle{
\begin{align}
f(x; n/2, 2) &= \frac{1}{\Gamma\left(\frac{n}{2}\right) 2^{\frac{n}{2}}}x^{\frac{n}{2}-1} e^{-\frac{x}{2}}
\end{align}
}


これは、自由度 nカイ二乗分布確率密度関数と等しくなることがわかります。




7. 不偏分散が従う分布

 X _ 1, X _ 2, \ldots, X _ nが互いに独立で、平均 \muおよび分散 \sigma^ 2正規分布に従うとき、 \sum _ {i=1}^ {n} \left(\frac{X _ i - \bar{X}}{\sigma}\right)^ 2は自由度 n-1カイ二乗分布に従います。

\displaystyle{
\sum_{i=1}^{n} \left(\frac{X_i - \bar{X}}{\sigma}\right)^2 \sim \ \chi^2_{n-1}
}


不偏分散を V^ 2 = \frac{1}{n-1} \sum _ {i=1}^ {n} (X _ i - \bar{X})^ 2とするとき、次のように表記することもあります。

\displaystyle{
\begin{align}
\frac{(n-1)V^2}{\sigma^2} \ \sim \ \chi^2_{n-1}
\end{align}
}




8. まとめ