1. 区間推定
点推定は、母集団の特定のパラメータを一つの値で推定する方法です。
しかし、この推定値は実際には母数の周りである範囲に分布していることが多いため、点推定だけでは推定の不確かさを表現できません。
そこで、区間推定が登場します。
区間推定では、母集団のパラメータがある確率で含まれると考えられる範囲、つまり信頼区間を設定します。
これにより、母集団のパラメータの散らばりを考慮し、そのパラメータが特定の区間内に存在する確率を表すことができます。
2. 信頼係数と信頼区間
母集団からのランダムサンプルを考え、これらが確率密度関数に従っているとします。
ここで、は母集団の未知のパラメータです。
このサンプル集合に基づいて、二つの統計量とを定義します。
このとき、区間は、すべてのに対して以下の式を満たすとします。
この式は、母数が計算された区間内に含まれる確率が以上であることを意味します。
上記の確率は被覆確率と呼ばれ、実際に区間が母数をカバーする確率を意味します。
例えば、信頼係数を95%と設定する場合、100回実験したときに5回程度はが含まれないことを意味ます。
3. 信頼区間の構成方法
サンプルが正規分布に従っているとし、ここでは分散は既知とします。
平均の信頼区間を構成するために、標本平均に基づいて信頼区間を構成します。
標本平均は、サンプルの平均値であり、この自体が正規分布に従うことになります。
ここで、は母平均、はサンプルサイズです。
正規分布の特性を利用して、標本平均から母平均を推定する際の不確実性を表すために、正規分布の両側点をとしたとき、
となる確率はとなります。
これは、標本平均が母平均からある範囲内に収まる確率を示しています。
上記の不等式は次のように表すことができます。
これは、母平均が特定の区間に含まれる確率がであることを意味します。
したがって、の推定のための区間はとなります。