1. 二項分布とは
二項分布は、独立なベルヌーイ試行(成功か失敗の二つの結果のみを持つ試行)を複数回行ったときの成功回数の確率分布です。
ベルヌーイ分布は、単一の試行(例えば、コイン投げ)での成功または失敗をモデル化したもので、二項分布はこのベルヌーイ分布を複数回(回)の試行に一般化したものです。
二項分布は、2つのパラメータとによって定義されます。
ここでとは次にように定義されます。
- は試行回数を表し、正の整数です。
- は各試行で成功する確率で、の範囲の実数です。
各試行は独立しており、成功確率は全ての試行で同じです。
二項分布に従う確率変数の値(成功回数)の確率は、次の確率質量関数によって与えられます。
2. 期待値と分散
二項分布の期待値と分散は次のようになります。
確率質量関数から期待値と分散を導出する詳細な内容は、次の記事で解説しています。
3. モーメント母関数
二項分布のモーメント母関数は次のようになります。
詳細な導出は次の記事で解説しています。
加えて、モーメント母関数から期待値と分散の導出も解説しています。
4. 確率母関数の導出
二項分布の確率母関数は次のようになります。
詳細な導出は次の記事で解説しています。
加えて、確率母関数から期待値と分散の導出も解説しています。
5. 二項分布のポアソン近似
が大きくが小さい場合、二項分布はポアソン分布に近似されることがあります。
二項分布のポアソン近似に関しては、次の記事で解説しています。
6. 二項分布の正規近似
二項分布は、独立なベルヌーイ試行の成功回数をカウントする分布です。
ベルヌーイ試行は、成功確率と失敗確率を持ちます。
回の独立したベルヌーイ試行の成功回数を表す確率変数をとします。
確率変数は、は成功を、は失敗を示します。
したがって、
となります。
の分布は、中心極限定理からに従います。
これは次の式が成り立つことを意味します。
ここでおきます。
ベルヌーイ試行であるは成功をとし、失敗をとするため、の合計となるは成功回数としてとらえることができます。
つまり、は二項分布とみることができます。
これを踏まえるとは次のように表すことができます。
これを用いて、次ように変形することができます。
したがって、が十分に大きければ、二項分布は期待値と分散の正規分布によって、下記のように近似できます。
※正規近似はスターリングの公式などを使用することによって、証明することができます。
しかし、計算量が非常に多く、統計検定1級の試験時間内で解ききるのは非常に難しいです。
そのため、試験でスターリング公式から求める可能性は低いと思います。
上記内容は中心極限定理が成り立つことを前提として説明になります。
7. 連続修正
二項分布は離散的な値を取りますが、正規分布は連続的な値を取ります。
離散分布の確率を連続分布で近似する際、実際の離散的な値と連続分布の確率密度関数との間には微妙な不一致が生じます。
連続修正は、この不一致を緩和するために、離散分布の確率計算において微小な調整を加えることです。
この修正により、離散分布を連続分布で近似した際の精度が向上します。
具体的には次のように計算します。
にいつもを足すということではなく、次のような場合にはを引いて計算します。
8. まとめ
確率質量関数
期待値
分散
モーメント母関数
確率母関数