不偏推定量の推定量の良し悪しは、分散の大小によって評価します。
推定量として分散が小さければ小さいほど、よい推定量になりますが、実際に分散には下限が存在します。
クラメール・ラオの不等式は、分散の下限をフィッシャー情報に基いて数式化したものです。
この記事では、クラメール・ラオの不等式について解説しています。
1. スコア関数
1. 定義
をからの個のランダムサンプルとします。
の尤度関数(同時確率密度関数)をと表すとき、スコア関数は対数尤度関数をパラメータに関する微分として定義されます。
つまり、スコア関数は以下のように定義されます。
2. 性質
1. スコア関数の期待値は
スコア関数の期待値はとなります。
これは、パラメータがその真の値に等しいとき、スコア関数の平均がになることを意味します。
実際に期待値を計算してになるか確認してみましょう。
これを用いると期待値は次のように計算することができます。
ここで、微分と積分の順序交換により、に変形することができます。
(全確率)となり、続いてとなるので、期待値値は次のようにになることがわかります。
2. のときスコア関数が従う正規分布に分布収束
はのとき正規分布に分布収束します。
スコア関数の期待値は、上で説明したように$0$になります。
また、スコア関数の分散はとなります。(下のフィッシャー情報量のところで解説しています。)
正規分布に収束する理由として、は対数を取った尤度関数となるので、確率変数の和としてみることができます。
中心極限定理から、確率変数の平均(または和)が、サンプルサイズが大きくなるにつれて正規分布に収束することになるので、のときスコア関数は正規分布に従います。
2. フィッシャー情報量
1. 定義
フィッシャー情報量は、観測データを通じてパラメータに関する情報の量を表します。
具体的には、パラメータの推定における精度の限界を示す指標として用いられます。
フィッシャー情報量は、スコア関数の二乗の期待値で定義されます。
2. 性質
フィッシャー情報量の性質を、三つ解説します。
1.
まず一つ目は、個のデータのフィッシャー情報量は、個のデータのフィッシャー情報量の倍になります。
2. フィッシャー情報量は尤度関数の二階微分の期待値でも表現可能
二つ目は、フィッシャー情報量は階微分を用いた次の形式で表すこともできます。
実際に階微分が上記の式になるか確認したいと思います。
ここで、の期待値を考えます。
スコア関数の期待値を取ったときと同様に、微分と積分の順序交換を用いると次のようにになります。
これを用いて両辺の期待値はとると、次のようになります。
となるため、スコア関数と表すことができます。
フィッシャー情報量は、スコア関数の二乗の期待値で定義されるので、となります。
以上より、フィッシャー情報量は階微分を用いた次の形式で表すことが確認できます。
3. スコア関数の分散はフィッシャー情報量となる
三つ目は、フィッシャー情報量はスコア関数の分散の形式でも表すことができます。
スコア関数の期待値がになることを利用して、求めることができます。
3. クラメール・ラオの不等式
1. 定義
不偏推定量の推定量の良し悪しは、分散の大小によって評価します。
推定量として分散が小さければ小さいほど、よい推定量になりますが、実際に分散には下限が存在します。
クラメール・ラオの不等式は、分散の下限をフィッシャー情報に用いて数式化したものです。
パラメータの不偏推定量に対して、その分散は次の不等式を満たします。
これをクラメール・ラオの不等式と言い、次のように定義されます。
クラメール・ラオの不等式は、任意の不偏推定量の精度(分散の小ささ)には限界があり、この限界はフィッシャー情報量によって決定されるということを意味します。
フィッシャー情報量が大きければ大きいほど、そのパラメータの推定は理論的に、より精度良く行うことが可能です。
2. 有効推定量
ある不偏推定量が、クラメール・ラオの下限に達しているとき、この推定量を有効推定量と呼びます。