1. 線形単回帰
2つの量の間に直線的な関係があると仮定し、一方の変数(独立変数または説明変数)を用いて他方の変数(従属変数または目的変数)を予測します。
線形単回帰モデルは以下の方程式で表されます。
ここで各変数は次のように定義されます。
- は目的変数(予測したい変数)
- は説明変数(予測に使用する変数)
- は切片(y軸との交点)
- は傾き(説明変数の変化に対する目的変数の変化の度合い)
- は誤差項(モデルが捉えきれない残差)
ここではに従います。
2. 最小二乗推定
1. 推定方法
1. 切片と傾きの推定
観測されたデータとモデルによる予測値との差(誤差)の二乗和が最小になるように、モデルのパラメータ(切片と傾き)を決定します。
誤差の二乗和()は、全ての観測点に対する実際の値とモデルによる予測値の差の二乗の和で定義されます。
を最小化するとの値を見つけるには、をとに関して偏微分し、それぞれの偏微分係数がになる点を求めます。
について解いていきます。
について微分します。
とおいて、計算します。
続いて、について解いていきます。
について微分します。
とおいて、計算します。
とを求めるために、次の連立方程式を考えます。
これを行列とベクトルの積の形にまとめて計算します。
ここで
となるため、次のように表すことができます。
は次のように表すことができます。
の部分を考えます。
式を整理するために、次の式を利用します。
これを利用すると、は次のようになります。
次に、の箇所を考えます。
式を整理するために、次の式を利用します。
これを利用すると、は次のようになります。
まとめると、は次のように求めることができます。
は次のように求めることができます。
以上まとめると、およびの最小二乗推定量およびは次のように求めることができます。
2. 残差と残差の推定
観測値とモデルによる予測値との差を残差といいます。
残差は次のように表されます。
残差の二乗和を取ったものを残差平方和といい、次のように表されます。
残差の分散は、RSSを自由度で割ったものとして推定されます。
線形回帰モデルにおける自由度は、観測値の総数から推定されたパラメータの数 (単回帰の場合は、切片と傾きのために2を引く)を引いたものです。
したがって、残差の分散の推定値は次のようになります。
2. 最小二乗推定量の分布
上で求めた最小二乗推定量()について、平均と分散を求めてみたいと思います。
1. β_1の平均
の最小二乗推定量は次の式で与えられます。
期待値を計算するには、まずを線形回帰モデルの式に置き換えます。
ここで、となりますが、の期待値はなので となります。
したがって、式は次のように簡略化されます。
期待値を取ると、分子の第二項の期待値がになります(は独立しており、平均が)。
これは、 とが独立であるという仮定に基づきます。
これにより、の期待値が真のパラメータに等しいこと、つまり がの不偏推定量であることを示しています。
2. β_1の分散
平均を求めたときと同様に、は次のように表すことができます。
式を簡単化すると、の式は次のように誤差項を含んだ形で表されます。
分散を計算するために、上記の式の分散を取ります。
ここで、の分散はであり、とは定数なので、分散の公式を適用して求めます。
3. β_0の平均
の最小二乗推定量は次の式で与えられます。
に対して期待値を取ります。
ここで、 と の期待値を考えます。
の平均 は です。
また、上で示したようにです。
これらを用いて、を計算します。
この計算により、の期待値は真のパラメータに等しくなります。
これは、がの不偏推定量であることを示しています。
4. β_0の分散
平均を求めたときと同様に、の最小二乗推定量は次の式で与えられます。
に対して分散を取ります。
ここで、はの平均の分散で、は上で導出したの分散です。
の分散となるため、は次のように計算されます。
そして、の分散は次の式で与えられます。
これらを の式に代入して求めます。
5. β_0とβ_1の共分散
との共分散の次の式で与えられます。
まずはを求めます。
ここで、は分散の公式を利用して、次のように表すことができます。
これを利用して、次のように式を整理します。
が求まったので、共分散の式に当てはめて、共分散を求めます。