線形回帰において、説明変数と目的変数をそれぞれ一次変換して新たな変数とを導入する場合、次のような変換が行われます。
この一次変換は、データのスケーリングやシフト(平行移動)に相当し、モデルの解釈や適用範囲を変えることがありますが、線形性の本質を変えるものではありません。
平均、分散、共分散、および相関係数がどのように変わるのか解説します。
1. 平均
の平均を、の平均をとすると、変換後の と の平均はそれぞれ以下のように表されます。
- の平均:
- の平均:
2. 分散
の分散を、の分散をとすると、変換後のとの分散はそれぞれ以下のようになります。
分散は変換の係数の二乗に比例して変化しますが、平行移動の項、は分散に影響しません。
- の分散:
- の分散:
リンク
3. 共分散
との共分散をとすると、変換後のとの共分散は以下のようになります。
共分散は、両変数の係数の積に比例して変化します。
- 共分散:
4. 相関係数
との相関係数をとすると、変換後のとの相関係数は以下のようになります。
相関係数は変換前後で変わりません。これは、相関係数が変数間の線形関係の強さを示す無次元の量であり、係数や平行移動の影響を受けないためです。
- 相関係数:
リンク