第17回 相関
§1 相関と相関図
2種類のデータの相関を調べるために、横軸と縦軸を使ってデータをプロットしたものを散布図という。
2つの異なるデータの系列
があり、それを座標
であらわす。
§2 共分散と相関係数
(x,y)のn組のデータをとすると、2つの変数の間の関係を調べるものに共分散
と相関係数
があり、それぞれ、次のように定義される。
ここで、
は、それぞれ、xとyの標準偏差である。
問1 (1)式を証明せよ。
【解】
(証明終わり)
仮に
という関係があるとすると、
だから、
となる。
つまり、
が
に比例するとき、比例係数の正負に対応して相関係数は1、−1になる。
問2 下の表は10人の生徒が数学と理科の小テスト(10点満点)を受けたときの得点である。相関係数を求めよ。
【解】
数学の得点をx、理科の得点をyとする。
上の表から、数学の平均点
分散は
共分散は
したがって、相関係数rは
(解答終了)
また、相関係数は次の式で計算することができる。
【別解】
上の表より、
したがって、相関係数rは(3)より
(解答終了)
§3 回帰直線
変量xの値が
、変量yの値が
であるとする。このとき、平面上の点
に対してy軸方向の距離が最小となる直線(回帰直線)の方程式
を考える。
もし回帰直線の方程式が求められているとすれば
の予測値を
とすれば
となる。
しかし、
に対する実際の測定値は
であり、2つの値の差
を予測誤差といい、
である。
ここで
を最小にするようにa、bの値を定め、最適合直線を求めることにする。
とおくと、極値をとる点では
である。
したがって、
となり、
これをa、bについて解くと
よって、回帰直線は
問2の場合、
だから
0 件のコメント:
コメントを投稿