第17回 相関
§1 相関と相関図
2種類のデータの相関を調べるために、横軸と縦軸を使ってデータをプロットしたものを散布図という。
2つの異なるデータの系列
があり、それを座標であらわす。
が増加するとも増加する傾向があるとき、とは正の相関があるといい、逆に、が増加するとも現象する傾向があるとき、とは負の相関があるという。
§2 共分散と相関係数
(x,y)のn組のデータをとすると、2つの変数の間の関係を調べるものに共分散と相関係数があり、それぞれ、次のように定義される。
ここで、は、それぞれ、xとyの標準偏差である。
問1 (1)式を証明せよ。
【解】
(証明終わり)
仮に
という関係があるとすると、
だから、
となる。
つまり、がに比例するとき、比例係数の正負に対応して相関係数は1、−1になる。
問2 下の表は10人の生徒が数学と理科の小テスト(10点満点)を受けたときの得点である。相関係数を求めよ。
【解】
数学の得点をx、理科の得点をyとする。
上の表から、数学の平均点、理科の平均点は
分散は
共分散は
したがって、相関係数rは
(解答終了)
また、相関係数は次の式で計算することができる。
【別解】
上の表より、
したがって、相関係数rは(3)より
(解答終了)
§3 回帰直線
変量xの値が、変量yの値がであるとする。このとき、平面上の点
に対してy軸方向の距離が最小となる直線(回帰直線)の方程式
を考える。
もし回帰直線の方程式が求められているとすればの予測値をとすれば
となる。
しかし、に対する実際の測定値はであり、2つの値の差を予測誤差といい、
である。
ここで
を最小にするようにa、bの値を定め、最適合直線を求めることにする。
とおくと、極値をとる点では
である。
したがって、
となり、
これをa、bについて解くと
よって、回帰直線は
問2の場合、だから
0 件のコメント:
コメントを投稿