2017年1月15日日曜日

第17回 相関

第17回 相関


§1 相関と相関図

2種類のデータの相関を調べるために、横軸と縦軸を使ってデータをプロットしたものを散布図という。
2つの異なるデータの系列
があり、それを座標であらわす。
が増加するとも増加する傾向があるとき、正の相関があるといい、逆に、が増加するとも現象する傾向があるとき、負の相関があるという。


§2 共分散と相関係数

(x,y)n組のデータをとすると、2つの変数の間の関係を調べるものに共分散相関係数があり、それぞれ、次のように定義される。
ここで、は、それぞれ、xyの標準偏差である。

問1 (1)式を証明せよ。
【解】
(証明終わり)

仮に
という関係があるとすると、
だから、
となる。
つまり、に比例するとき、比例係数の正負に対応して相関係数は1、−1になる。

問2 下の表は10人の生徒が数学と理科の小テスト(10点満点)を受けたときの得点である。相関係数を求めよ。





【解】
数学の得点をx、理科の得点をyとする。









上の表から、数学の平均点、理科の平均点
分散は
共分散は
したがって、相関係数r
(解答終了)

また、相関係数は次の式で計算することができる。
 

【別解】











上の表より、
したがって、相関係数rは(3)より
(解答終了)


§3 回帰直線

変量xの値が、変量yの値がであるとする。このとき、平面上の点
に対してy軸方向の距離が最小となる直線(回帰直線)の方程式
を考える。
もし回帰直線の方程式が求められているとすればの予測値をとすれば
となる。
しかし、に対する実際の測定値はであり、2つの値の差を予測誤差といい、
である。
ここで
を最小にするようにabの値を定め、最適合直線を求めることにする。
とおくと、極値をとる点では
である。
したがって、
となり、
これをabについて解くと
よって、回帰直線は

問2の場合、だから





0 件のコメント:

コメントを投稿