2016年12月24日土曜日

第1回 資料の整理

第1回 資料の整理


§1 資料の整理

度数分布表
下の表のように、資料をいくつかの階級(区間)に分け、階級ごとの度数を表にしたもの。
ここでの階級010は0以上10未満であり、階級の幅は10である。


ヒストグラム
横軸に資料の数値、縦軸に度数をとり、階級の幅を1辺、その階級の度数を高さとする長方形を書き、度数の分布を表したグラフ。
長方形の面積は、度数に比例する。


度数分布多角形
ヒストグラムの各長方形の城辺の頂点を順に結び、両端では階級の幅の半分だけ外側に点をとって結んだもの。
各長方形の面積の和と度数多角形の面積の和は等しい。

相対度数

累積度数
各階級までの度数の和を、その階級の累積度数という。


§2 代表値

階級値
階級の中央の値

の度数分布表の階級10 – 20の場合、
(1) 10≦x≦19と考えると
(2)10≦x<20と考えると
の2通りが考えられる。
(2)を採用することにする。

平均値
資料の値の総和を資料の総数で割った値
N個の値があるとき、平均値m
 
である。

度数分布表から平均値を求めるには、階級値と度数を用いて
と計算する。

モード(最頻値)
度数分布表で最も階級値が大きい階級値
上の例だと、度数が最も大きい階級は40〜50だから、その階級値である45がモードになる。

メディアン(中央値)
資料を大きさの順にならべたとき、中央にくる数値。
資料の個数が偶数個のとき、中央の2つの値の平均値とする。
例えば、資料が
が5個の場合、3番目の21がメディアン(中央値)になる。
また、
と資料の数が6個で偶数の場合、3番目の21と4番目の22の平均値
がメディアンになる。

例えば、上の表の場合、資料の個数は100だから、中央の2つの値は、資料の値の順にならべた、50番と51番目の値。


累積度数を見ると、これは階級40〜50に属するので、メディアンはその階級値である45になる。
 ――この値は中学数学レベルの話!!――

私が高校時代に使っていた(受験参考書)にしたがうと、以下のように求める。

総数100100÷2=50
累積度数を見ると、これは4050の階級に属する。
この区間幅は10で、この階級に属する資料の数は22個だから、階級4050では40から一様にずつ得点が上昇していると考え、
をメディアンと定める。

資料の数が100で偶数だから50番目と51番目の真ん中を50.5番目と考え、
とするほうがいいのでしょう。

ちなみに、この度数分布表を作成するにあたって用いたデータ
――平均値50、標準偏差20の正規分布もどき――
の50番目と51番目の値は45。
中学数学レベルのメディアンの値が元のデータと一致している!!

また、度数分布表から計算した平均値は47.2であるが、元の資料の平均値は46.68で一致しない。
(2)ではなく(1)の階級値を採用すると、平均値は46.7となり、この資料の場合、(1)の階級値を採用したほうが精度は高いようだ。



問題 右の表から平均値、モード、メディアンを求めよ。
【解】
右の表を元に、次の表を作る。
すると、平均値は58点。
モード(最頻値)は55点。
資料の個数は40なので、中央の値は20番目と21番目の値の平均値。
これは階級値55に属するので、(中学数学の)メディアン(中央値)は55点。
高校数学レベルのメディアンは
または、

(解答終了)

0 件のコメント:

コメントを投稿