第1回 資料の整理
§1 資料の整理
度数分布表
下の表のように、資料をいくつかの階級(区間)に分け、階級ごとの度数を表にしたもの。
ここでの階級0〜10は0以上10未満であり、階級の幅は10である。
ヒストグラム
横軸に資料の数値、縦軸に度数をとり、階級の幅を1辺、その階級の度数を高さとする長方形を書き、度数の分布を表したグラフ。
長方形の面積は、度数に比例する。
度数分布多角形
ヒストグラムの各長方形の城辺の頂点を順に結び、両端では階級の幅の半分だけ外側に点をとって結んだもの。
各長方形の面積の和と度数多角形の面積の和は等しい。
相対度数
累積度数
各階級までの度数の和を、その階級の累積度数という。
§2 代表値
階級値
階級の中央の値
右の度数分布表の階級10
– 20の場合、
(1) 10≦x≦19と考えると
(2)10≦x<20と考えると
の2通りが考えられる。
(2)を採用することにする。
平均値
資料の値の総和を資料の総数で割った値
N個の値があるとき、平均値mは
である。
度数分布表から平均値を求めるには、階級値と度数を用いて
と計算する。
モード(最頻値)
度数分布表で最も階級値が大きい階級値
上の例だと、度数が最も大きい階級は40〜50だから、その階級値である45がモードになる。
メディアン(中央値)
資料を大きさの順にならべたとき、中央にくる数値。
資料の個数が偶数個のとき、中央の2つの値の平均値とする。
例えば、資料が
が5個の場合、3番目の21がメディアン(中央値)になる。
また、
がメディアンになる。
例えば、上の表の場合、資料の個数は100だから、中央の2つの値は、資料の値の順にならべた、50番と51番目の値。
累積度数を見ると、これは階級40〜50に属するので、メディアンはその階級値である45になる。
――この値は中学数学レベルの話!!――
私が高校時代に使っていた(受験参考書)にしたがうと、以下のように求める。
総数100、100÷2=50。
累積度数を見ると、これは40〜50の階級に属する。
この区間幅は10で、この階級に属する資料の数は22個だから、階級40〜50では40から一様にずつ得点が上昇していると考え、
をメディアンと定める。
資料の数が100で偶数だから50番目と51番目の真ん中を50.5番目と考え、
とするほうがいいのでしょう。
ちなみに、この度数分布表を作成するにあたって用いたデータ
――平均値50、標準偏差20の正規分布もどき――
の50番目と51番目の値は45。
中学数学レベルのメディアンの値が元のデータと一致している!!
また、度数分布表から計算した平均値は47.2であるが、元の資料の平均値は46.68で一致しない。
(2)ではなく(1)の階級値を採用すると、平均値は46.7となり、この資料の場合、(1)の階級値を採用したほうが精度は高いようだ。
問題 右の表から平均値、モード、メディアンを求めよ。
【解】
右の表を元に、次の表を作る。
すると、平均値は58点。
モード(最頻値)は55点。
資料の個数は40なので、中央の値は20番目と21番目の値の平均値。
これは階級値55に属するので、(中学数学の)メディアン(中央値)は55点。
高校数学レベルのメディアンは
または、
(解答終了)
0 件のコメント:
コメントを投稿