携帯解答サイト: http://lbm.ab.a.u-tokyo.ac.jp/~omori/k/
2011.05.16
携帯の電卓にはルート(平方根)が無いので、ルートの出し方を以下に示す。

数値テスト回答画面  「ルート」の中に5を入れて送信  √5 = 2.236 が返信される
 
 

平均と標準偏差によるデータ範囲の表現

英語得点データの平均と標準偏差

あるクラスの英語得点データ(再掲)
36, 70, 56, 68, 76, 60, 50, 63, 62, 42, 64, 60, 50, 68, 71, 67, 50, 65, 67, 57,
72, 64, 61, 66, 46, 80, 46, 51, 59, 32, 55, 65, 65, 52, 57, 64, 23, 57, 53, 54,
38, 71, 57, 69, 77, 61, 51, 64, 63, 43, 65, 61, 51, 69, 72, 68, 53, 66, 68, 58,
73, 65, 62, 67, 47, 81, 47, 52, 59, 33, 56, 66, 67, 52, 58, 65, 24, 58, 54, 55
 
(標本)平均: \bar{x} = \frac{1}{80}(36+70+56+ \cdots + 55) = 58.625
(標本)分散: s^2 = \frac{1}{79} \{ (36-58.625)^2 +(70-58.625)^2 + (56-58.625)^2 + \cdots + (55-58.625)^2 \} = 134.39
(標本)標準偏差: SD = s = \sqrt{134.39} = 11.593
 
データの多くが存在する範囲(ボリュームゾーン):  \bar{x} \pm {\rm SD} =58.625 \pm 11.593 = 47.032 \sim 70.218
データのほとんどが存在する範囲: \bar{x} \pm 2\cdot {\rm SD} =  58.625 \pm 2\cdot 11.593 = 58.625 \pm 23.186 = 35.439 \sim 81.811

データ範囲の他の表現方法

最大値,最小値

データの範囲(最大値-最小値)がわかる.

分位点(パーセンタイル)

四分位範囲

75%点-25%点(データの中位50%が入る範囲)

箱ひげ図(ボックスプロット)

最大・最小値(外れ値は除く),メディアン,四分位範囲を表示したグラフ
外れ値・異常値(アウトライヤー outlier):集団の中で異質な値をもつと考えられるもの
例題 英語得点データにおいて,メディアン(中央値),四分位範囲,外れ値と思われる値を除いた上での最大値,最小値を求め,箱ひげ図(ボックスプロット)を書け.
 
解答例:英語データを得点順に並べる.
23 24 32 33 36 38 42 43 46 46 47 47 50 50 50 51 51 51 52 52 
52 53 53 54 54 55 55 56 56 57 57 57 57 58 58 58 59 59 60 60 
61 61 61 62 62 63 63 64 64 64 64 65 65 65 65 65 65 66 66 66 
67 67 67 67 68 68 68 68 69 69 70 71 71 72 72 73 76 77 80 81
  • データ数は,n = 80.
  • 中央値(50%点)は,40 番目の 60 点と 41 番目の 61 点の平均の 60.5点
  • 25%点は,20 番目の 52 点と 21 番目の 52 点の平均の 52 点.
  • 75%点は,60 番目の 66 点と 61 番目の 67 点の平均の 66.5点.
  • 四分位範囲は,25%点の 52 点から 75%点の 66.5 点までの,52 ~ 66.5 点
    四分位範囲にデータの真ん中あたりの半数が含まれる.
  • 最大値は,81 点
  • 最小値は,23点であるが,ヒストグラムでみてわかるように, 23 点と 24 点は他の集団と離れているので外れ値とみなすと, 集団での最小値は 32 点
  • これらの統計量を図示したのが右の箱ひげ図である.

問題


Copyright (C) 2010, Hiroshi Omori. 最終更新:2011年 5月16日