2008.4.24

携帯解答サイト: http://lbm.ab.a.u-tokyo.ac.jp/~omori/k/

問8の先週の回答結果
選択肢   1    2     3    4    計  
回答者数  2 10  5 2 19
 
回答総数が少なかった.回答分布もあまり変わらなかった.
 
問9.問8の回答の理由を掲示板に投稿せよ.
先週の投稿例
 
問10.どのような試験を行えば大学生の漢字能力がより明瞭にわかるか.掲示板に投稿せよ.
先週の投稿例
 
ヒストグラムに対する先週の回答結果
選択肢   1    2     3    4    計  
回答者数  0 9  12 0 21
 
今週は回答総数が少なかった.2か3のどちらが良いかで意見が割れた.ヒストグラムは分布の山の数,対称性, 異常値の有無などを視覚的に表現するもので,英語得点分布表示は3がやや良いような気がする.
 
回答の理由を投稿せよ.
先週の投稿例

4. 量的データの代表値

4-1.データと統計量

データ数(サンプルサイズ):n
データ値:x1x2,…,xn
英語得点データでは,n = 80
統計量:データから計算される値

4-2.データの中心的な位置を表す統計量

(標本)平均:x-

例題1
A さんの 5 教科のテスト得点は,国語 65 点,数学 30 点,英語 50 点, 社会 55 点,理科 35 点であった.平均得点を求めよ.
 
解答例:x- = (65+30+50+55+35)/5 = 235/5 = 47,−>答:47点

中央値(メディアン)

 データの真ん中の値 −> 奇数:ちょうど真ん中,偶数:真ん中に最も近い2値の平均.
例題2
A さんのテスト得点の中央値を求めよ.
 
解答例:得点を小さい順に並べると,30,35,50,55,65,である.真ん中は50.−>答:50点
注)国,数,英,社の4教科のメディアンは,小さい順に並べて,30,50,55,65,となる. 真ん中の値がないので,その両側の値50と55の平均値52.5とする.

最頻値(モード)

 ヒストグラムの山(最も頻度の高い階級)
 英語得点の5点階級幅ヒストグラムでは61−65点がモードである.

4-3.データのちらばりの程度を表す統計量

(標本)分散: s2

n - 1:標本分散の自由度.データ数は n で,データ全体では n の自由度(値が自由に変われるデータの個数) を持つが,標本分散を計算するときに標本平均 x- が固定されるので,自由度が1つ減って n - 1 となった.

標準偏差(SD,Standard Deviation): s

 標本分散の平方根.平均と同じ単位で,データのちらばりの程度を表す.
例題3
以下の木材の長さデータ(cm)の標本分散と標準偏差を求めよ.
2,3,5,8
 
解答例:データの平均値は,x-=(2+3+5+8)/4 = 18/4 = 4.5cm

データ  2    3    5    8  
偏差-2.5 -1.50.53.5
偏差平方6.252.25 0.2512.25

偏差平方和:S=i(xix-)2 =6.25+2.25+0.25+12.25=21
標本分散:s2=21/(4-1)= 7cm2,標準偏差(SD):s=√7= 2.65cm

最大値,最小値

 データの範囲(最大値−最小値)がわかる.

分位点(パーセンタイル)

四分位範囲

75%点−25%点(データの中位50%が入る範囲)

箱ひげ図(ボックスプロット)

 最大,最小値,メディアン,四分位範囲を表示したグラフ

boxplot histgram


Copyright (C) 2008, Hiroshi Omori. 最終更新:2008年 5月 1日