2008.5.29
携帯解答サイト: http://lbm.ab.a.u-tokyo.ac.jp/~omori/k/

正規分布 N(50,100) の確率計算

第5問:50 点以下
内訳  解答者数  間違い   正解    のべ解答数  
人数  23 17  22 39
    
第6問:35 点以上
内訳  解答者数  間違い   正解    のべ解答数  
人数  21 45  18 69
<
第7問:上位 5 %
内訳  解答者数  間違い   正解    のべ解答数  
人数  17 31  16 47
    
第8問:70 点の順位
内訳  解答者数  間違い   正解    のべ解答数  
人数  6 21  4 25

平均 50,標準偏差 10 の正規分布への変換の理解はまだ不足しているようだ.

先週の投稿でも
「今日の授業まったく理解できなかった」
との意見があった.

正規分布の確率計算は,もう少し詳しく解説する必要がありそうだ.

第8問(再掲):1万人が受けたテストの平均は50点,標準偏差は10点であった.70点の学生の順位.
第9問(再掲):1000人の学生による英語試験の成績は,平均60点,標準偏差は12点であった. 上位30番以内に入るには何点が必要か.

標準正規分布累積確率表
z の値 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
累積確率   0.500   0.540   0.579   0.618   0.655   0.691   0.726   0.758   0.788   0.816   0.841
1.1 1.2 1.3 1.4 1.5 1.6 1.64 1.7 1.8 1.9 1.96 2.0 2.58 3.0
  0.864   0.885   0.903   0.919   0.933   0.945   0.95   0.955   0.964   0.971   0.975   0.977   0.995   0.999

5-4. 独立な正規分布の合成分布(続き2)

正規分布からの標本(サンプル)からの平均値の分布
平均 μ = 50,分散 σ2 = 100(標準偏差 σ = 10)の正規分布から大きさ n = 20 の 標本を抽出.

  データ例 標本平均 x-
サンプル1:   46.44173, 55.98069, 60.65703, 57.35829, 29.06341, 55.92665, …   50.46604
サンプル2:   56.49328, 26.15988, 36.63778, 30.11928, 32.55220, 49.38015, …   47.40793
サンプル3:   42.89847, 45.66345, 54.59994, 34.18581, 43.40348, 51.62797 …   51.13295
…………………

 上の表のようにサンプルを多数回抽出したとすると,サンプルごとに標本平均 x- が 得られるので,標本平均の分布を考えることができる.
 標本平均の分布の平均は,μ = 50,分散は,σ2/n = 100/20 = 5(標準偏差 = √5 = 2.236)の 正規分布になる.つまり,

x- 〜 N(50, 5),
である.

例題
N(50, 100) から大きさ 20 の標本を抽出した.52.24 以上の標本平均が得られる確率は.
解答例
標本平均は,x- 〜 N(50, 5) と分布する.標準化の式より,
(値 - 平均)/標準偏差 = (52.24 - 50)/2.24 = 1
これより標準正規分布で z > 1,となる確率を求める.すなわち,
Pr[z > 1] = 1 - Pr[z < 1] = 1 - 0.841 = 0.159

5-5. 正規分布に基づく母数の区間推定

分散既知の場合の母平均 μ の区間推定

 正規分布する母集団で分散がわかっている場合は,未知の平均に関する区間推定ができる.
いま,正規分布 N( μ,σ2 ) において,大きさ n の標本を 抽出したとき,標本平均 x- は,

x- 〜 N( μ,σ2/n ) → z = √n(x- − μ )/σ 〜 N(0, 1)

と分布する.標準正規分布の 97.5%分位点は 1.96 であるので, 標準正規分布する確率変数 z が -1.96 から 1.96 に入る確率は 0.95 となる.つまり,

Pr[ − 1.96 < z < 1.96 ] = 0.95,
Pr[ − 1.96 < √n(x- − μ )/σ < 1.96 ] = 0.95,
Pr[ - 1.96×σ/ √n < x- − μ < 1.96×σ/ √n ] = 0.95,
Pr[ - 1.96×σ/ √n < μ − x-< 1.96×σ/ √n ] = 0.95,
Pr[ x- − 1.96×σ/ √n < μ < x- + 1.96×σ/ √n ] = 0.95,

となる.最後の式を母集団平均 μ の 95% 信頼区間と言う.
このように,母数の信頼区間を標本から推定することを区間推定という.

例題
過去の経験から分散が 9 であることがわかっている正規母集団から大きさ 16 の標本を抽出 したところ,標本平均が 1.5 であった.標準正規分布の 97.5% 分位点を 1.96 として,母平均 μ の 95% 信頼区間を求めよ.
解答例
σ=√9=3,√n=√16=4,より,1.96×σ/ √n=1.96×3/4=1.47
よって,1.5 ± 1.47,つまり, 0.03 < μ < 2.97 が母平均 μ の 95% 信頼区間 となる.

95% の意味

 同じ正規母集団から標本抽出を繰り返すと,毎回標本平均として異なる値がえられ,それに 対応して信頼区間も異なる.この信頼区間の 95% が真の平均 μ を含む,という意味である.
つまり,100回の標本抽出により,100 個の信頼区間を作ったら平均的にみて,95 個の信頼区間が 真の平均 μ を含むことが期待できる.
下の図は,平均 0 分散 2 の正規分布 N( 0, 2 ) から大きさ 10 の標本を取りだし,分散が既知であるとして, 母平均に対する信頼区間を 100 個生成したものである."×" が標本平均を示す.左の "*" は,信頼区間 が母平均の真値 0 を含まなかった場合である.

Copyright (C) 2008, Hiroshi Omori. 最終更新:2008年 5月28日