2011.10.31

10.t 検定

10-1. t 分布

定義

 標準正規分布に従う確率変数を z,(z 〜 N(0,1)),
自由度 n の χ2 分布に従う 確率変数を V,(V 〜 χ2(n)), とする.
両者が独立であるとすると,その比 t は,自由度 n の t 分布,t(n),に従う.

分散未知のときの標本平均の分布

 正規母集団 N( μ,σ2 ) から大きさ n の 標本を取り出したとき,標本平均 x- を標準化したもの z は,
と標準正規分布に従う.
 母標準偏差 σ が未知であるときこれを標本標準偏差 s で置き換えた ものを t 値といい,自由度 n − 1 の t 分布に従う.
これは,標本分散の分布から
であるので,比を取ると,
となるからである.

t 検定に用いる t 分布表

標本分散の分布

 正規母集団で,母数が未知であるときを考える. 大きさ n の標本 x1x2,…,xn を抽出したとき,母平均 μ と母分散 σ2 は,そえぞれ 標本平均 x- と標本分散 s2
sampmv
で推定される.  標本や標本平均は,
sampmv
と分布する.一方,
sampmv
と計算されるので,(n - 1)s22 という量は,
sampmv
と,自由度 n - 1 の χ2 分布,χ2(n - 1),に従うことがわかる.

 自由度 n - 1 の χ2 分布の平均は n - 1 なので, (n - 1)s22 の平均(期待値)は,

E[ (n - 1)s22 ] = (n - 1)/σ2・E[ s2 ] = n - 1

となる.これより,標本分散 s2 の期待値は,E[ s2 ] = σ2 となる. このように,母(集団)分散の推定量の期待値(平均)が母集団分散 に等しくなる.このような性質を不偏という.母分散 σ2 として,偏差平方和 (xi - x-)2 を n で割らずに n - 1 で割るのは,推定値 が不偏になるためである.このことを強調して,s2 を不偏分散と呼ぶこともある.

10-2.分散未知のときの母平均 μ の区間推定

正規母集団 N( μ,σ2 ) から大きさ n の 標本を取り出したとき,標本平均が x- で標本分散が s2 であるとすると,t 値は
のように自由度 n - 1 の t 分布に従う.
 自由度 n - 1 の t 分布の 97.5%分位点を t(n - 1)0.975 とすると, t 分布する確率変数 t が -t(n - 1)0.975 から t(n - 1)0.975 に入る 確率は 0.95 となる.つまり,
tCI
となる.最後の式を母分散未知のときの母集団平均 μ の 95% 信頼区間と言う.

例題
正規母集団から大きさ 16 の標本を抽出したところ,標本平均が 1.5 で,標本分散が 9 であった.母集団平均 μ の 95% 信頼区間を求めよ.
解答
t0 s / √n = 2.13×√9/√16 = 2.13×3/4 = 1.60,
よって,1.5 ± 1.60,つまり, -0.1 < μ < 3.10 が母平均 μ の 95% 信頼区間 となる.

注)母集団分散が σ2 = 9 とわかっていたとき (6.27号)と少し違うことに注意せよ.
このときの母集団平均 μ の 95% 信頼区間は,

Pr[ x- − 1.96×σ/ √n < μ < x- + 1.96×σ/ √n ] = 0.95,

である.このときの例題は,
例題
過去の経験から分散が 9 であることがわかっている正規母集団から大きさ 16 の標本を抽出 したところ,標本平均が 1.5 であった.標準正規分布の 97.5% 分位点を 1.96 として,母平均 μ の 95% 信頼区間を求めよ.
解答例
σ=√9=3,√n=√16=4,より,1.96×σ/ √n=1.96×3/4=1.47
よって,1.5 ± 1.47,つまり, 0.03 < μ < 2.97 が母平均 μ の 95% 信頼区間 となる.

すなわち,分散が未知のとき(これが普通)は,分散の推定値である標本分散を用いるので, 推定誤差が伴う.この誤差を考慮した t 分布で信頼区間を構成するので,信頼区間が広くなり, 母平均の推定精度が悪くなる.

10-3. 母平均に対する t 検定

平均 μ,分散 σ2 がともに未知である正規母集団から 大きさ n の標本を抽出したところ, 標本平均が x-,標本分散が s2 であった.
帰無仮説 H0:μ = μ0
対立仮説 H1:μ ≠ μ0
の検定は,帰無仮説のもとで,分散既知のときに標本平均を標準化して えられる z 値, z = √n ( x- − μ0 )/σ の標準偏差のところに 標本標準偏差 s を代入した t 値は,
ttest
のように自由度 n−1 の t 分布に従うことを利用して検定できる.すなわち, この分布の97.5%分位点を t(n - 1)0.975 とすると, 有意水準 5 %の検定は,
|t| > t(n - 1)0.975
のとき帰無仮説を棄却する.|t| が検定統計量で,この値を |t| 値という.
例題
通常の飼育方式では,鶏の1ヶ月の成長量が平均 100gであることが知られて いるとする.新方式 A による飼育方法を 25 羽で試したところ,平均成長量が 105g であり, 標本標準偏差が 10g であった.新方式 A は通常の飼育方式と成長量が有意に異なるか 検定せよ.ただし,自由度 24 の t 分布の 97.5%パーセント点は 2.06 であり, 99.5%点は 2.80 である.
解答例
新方式による成長量の母集団平均を μ とおき,通常の飼育方式の成長量の 母集団平均を μ0 = 100 とおく.
この問題での帰無仮説(H0)と対立仮説(H1)は,
H0:μ = μ0
H1:μ ≠ μ0
と定式化される.検定に用いる検定統計量は,標本平均を標準化した t 値の絶対値 である.
標本の大きさ n = 25 の標本の標本 平均 x- = 105より,
|t | = √n | x- − μ0 |/s =5|105−100|/10=2.5
である.新方式の標本平均の標準化値の絶対値 |t | = 2.5 は,両側 5 %点(片側 2.5 %点) の 2.06 よりは 大きく,両側 1 %点(片側 0.5 %点)の 2.80 よりは小さい.
よって,新方式は通常方式と成長量は 5 %水準で有意に異なると言えるが,1 %水準 では有意でない.つまり,5 %有意である.

Copyright (C) 2008, Hiroshi Omori. 最終更新:2011年10月31日