2009. 1.15

講義プリントサイト:http://lbm.ab.a.u-tokyo.ac.jp/~omori/kokusai/koki.htm
冬休みの課題:提出者は後期得点が 10 点アップする.
注)3番目の課題ですが, 頭の0を抜かした番号を入力してやって下さい.
それ以外の番号を入力した人(3人)はお手数ですがもう一度やって下さい.


後期の復習

二項分布
成功確率 p の事象を n 回試行したときの成功回数 r の分布.
r 〜 B(n, p) と書く.
平均:np,分散:np(1 - p)
試行回数 n を増やしていくと,平均 np,分散 np(1 - p) の正規分布に近づく.
比率の信頼区間
n 回行って X 回成功したとすると,成功確率 p は, p^ = X/n,と推定.
p^ の平均:E[p^ ] = p, 分散:Var[p^ ] = p(1 - p)/n
binotest
標準正規分布の 97.5%点: z0 = 1.96 を用い,p の 95%信頼区間は,
binotest
これを解いて,簡略化すると,
binotest
比率の検定
帰無仮説,H0: 成功確率(比率) p = p0
n 回行って X 回成功
binotest
近似的な有意水準 5%両側検定:|z| > z0 = 1.96 のとき帰無仮説を棄却
χ2 分布(カイ2乗分布)
標準正規分布の2乗の分布: zi 〜 N(0, 1) → zi2 〜 χ2 (1) ,自由度 1 の χ2 分布
標準正規分布 n 個の2乗和の分布: Xnz12+ … + zn2 〜 χ2 (n),自由度 n の χ2 分布
ピアソンの χ2
fit
適合度検定
想定離散分布 pi,観測度数 ni
帰無仮説 H0:データは想定確率分布に従う.
tekigo
2×2 分割表
比率の同等性の検定: 帰無仮説,H0: px = py, 対立仮説,H1: px ≠ py
独立性の検定: 帰無仮説,H0: pij = pi.p.j, 対立仮説,H1: pij ≠ pi.p.j
ピアソンの χ2 値を,自由度 1 の χ2 分布で検定.つまり,
contengency
オッズ比:関連性の強さを表す指標.帰無仮説,H0:オッズ比 = 1
R×C 分割表
帰無仮説,H0: pij = pi.p.j, 対立仮説,H1: pij ≠ pi.p.j
ピアソンの χ2 値を,自由度 (R - 1)(C - 1) の χ2 分布で 検定.つまり,
contengency
t 分布
標準正規分布に従う確率変数を z,(z 〜 N(0,1)), 自由度 n の χ2 分布に従う 確率変数を V,(V 〜 χ2(n)),

n 個のデータが xi 〜 N( μ,σ2 ) のとき, 標本平均: x-,標本分散: s2

分散未知のときの母平均 μ の 95% 信頼区間
自由度 n − 1 の t 分布の 97.5%分位点 t0 と すると,
Pr[ x- − t0 s / √n < μ < x- + t0 s / √n ] = 0.95
母平均に対する t 検定
帰無仮説 H0:μ = μ0, 対立仮説 H1:μ ≠ μ0
検定統計量 t 値:t = √n ( x- − μ0 )/s
自由度 n−1 の t 分布表で検定
2 つの母集団平均に対する t 検定
帰無仮説,H0: μA = μB,対立仮説,H1: μA ≠ μB
母集団 A :nA 個の標本,標本平均 x-A, 標本分散 sA2
母集団 B :nB 個の標本,標本平均 x-B, 標本分散 sB2
母集団 A,B 共通の標本分散: bunsan
検定統計量 t 値:: difft
自由度 nA+nB−2 の t 分布表で検定
2 つの母集団平均に対する t 検定(サンプルサイズが等しいとき)
nA = nB = n
母集団 A,B 共通の標本分散: bunsan
検定統計量 t 値: difft
自由度 自由度 n + n - 2 = 2n - 2 の t 分布表で検定
共分散
Cov(xy )= sxy = (1/n−1)Σix ix- ) (y iy-
相関係数
sokan
-1≦r≦1,r が 1 に近いと正の相関関係,-1 に近いと負の相関関係,0 に近いと線形的な関係なし.
直線回帰
変数 y :従属変数,目的変数,変数 x :独立変数,説明変数
yab xa:y 切片,b:回帰係数
最小2乗法による回帰係数の推定
データ点 (xiyi ), 回帰による推定点, (xiy^i ), i = 1,…,n,との距離の2乗
minsqure を最小化すると,その解は,
coef
この平方和 S の最小値が残差平方和 Se,回帰係数の推定値を a^,b^
残差分散
自由度 n - 2, se2 = Se/(n−2) = Σiyi −  yi^ )2 /(n−2)
回帰係数 b の分散
sb2se2ix ix- ) 2
回帰関係の検定
帰無仮説,変数 y は変数 x との回帰関係にない.H0b = 0
検定統計量 t 値:tb^/s b,自由度 n−2 の t 分布で検定
回帰関係の 95% 信頼区間
自由度 n−2 の t 分布の 97.5%点を t0b^ − t0 s bbb^ + t0 s b
平方和分解
Σiy iy- ) 2 = Σiy^iy- ) 2 + Σiy iy^i ) 2
ST = SR + Se, 総平方和 = 回帰平方和 + 残差平方和
決定係数(重相関係数の2乗)
R2 = SR / Se =(回帰平方和)/(総平方和), 総平方和のうち回帰平方和で説明される割合,大きい程よい.
分散分析
回帰分析の分散分析表
変動因平方和自由度平均平方F 値
回帰 SR 1 SR F = SR/se2
残差 Se n−2 se2 = Se/n−2  
全体 ST n−1    

F 値が大きい程,回帰関係が有意となる.F 値は回帰係数の t 値の2乗.

Copyright (C) 2009, Hiroshi Omori. 最終更新:2009年 1月14日