心理データ解析

幹葉表示の R の出力
> stem(eigo,scale=2) The decimal point is 1 digit(s) to the right of the \| 2 \| 34 2 \| 3 \| 23 3 \| 68 4 \| 23 4 \| 6677 5 \| 0001112223344 5 \| 5566777788899 6 \| 0011122334444 6 \| 5555556667777888899 7 \| 011223 7 \| 67 8 \| 01

データ操作

中心化
データから平均値を引いたもの．平均からの偏差ともいう． d_i = x_i - x^-
標準化

偏差を標本標準偏差（SD）で割ったもの．

標準化データ（z_i）の平均は 0，標準偏差は 1，（分散も1）

データを標準化すると比較がしやすくなる．（偏差値：平均50，標準偏差10に標準化）

課題

国語データ得点を用いて，英語データと同様の解析をせよ．
A君の得点は英語，国語とも65点であった．英語と国語，どちらの方が成績が良かったと言えるか．

確率分布

離散確率分布

　ある量の集まり P = { p₁，…，p_n } の中で，

という性質をもつもの．
　また，離散的な変数 X = { x₁，…，x_n } のおのおのの値に対し，それが生起する確率 p_i が与えられているとき，X を離散確率変数という．これは，

表 1 ：離散確率変数（n = 5）
　変数 X 　x₁　　x₂　　x₃　　x₄　　x₅　

　確率 P 　p₁ 　p₂ 　p₃ 　p₄ 　p₅

表 1 ：離散確率変数（n = 5）
変数 X	x₁	x₂	x₃	x₄	x₅
確率 P	p₁	p₂	p₃	p₄	p₅

と表せる．

連続型確率分布

　関数 f(x) が，

という性質を持つとき，これを連続型確率分布という．

累積分布関数

Pr[A] を事象 A が生起する確率とする．連続型確率変数 X に対し，X が x 以下である確率，

で定義される関数 F(x) を累積分布関数という．この関数を用いると，確率変数 X が区間 (a, b) に落ちる確率は，

で表せる．なお，離散型確率変数でも積分を和に変えることにより，同様に階段型の累積分布関数が定義できる．

分布の代表値

平均

　平均（mean）μ は，分布の中心的な位置座標を表す．確率変数 X に対しては， X の期待値 E[X ] とも表記し，

と定義される．離散確率変数では，積分を総和に変えることにより括弧内のように定義できる．

分散

　分散（variance） σ² は，分布の拡がりの程度を表す．確率変数 X に対しては，Var[X ] と表記する．確率変数 X の関数 (X - μ)² の期待値でもあり，

と定義される．
　また，σ を標準偏差（SD, standard deviation）といい，平均と同じ次元で分布の拡がりの大きさを表す量である．

１次元の分布

離散分布の例

離散一様分布

サイコロの目の分布

離散一様分布
　変数 X 　1　　2　　3　　4　　5　　6　

　確率 P 　1/6 　1/6 　1/6 　1/6 　1/6 　1/6

離散一様分布
変数 X	1	2	3	4	5	6
確率 P	1/6	1/6	1/6	1/6	1/6	1/6

**# 離散一様分布の平均と分散の計算**
x <- 1:6		# 1 から 6 まで並べたベクトル
p <- rep(1/6, 6)		# 1/6 を６個並べたベクトル
m <- sum(x*p)		#平均
s2 <- sum(p*(x-m)^2)		#分散

二項分布

　成功確率 p の事象を n 回繰り返したときの成功回数 x の分布

平均：　E[X ] = np，分散： Var[X ] = npq
X ～ B(n，p) と書くこともある．

３割バッターが１試合（５打席）で打つヒット数の分布
３割バッターが５打席で打つヒット数は，成功確率 p = 0.3 のベルヌイ試行を n = 5 回行ったときに成功する回数の分布で，n = 5，p = 0.3 の二項分布 B(5, 0.3) に従う．

5打数ノーヒットの確率：
ヒットが出ない確率は，1－0.3＝0.7なので，求める確率は，p₀＝ 0.7⁵ ＝ 0.16807
5打数2安打の確率：
p₂ ＝ ₅C₂ p²(1－p)³ ＝ (5*4)/(2*1)×0.3²×0.7³＝ 0.3087

そのグラフは，以下のようになる．

**# 二項分布のグラフの R スクリプト**
n <- 5	#試行回数
x <- 0:n	#回数
p <- 0.3	#成功確率
hit <- dbinom(x, size=n, prob=0.3)	#二項確率
plot(x, hit, type="h", ylim=c(0,0.4), xlim=c(0,n), cex.lab=0.8, xlab="ヒット数", ylab="確率密度")
title(main="ヒット数の分布（n=5，p=0.3）")	#タイトル
sum(x*hit)	#平均（np = 1.5）
sum(hit(x - np)^2)	#分散（np(1 - p) = 1.05）

Weldon のサイコロ実験
イギリスの統計学者 Weldon は，12個のサイコロを同時に投げ，5か6の目が出た個数をカウントする実験を26306回行った．その結果以下のデータを得た．

   5,6の個数       0    1    2    3    4    5    6

出た回数    185       1149       3265       5475       6114       5194       3067

   5,6の個数       7    8    9    10    11    12    合計

出た回数    1331       403       105       18       0       0    26306

5,6の個数	0	1	2	3	4	5	6
出た回数	185	1149	3265	5475	6114	5194	3067
5,6の個数	7	8	9	10	11	12	合計
出た回数	1331	403	105	18	0	0	26306

まず，データから統計量を求める．
平均：x^- ＝ (0*185＋1*1149＋2*3265＋…＋12*0)/26306＝4.052，
分散：s² ＝ {(0－4.052)2*185＋(1－4.052)2*1149＋ …＋(12－4.052)2*0}/26306＝2.696．
　1つのサイコロが5か6の目を出す確率を p とすると，12個のサイコロを同時に振って，5か6の目が出る個数は 2 項分布 B(12, p) に従うはずである．
2 項分布 B(12, p) の平均は 12p，分散は 12p(1－p) であるので，p のデータからの推定値p^{^}は，データの平均値を用いて，

12p^{^}＝4.052， p^{^}＝4.052/12＝0.338

と推定される．このときの分散は，

分散＝12p^{^}(1－p^{^})＝ 12*0.338*(1－0.338)＝2.685

この分散はデータが2項分布 B(12, 0.338) に従っていれば取る値である．これがデータの分散と大きく違わないので，データはほぼ2項分布に従っていると判断される．
　なお，サイコロが完全に正しければ，12個のサイコロを同時に振って，5か6の目が出る個数は 2 項分布 B(12, 1/3) に従うはずである．この仮定のもとでは，平均と分散はそれぞれ，

平均＝12*1/3＝4，分散＝12*1/3*(1－1/3)＝4*2/3＝2.667

となるはずである．データの統計量とは異なる度合いが大きいので，サイコロは完全に正しくなく，大きな目（5か6の目）の出る確率の方がほんの少し高いと言える．
　以上を表にまとめると，

   モデル       平均       分散

   データ       4.052       2.696

   2項分布（p＝0.338）       4.052       2.685

   2項分布（p＝0.333）       4       2.667

モデル	平均	分散
データ	4.052	2.696
2項分布（p＝0.338）	4.052	2.685
2項分布（p＝0.333）	4	2.667

となる．なお，サイコロが本当に正しくないのかどうかの検定は，後で詳しく行う．
各モデルのもとでの確率分布のグラフは，

であり，データと 2項分布（p＝0.338）の確率モデルがよく適合しているようにみえる．

# Weldon のサイコロ実験の R スクリプト
x <- 0:12 #個数　
dice <- c(185,1149,3265,5475,6114,5194,3067,1331,403,105,18,0,0) #回数データ　
sum(dice) #試行回数　
pdice <- dice/sum(dice) #回数の確率　
m <- sum(x*pdice) #平均　
p <- m/12 #5，6の出る確率　
s2 <- sum(pdice*(x-m)^2) #分散　
v <- 12*p*(1-p) #二項分布のもとでの分散　
h1 <- dbinom(x, 12, 1/3) #正しいサイコロのもとでの二項確率分布　
h2 <- dbinom(x, 12, p) #推定確率からの二項確率分布　
dicedis <- rbind(pdice,h2,h1) #行ベクトル－＞行列　
colnames(dicedis) <- as.character(0:12) #列の名前　
barplot(dicedis, beside=TRUE, cex.axis=0.8, cex.lab=1.0, xlab="5,6の個数", ylab="確率", legend=c("データ","p=0.338", "p=0.333"))
title(main="Weldon のサイコロ実験の分布") #グラフタイトル　

**# Weldon のサイコロ実験の R スクリプト**
x <- 0:12	#個数
dice <- c(185,1149,3265,5475,6114,5194,3067,1331,403,105,18,0,0)	#回数データ
sum(dice)	#試行回数
pdice <- dice/sum(dice)	#回数の確率
m <- sum(x*pdice)	#平均
p <- m/12	#5，6の出る確率
s2 <- sum(pdice*(x-m)^2)	#分散
v <- 12p(1-p)	#二項分布のもとでの分散
h1 <- dbinom(x, 12, 1/3)	#正しいサイコロのもとでの二項確率分布
h2 <- dbinom(x, 12, p)	#推定確率からの二項確率分布
dicedis <- rbind(pdice,h2,h1)	#行ベクトル－＞行列
colnames(dicedis) <- as.character(0:12)	#列の名前
barplot(dicedis, beside=TRUE, cex.axis=0.8, cex.lab=1.0, xlab="5,6の個数", ylab="確率", legend=c("データ","p=0.338", "p=0.333"))
title(main="Weldon のサイコロ実験の分布")	#グラフタイトル

12人の兄弟中の女児数のデータ
19世紀末のドイツの病院のデータによると，同じ両親で12人きょうだいがいる6155家族の女児数の数は以下のようであった．

   女児数       0    1    2    3    4    5    6

度数    7       45       181       478       829       1112       1343

   女児数       7    8    9    10    11    12    合計

度数    1033       670       286       104       24       3    6155

女児数	0	1	2	3	4	5	6
度数	7	45	181	478	829	1112	1343
女児数	7	8	9	10	11	12	合計
度数	1033	670	286	104	24	3	6155

課題：「Weldon のサイコロ実験」と同様な解析を「12人の兄弟中の女児数のデータ」に対して行え．

ポアソン（Poisson）分布

　正のパラメータ λ と，0 以上の整数 X に対し，確率密度が

である分布
平均：　E[X ] = λ，分散： Var[X ] = λ

二項分布の極限分布としてのポアソン分布
　いま，単位時間を n 等分して，この時間間隔である事象が１回生起する確率を p とする．ここで，

np = λ

とおいて λ の値を固定して n を大きくして時間間隔を小さくしていくと，生起確率 p も小さくなり，ポアソン分布に近づく．

# 二項分布がポアソン分布に近づく，の R スクリプト
x <- 0:8 #グラフのx軸の範囲　
lam <- 2 #λの定義　
yp <- dpois(x,lam) #ポアソン分布の確率密度　
y1 <- dbinom(x, 5, 0.4) #二項分布（n = 5，p = 0.4）の確率密度　
y2 <- dbinom(x, 10, 0.2) #二項分布（n = 10，p = 0.2）の確率密度　
y3 <- dbinom(x, 20, 1/10) #二項分布（n = 20，p = 0.1）の確率密度　
y4 <- dbinom(x, 40, 1/20) #二項分布（n = 40，p = 0.05）の確率密度　
plot(x, y1, type="b", ylab="確率") #二項分布（n = 5，p = 0.4）のプロット（黒）　
points(x, y2, type="b", col="green") #二項分布（n = 10，p = 0.2）のプロット（赤）
points(x, y3, type="b", col="blue") #二項分布（n = 20，p = 0.1）のプロット（青）
points(x, y4, type="b", col="purple") #二項分布（n = 40，p = 0.05）のプロット（紫）
points(x, yp, type="b", col="red") #ポアソン分布のプロット（赤）
title(main="二項分布（np = 2）がポアソン分布に近づく様子")
# 凡例の記述（locator(1)は，凡例の記述場所をクリックで指定）
legend(locator(1), c("p=0.4", "p=0.2", "p=0.1", "p=0.05", "ポアソン"),
lty=1, col=c("black", "green", "blue", "purple", "red"))

**# 二項分布がポアソン分布に近づく，の R スクリプト**
x <- 0:8	#グラフのx軸の範囲
lam <- 2	#λの定義
yp <- dpois(x,lam)	#ポアソン分布の確率密度
y1 <- dbinom(x, 5, 0.4)	#二項分布（n = 5，p = 0.4）の確率密度
y2 <- dbinom(x, 10, 0.2)	#二項分布（n = 10，p = 0.2）の確率密度
y3 <- dbinom(x, 20, 1/10)	#二項分布（n = 20，p = 0.1）の確率密度
y4 <- dbinom(x, 40, 1/20)	#二項分布（n = 40，p = 0.05）の確率密度
plot(x, y1, type="b", ylab="確率")	#二項分布（n = 5，p = 0.4）のプロット（黒）
points(x, y2, type="b", col="green")	#二項分布（n = 10，p = 0.2）のプロット（赤）
points(x, y3, type="b", col="blue")	#二項分布（n = 20，p = 0.1）のプロット（青）
points(x, y4, type="b", col="purple")	#二項分布（n = 40，p = 0.05）のプロット（紫）
points(x, yp, type="b", col="red")	#ポアソン分布のプロット（赤）
title(main="二項分布（np = 2）がポアソン分布に近づく様子")
# 凡例の記述（locator(1)は，凡例の記述場所をクリックで指定）
legend(locator(1), c("p=0.4", "p=0.2", "p=0.1", "p=0.05", "ポアソン"),
lty=1, col=c("black", "green", "blue", "purple", "red"))

死亡記事件数
　ポアソン分布は，稀な事象の生起モデル（自動車事故，機械の故障，DNAの塩基置換など）に用いられる．下の表は，ロンドンの新聞記事（1096日間）に載った１日あたりの85才以上の死亡記事の件数である．

死亡記事件数 0 1 2 3 4 5 6 以上　

日数 484 391 164 45 11 1 0

死亡記事件数	0	1	2	3	4	5	6 以上
日数	484	391	164	45	11	1	0

　死亡記事件数データの平均は0.8239，分散は0.8294，であった．このデータがポアソン分布に従っていると考える．ポアソン分布の平均は λ なので，λ = 0.8239 のポアソン分布にあてはめてみたところ，非常によく一致していた．
　また，ポアソン分布は，平均と分散が等しいという特徴がある．データの平均と分散の値が近いことから，データはポアソン分布によく適合していることを示している．

Poisson
データとモデルとの統計量の比較
   モデル    平均    分散
   死亡記事件数    0.8239    0.8294
   ポアソン分布    0.8239    0.8239

# 死亡記事件数の R スクリプト
x <- 0:6 #グラフのx軸の範囲　
y <- c(484, 391, 164, 45, 11, 1, 0) #死亡記事件数データ　
s <- sum(y) #データ総数　
m <- sum(x*y/s) #データ分布の平均　
v <- sum((x-m)^2*y/s) #データ分布の分散　
yp <- dpois(x, m) #平均 m のポアソン分布確率密度　
plot(x, y/s, type="h", ylab="確率") #データの棒グラフ表示　
points(x, yp, type="b", col="red") #ポアソン分布の重ねがき（赤）　
title(main="死亡記事件数へのポアソン分布のあてはめ")
legend(3.5, 0.4, c("データ", "ポアソン分布"), lty=1, col=c("black","red"))

**# 死亡記事件数の R スクリプト**
x <- 0:6	#グラフのx軸の範囲
y <- c(484, 391, 164, 45, 11, 1, 0)	#死亡記事件数データ
s <- sum(y)	#データ総数
m <- sum(x*y/s)	#データ分布の平均
v <- sum((x-m)^2*y/s)	#データ分布の分散
yp <- dpois(x, m)	#平均 m のポアソン分布確率密度
plot(x, y/s, type="h", ylab="確率")	#データの棒グラフ表示
points(x, yp, type="b", col="red")	#ポアソン分布の重ねがき（赤）
title(main="死亡記事件数へのポアソン分布のあてはめ")
legend(3.5, 0.4, c("データ", "ポアソン分布"), lty=1, col=c("black","red"))

商品在庫
　ある商店において，ある商品の１日で売れる数は，平均 2 のポアソン分布にほぼ従っていた．１週間で商品の在庫を切らさない確率を95％以上にするためには，少なくとも在庫をいくつ抱えておく必要があるか．

　7 日間で売れる商品の個数は，平均 2×7 = 14 のポアソン分布に従うと考えられる．ポアソン分布の95％（分位）点を求めればよい．これより，必要な在庫は20個とわかる．

**# 商品在庫の R スクリプト**
m <- 14	# ポアソン分布のパラメータ（平均）
x <- 0:30	# グラフのx軸の範囲
yp <- dpois(x, m)	# ポアソン分布確率密度
cyp <- ppois(x,m)	# ポアソン分布累積確率
stok <- qpois(0.95, m)	# 95％（分位）点
stok	# 答えの表示
op <- par(mfrow = c(1, 2))	# 横に２つのグラフを並べる
plot(x, yp, type="h", ylab="確率密度")	# 確率密度グラフ
points(x[2:21],yp[2:21], type="h", col="red")	# x = 20 まで赤色表示
plot(x,cyp,type="l", ylab="累積確率")	# 累積確率グラフ
arrows(stok,0.95,stok,0, length=0.1, col="red")	# 赤矢印
segments(0,0.95, stok,0.95, col="red")	#
par(op)	# グラフ表示もとに戻す
title(main="ポアソン分布（λ = 14）の95％点")	# グラフタイトル

連続型分布の例

一様分布（uniform distribution)

　2 つのパラメータ a，b（a＜b）をもつ確率密度関数が

で表される分布．

平均：　E[X ] = (a + b)/2，分散： Var[X ] = (b - a)²/12

（0, 1）一様乱数（uniform random number）
　（0, 1）区間の一様乱数はパソコンに標準装備されているが，周期性があるなどの擬似乱数になっている． R の擬似乱数はかなり性質がよいことが知られている．runif(n) で n 個の（0，1）一様乱数が生成される．

# 一様乱数のRスクリプト
x <- runif(10000)	#（0，1）一様乱数1000個列
hist(x, main="(0, 1) 一様乱数 10000個")	#ヒストグラム表示
mean(x)	#　一様乱数の平均（理論値は 1/2）
var(x)	# 一様乱数の分散（理論値は 1/12）

π の値の推定
　一様乱数を用いて π の値を推定することができる．すなわち，区間（-1，1）の一様乱数 2 個で， -1＜x＜1，-1＜y＜1 の正方形内の１点が定義できる．この点を多数生成させ，その内 x² + y² ＜ 1，を満たす点の個数の割合を計算すれば π の値が求まる．

**# 一様乱数による π の近似の R スクリプト**
n <- 10000	#一様乱数の個数
x <- runif(n, -1, 1)	#(-1, 1) の範囲の一様乱数 n 個生成
y <- runif(n, -1, 1)	#
r <- x^2 + y^2	#原点からの距離の２乗
plot(x,y, type="n", xlim=c(-1,1), ylim=c(-1,1))	#グラフの表示範囲の指定
abline(h=0)	# x 軸の表示
abline(v=0)	# y 軸の表示
segments(-1, 1, 1, 1)	#(-1, 1)から(1, 1)までの直線
segments(1, 1, 1, -1)	#
segments(-1, -1, 1, -1)	#
segments(-1, -1, -1, 1)	#
pin <- (1:n)[r<1]	#乱数のうち単位円内に入る乱数の番号
points(x[-pin], y[-pin], pch=".", col="green")	#単位円の外の乱数を緑点で表示
points(x[pin], y[pin], pch=".", col="red")	#単位円内の乱数を赤い点で表示
s <- 0:360	# 0 度から 360 度
theta <- s*pi/180	#度をラジアンに変換
xp = sin(theta)	#単位円の x 座標
yp = cos(theta)	#単位円の y 座標
points(xp,yp, type="l")	#単位円を表示
title(main="（-1，1）一様乱数による点列と単位円")
length(pin)	#単位円内に入った乱数の個数
4*length(pin)/n	#πの近似値

課題：π の近似の精度を上げて π の近似値を再計算せよ．

正規分布（normal distribution)

　平均 μ，分散 σ² の２つのパラメータをもつ確率密度関数が

で表される分布で，N（μ，σ²）と表記する．μ は位置パラメータで，スケールパラメータ σ を標準偏差（standard deviation）という．

パラメータによる形状の違い

**# 正規分布密度関数の R スクリプト**
# 平均の異なる正規分布
curve(dnorm(x, 40, 4), 30, 70, ylim=c(0,0.2), xlab="",ylab="確率密度")	# 平均：40，標準偏差：4
curve(dnorm(x, 50, 4), add=TRUE, col="red")	# 平均：50，標準偏差：4
curve(dnorm(x, 60, 4), add=TRUE, col="blue")	# 平均：60，標準偏差：4
title(main="正規分布（異なる平均(μ)）\n平均＝40, 50, 60，σ = 4")	# タイトル
legend(52,0.19,c("μ = 40","μ = 50","μ = 60"), lty=1, col=c("black","red","blue"))	# 凡例
# 標準偏差（分散）の異なる正規分布
curve(dnorm(x, 50, sd=2), 30, 70, ylim=c(0,0.2), xlab="",ylab="確率密度")	# 平均：50，標準偏差：2
curve(dnorm(x, mean=50, sd=4), add=TRUE, col="red")	# 平均：50，標準偏差：4
curve(dnorm(x, mean=50, sd=6), add=TRUE, col="green")	# 平均：50，標準偏差：6
title(main="正規分布（異なる標準偏差(σ)）\n平均＝50，σ = 2, 4, 6")	# タイトル
legend(55,0.19,c("σ = 2","σ = 4","σ = 6"), lty=1, col=c("black","red","green"))	# 凡例

標準正規分布 N（0，1）
平均 0，分散 1 の正規分布を標準正規分布という．
確率変数 X が平均 μ，分散 σ² の正規分布に従っている，すなわち， X ～ N（μ，σ²），であるとき，

と標準化すると，確率変数 Z は，標準正規分布 N（0，1）に従い，その確率密度関数は，φ(z)

で表され，累積分布関数は，Φ(z)

で表現される．標準正規分布では，-1 ≦ z ≦ 1 の範囲に全体の68.3％が含まれ， -2 ≦ z ≦ 2 の範囲に全体の95.4％が含まれる（下左図）．

**# 標準正規分位点の R スクリプト**
pmorm(-1)	# = 0.16（赤矢印）
pmorm(1) - pnorm(-1)	# = 0.683
pmorm(2) - pnorm(-2)	# = 0.954
qnorm(0.975)	# = 1.96（青矢印），両側 5 ％点

英国成人男子身長データの正規分布へのあてはめ
　身長や体重などの身体データや得点データなどは正規分布に従うことが多い．たとえば，英国成人男子身長（インチ）のデータに正規分布をあてはめてみる．

英国男子身長データ（インチ）
   身長       57    58    59    60    61    62    63    64    65    66

人数    2       4       14       41       83       169       394       669       990       1223

   67    68    69    70    71    72    73    74    75    76    77
   1329       1230       1063       646       392       202       79       32       16       5       2

**英国男子身長データ（インチ）**
身長	57	58	59	60	61	62	63	64	65	66
人数	2	4	14	41	83	169	394	669	990	1223
67	68	69	70	71	72	73	74	75	76	77
1329	1230	1063	646	392	202	79	32	16	5	2

まず，データから統計量を求める．データ総数は 8585 名である．
平均：x^- ＝ (57*2＋58*4＋59*14＋…＋77*2)/8585 ＝ 67.02，
分散：s² ＝ {(57－67.02)²*2＋(58－67.02)²*4 ＋ …＋(77－67.02)²*2}/8585 ＝ 6.62．
これより，平均 μ ＝ 67.02，分散 σ² ＝ 6.62，の正規分布にあてはめ，赤線でグラフ表示したところ，データ分布によく一致していた．

# 英国成人男子身長データの R スクリプト
x <- 57:77 # 身長（x）の範囲　
y <- c(2, 4, 14, 41, 83, 169, 394, 669, 990, 1223, 1329, # 身長ごとのデータ　
1230, 1063, 646, 392, 202, 79, 32, 16, 5, 2) # 　
s <- sum(y) # データ総数　
m <- sum(x*y/s) # データの平均　
v <- sum(y/s*(x-m)^2) # データの分散　
plot(x, y/s, type="h", xlab="身長（インチ）", ylab="頻度") # データの棒グラフ表示　
curve(dnorm(x, m, sqrt(v)), 57, 77, add=T, col="red") # 正規密度のグラフ表示　
title(main="身長データに対する正規分布のあてはめ") # タイトル　

**# 英国成人男子身長データの R スクリプト**
x <- 57:77	# 身長（x）の範囲
y <- c(2, 4, 14, 41, 83, 169, 394, 669, 990, 1223, 1329,	# 身長ごとのデータ
1230, 1063, 646, 392, 202, 79, 32, 16, 5, 2)	#
s <- sum(y)	# データ総数
m <- sum(x*y/s)	# データの平均
v <- sum(y/s*(x-m)^2)	# データの分散
plot(x, y/s, type="h", xlab="身長（インチ）", ylab="頻度")	# データの棒グラフ表示
curve(dnorm(x, m, sqrt(v)), 57, 77, add=T, col="red")	# 正規密度のグラフ表示
title(main="身長データに対する正規分布のあてはめ")	# タイトル

正規分布から得られる確率的推論
　英国人成人男子身長データは，平均 μ = 67.02，標準偏差 σ = 2.57 の正規分布，N(67.02, 6.62)，に従っていることがわかった．このことから，

英国人成人男子で 70 インチ以上の人の比率は．
英国人成人男子で背の高い方から 10％以内に入るには何インチ以上であればよいか．
英国人成人男子で，65 インチから 70 インチまでの間の比率は．

といった集団に対する確率的問に簡単に答えることができる．

# 正規分布から得られる確率的推論の R スクリプト
m <- 67.02; s <- 2.57 # 平均と標準偏差の指定
1 - pnorm(70, mean=m, sd=s) # 1. 70 までの累積確率を 1 から引く
qnorm(0.9, mean=m, sd=s) # 2. 累積確率が 0.9 となる身長
pnorm(70, mean=m, sd=s) - pnorm(65, mean=m, sd=s) # 3. （70 までの累積確率）－（60 までの累積確率）

**# 正規分布から得られる確率的推論の R スクリプト**
m <- 67.02; s <- 2.57	# 平均と標準偏差の指定
1 - pnorm(70, mean=m, sd=s)	# 1. 70 までの累積確率を 1 から引く
qnorm(0.9, mean=m, sd=s)	# 2. 累積確率が 0.9 となる身長
pnorm(70, mean=m, sd=s) - pnorm(65, mean=m, sd=s)	# 3. （70 までの累積確率）－（60 までの累積確率）

二項分布が正規分布に近づく様子
　成功確率 p の二項分布は，試行回数 n を増やしていくと，平均 np，分散 np(1 - p) の正規分布に近づく．

# 二項分布が正規分布に近づく様子の R スクリプト
n <- 5 # 打数　
x <- 0:n # xの範囲　
p <- 0.3 # 打率　
hit <- dbinom(x, size=n, prob=0.3) # 二項確率　
y <- pbinom(x, size=n, prob=0.3) # 二項累積確率　
m <- n*p # 平均　
sd <- sqrt(n*p*(1-p)) # 標準偏差　
op <- par(mfrow = c(1, 2)) # 　
plot(x, hit, type="h", ylim=c(0,0.4), xlim=c(0,7), xlab="ヒット数", ylab="確率密度")
curve(dnorm(x, mean=m, sd=sd), add=TRUE, col="red") # 確率密度　
plot(x, y, type="s", ylim=c(0,1), xlim=c(0,7), xlab="ヒット数", ylab="累積確率")
curve(pnorm(x, mean=m, sd=sd), add=TRUE, col="red") # 累積確率　
par(op) # 　
title(main ="二項分布：n = 5 打数，打率 p = 0.3；正規分布：N(1.5, 1.05) ")

**# 二項分布が正規分布に近づく様子の R スクリプト**
n <- 5	# 打数
x <- 0:n	# xの範囲
p <- 0.3	# 打率
hit <- dbinom(x, size=n, prob=0.3)	# 二項確率
y <- pbinom(x, size=n, prob=0.3)	# 二項累積確率
m <- n*p	# 平均
sd <- sqrt(np(1-p))	# 標準偏差
op <- par(mfrow = c(1, 2))	#
plot(x, hit, type="h", ylim=c(0,0.4), xlim=c(0,7), xlab="ヒット数", ylab="確率密度")
curve(dnorm(x, mean=m, sd=sd), add=TRUE, col="red")	# 確率密度
plot(x, y, type="s", ylim=c(0,1), xlim=c(0,7), xlab="ヒット数", ylab="累積確率")
curve(pnorm(x, mean=m, sd=sd), add=TRUE, col="red")	# 累積確率
par(op)	#
title(main ="二項分布：n = 5 打数，打率 p = 0.3；正規分布：N(1.5, 1.05) ")

課題：打数 n を大きくして，二項分布が正規分布に近づく様子を確かめよ．

正規 Q - Q プロット
　正規分布の分位点と標本（サンプル）の分位点との関係を２次元上にプロットしたもの，標本分布が正規分布に従っていれば直線上に分布する．直線からの「ずれ」で正規分布からの隔たりが視覚的に表現される．
　英国人成人身長データと二項分布を正規分布にあてはめた場合について，正規分布との適合性を正規 Q - Q プロットでみてみよう．左下図は，身長データの正規 Q - Q プロットで，正規分布から少しずれている様子がわかる．右下図は，打率 p = 0.3 の選手の n = 100 打席でのヒット数の分布で，正規分布によくフィットしているのがよくわかる．

# 身長データ正規 Q - Q プロットの R スクリプト
x <- 57:77 # 身長の範囲　
y <- c(2, 4, 14, 41, 83, 169, 394, 669, 990, 1223, 1329, 1230, 1063, 646, 392, 202, 79, 32, 16, 5, 2)
hei <- NULL # 身長ごとのカウント　
for(i in 1:length(x)) # 　
hei <- c(hei, rep(x[i], y[i])) # カウントデータを個人データに変換　
qqnorm(hei, xlab="正規分布分位点", ylab="データ分位点", main="") # 正規 Q - Q プロット表示　
qqline(hei, col="red") # 正規分布の直線表示　
title(main="英国人成人男子身長の正規 Q-Q プロット") # グラフタイトル　

**# 身長データ正規 Q - Q プロットの R スクリプト**
x <- 57:77	# 身長の範囲
y <- c(2, 4, 14, 41, 83, 169, 394, 669, 990, 1223, 1329, 1230, 1063, 646, 392, 202, 79, 32, 16, 5, 2)
hei <- NULL	# 身長ごとのカウント
for(i in 1:length(x))	#
hei <- c(hei, rep(x[i], y[i]))	# カウントデータを個人データに変換
qqnorm(hei, xlab="正規分布分位点", ylab="データ分位点", main="")	# 正規 Q - Q プロット表示
qqline(hei, col="red")	# 正規分布の直線表示
title(main="英国人成人男子身長の正規 Q-Q プロット")	# グラフタイトル

# 100打席ヒット数分布の正規 Q - Q プロットの R スクリプト
N <- 10000 # 乱数列の長さ　
hit <- rbinom(N, size=100, prob=0.3) # 100打席でのヒット数の乱数列生成　
qqnorm(hit, xlab="正規分布分位点", ylab="データ分位点", main="") # 正規 Q - Q プロット表示　
qqline(hit, col="red") # 正規分布の直線表示　
title(main="100打席ヒット数分布の正規 Q-Q プロット") # グラフタイトル　

**# 100打席ヒット数分布の正規 Q - Q プロットの R スクリプト**
N <- 10000	# 乱数列の長さ
hit <- rbinom(N, size=100, prob=0.3)	# 100打席でのヒット数の乱数列生成
qqnorm(hit, xlab="正規分布分位点", ylab="データ分位点", main="")	# 正規 Q - Q プロット表示
qqline(hit, col="red")	# 正規分布の直線表示
title(main="100打席ヒット数分布の正規 Q-Q プロット")	# グラフタイトル

中心極限定理
　X₁，X₂，…，X_n，を平均 μ，分散 σ² である分布からの無作為標本であるとすると，標本平均 X^-_n の分布は，サンプルサイズ n を大きくしていくと平均 E[X^-_n ] = μ，分散 Var[X^-_n ] = σ²/n の正規分布に近づく．
　中心極限定理により，母集団の分布が何であっても標本平均の分布はサンプルサイズを大きく（サンプル数を多く）すれば正規分布に従うので，正規分布に基づいた確率的推論を行ってもよいことを保証している．
　中心極限定理が成り立つ様子を一様分布でみてみる．一様乱数 2 個の標本平均 X^-₂ 10000個の分布は三角形型をしていて，正規分布とは似ていない．しかし，10個の標本平均 X^-₁₀ 10000個の分布は正規分布と近づいたが，尾（テイル）の部分のあてはまりは良くない．30個の標本平均 X^-₃₀ 10000個の分布をみると，尾の部分のあてはまりも改善されてくる．

# 一様乱数による中心極限定理の R スクリプト
N <- 10000 # 乱数列の長さ　
n <- 2 # 標本平均のサイズ　
u <- matrix(data=runif(n*N), ncol=n) # N×n の一様乱数行列　
um <- apply(u, 1, mean) # 行ごとの平均　
op <- par(mfrow = c(1, 2)) # 標本平均のヒストグラム　
hist(um, breaks=seq(0,1,by=0.02), freq=FALSE, ylim=c(0, 2.5), xlab="", ylab="頻度", main="")
m <- mean(um) # 標本平均列の平均　
s <- sd(um) # 標本平均列の標準偏差　
curve(dnorm(x, m, s), 0, 1, add=TRUE, col="red") # 正規分布の重ねがき　
qqnorm(um, xlab="正規分布分位点", ylab="データ分位点", main="") # 正規 Q - Q プロット　
qqline(um, col="red") # 正規分布の直線表示　
par(op) # 　
title(main="一様乱数 2 個の標本平均分布に正規分布 N(0.5, 0.042) を重ね書き")

**# 一様乱数による中心極限定理の R スクリプト**
N <- 10000	# 乱数列の長さ
n <- 2	# 標本平均のサイズ
u <- matrix(data=runif(n*N), ncol=n)	# N×n の一様乱数行列
um <- apply(u, 1, mean)	# 行ごとの平均
op <- par(mfrow = c(1, 2))	# 標本平均のヒストグラム
hist(um, breaks=seq(0,1,by=0.02), freq=FALSE, ylim=c(0, 2.5), xlab="", ylab="頻度", main="")
m <- mean(um)	# 標本平均列の平均
s <- sd(um)	# 標本平均列の標準偏差
curve(dnorm(x, m, s), 0, 1, add=TRUE, col="red")	# 正規分布の重ねがき
qqnorm(um, xlab="正規分布分位点", ylab="データ分位点", main="")	# 正規 Q - Q プロット
qqline(um, col="red")	# 正規分布の直線表示
par(op)	#
title(main="一様乱数 2 個の標本平均分布に正規分布 N(0.5, 0.042) を重ね書き")

課題：サンプルサイズ n を大きくして，標本平均の分布が正規分布に近づく様子を確かめよ．

χ²（カイ２乗）分布

　正の自由度パラメータ n をもち，正の値しか持たない分布．
平均：E[X ] = n，分散：Var[X ] = 2n．

自由度パラメータ n による形状の違い

# 自由度パラメータ n による形状の違いの R スクリプト
curve(dchisq(x, 1), 0, 20) # 自由度 1 の χ² 分布のグラフの表示　
abline(v=0, h=0) # x 軸と y 軸の表示　
curve(dchisq(x, 4), add=T, col=2) # 自由度 4 の χ² 分布のグラフを色 2（赤）で追加
curve(dchisq(x, 10), add=T, col=3) # 自由度 10 の χ² 分布のグラフを色 3（緑）で追加
legend(10, 0.7, c("n = 1", "n = 4", "n = 10"), lty=1, col=c(1, 2, 3))
title(main="χ2 分布の自由度 n による形状の違い") # タイトル　

**# 自由度パラメータ n による形状の違いの R スクリプト**
curve(dchisq(x, 1), 0, 20)	# 自由度 1 の χ² 分布のグラフの表示
abline(v=0, h=0)	# x 軸と y 軸の表示
curve(dchisq(x, 4), add=T, col=2)	# 自由度 4 の χ² 分布のグラフを色 2（赤）で追加
curve(dchisq(x, 10), add=T, col=3)	# 自由度 10 の χ² 分布のグラフを色 3（緑）で追加
legend(10, 0.7, c("n = 1", "n = 4", "n = 10"), lty=1, col=c(1, 2, 3))
title(main="χ2 分布の自由度 n による形状の違い")	# タイトル

正規分布する確率変数の２乗和（誤差２乗和）の分布
　Z₁，…，Z_n を互いに独立で同一の標準正規分布 N(0，1) に従う確率変数列とする．このように独立で同一の分布に従う確率変数を iid rv (independent identically distributed random variables)，もしくは無作為標本（ランダムサンプル）という．このとき，Z_i の n 個の２乗和 U_n は自由度 n の χ² 分布，χ²(n)，に従う．すなわち，

である．標準正規乱数 n = 2 個の２乗和を N = 10000個発生させ，そのヒストグラムをつくり，自由度 n = 2 の χ² 分布を重ね合わせたところよく一致していた（左下図）．さらに，標本累積分布関数に χ² 累積分布関数を重ね合わせた図（右下図）をみると，両者はほとんど一致していることがよくわかる．

# 自由度パラメータ n による χ² 分布の形状の違いの R スクリプト
N <- 10000 # 乱数列の長さ　
n <- 2 # 自由度　
u <- matrix(rnorm(n*N), ncol=n) # N×n の標準正規乱数乱数行列　
u2 <- u^2 # 行列の要素の２乗　
un <- apply(u2, 1, sum) # 行ごとの和　
umx <- ceiling(max(un)) # 最大値を超える整数　
op <- par(mfrow = c(1, 2)) # 　
hist(un, breaks=seq(0,umx,by=0.5), freq=FALSE, xlim=c(0,15), xlab="標準正規乱数（n = 2）の２乗和", ylab="頻度", main="")
curve(dchisq(x, 2), 0, 15, add=T, col=2) # 自由度 2 の χ² 分布の重ね合わせ　
plot(ecdf(un), do.points=F, verticals=T, xlim=c(0,12), ylab="累積確率", main="")
curve(pchisq(x,2), 0, 15, add=T, col=2) # 自由度 2 の χ² 累積分布関数の重ね合わせ　
par(op) # 　
title(main="標準正規乱数の２乗和に χ2 分布の重ね合わせ") # タイトル　

**# 自由度パラメータ n による χ² 分布の形状の違いの R スクリプト**
N <- 10000	# 乱数列の長さ
n <- 2	# 自由度
u <- matrix(rnorm(n*N), ncol=n)	# N×n の標準正規乱数乱数行列
u2 <- u^2	# 行列の要素の２乗
un <- apply(u2, 1, sum)	# 行ごとの和
umx <- ceiling(max(un))	# 最大値を超える整数
op <- par(mfrow = c(1, 2))	#
hist(un, breaks=seq(0,umx,by=0.5), freq=FALSE, xlim=c(0,15), xlab="標準正規乱数（n = 2）の２乗和", ylab="頻度", main="")
curve(dchisq(x, 2), 0, 15, add=T, col=2)	# 自由度 2 の χ² 分布の重ね合わせ
plot(ecdf(un), do.points=F, verticals=T, xlim=c(0,12), ylab="累積確率", main="")
curve(pchisq(x,2), 0, 15, add=T, col=2)	# 自由度 2 の χ² 累積分布関数の重ね合わせ
par(op)	#
title(main="標準正規乱数の２乗和に χ2 分布の重ね合わせ")	# タイトル

課題：２乗和する数 n を大きくした場合も，標準正規乱数の２乗和の分布が自由度 n の χ² 分布に従うことを確かめよ．

F 分布

　正の２つの自由度パラメータ m，n をもち，正の値しか取らない分布

分子，分母の自由度パラメータ m，n による形状の違い

# 分子，分母の自由度パラメータによる形状の違いの R スクリプト
op <- par(mfrow = c(1, 2)) # 　
curve(df(x, 1, 10), 0, 5, ylim=c(0,1.5), ylab="確率密度", xlab="n = 10") # m = 1，n = 10 の F 分布　
abline(v=0, h=0) # x 軸，y 軸　
curve(df(x, 2, 10), 0, 5, add=T, col=2) # m = 2，n = 10 の F 分布　
curve(df(x, 4, 10), 0, 5, add=T, col=3) # m = 4，n = 10 の F 分布　
curve(df(x, 8, 10), 0, 5, add=T, col=4) # m = 8，n = 10 の F 分布　
legend(2.5, 1.4, c("m = 1", "m = 2", "m = 4", "m = 8"), lty=1, col=1:4) # 凡例　
curve(df(x, 4, 50), 0, 5, col=2, ylab="確率密度", xlab="m = 4") # m = 4，n = 50 の F 分布　
abline(v=0, h=0) # x 軸，y 軸　
curve(df(x, 4, 10), 0, 5, add=T) # m = 4，n = 10 の F 分布　
legend(2.5, 0.7, c("n =10", "n = 50"), lty=1, col=c("black","red")) # 凡例　
par(op) # 　
title(main="F 分布の分子と分母の自由度の違いによる形状") # タイトル　

**# 分子，分母の自由度パラメータによる形状の違いの R スクリプト**
op <- par(mfrow = c(1, 2))	#
curve(df(x, 1, 10), 0, 5, ylim=c(0,1.5), ylab="確率密度", xlab="n = 10")	# m = 1，n = 10 の F 分布
abline(v=0, h=0)	# x 軸，y 軸
curve(df(x, 2, 10), 0, 5, add=T, col=2)	# m = 2，n = 10 の F 分布
curve(df(x, 4, 10), 0, 5, add=T, col=3)	# m = 4，n = 10 の F 分布
curve(df(x, 8, 10), 0, 5, add=T, col=4)	# m = 8，n = 10 の F 分布
legend(2.5, 1.4, c("m = 1", "m = 2", "m = 4", "m = 8"), lty=1, col=1:4)	# 凡例
curve(df(x, 4, 50), 0, 5, col=2, ylab="確率密度", xlab="m = 4")	# m = 4，n = 50 の F 分布
abline(v=0, h=0)	# x 軸，y 軸
curve(df(x, 4, 10), 0, 5, add=T)	# m = 4，n = 10 の F 分布
legend(2.5, 0.7, c("n =10", "n = 50"), lty=1, col=c("black","red"))	# 凡例
par(op)	#
title(main="F 分布の分子と分母の自由度の違いによる形状")	# タイトル

分散比の分布としての F 分布
　U と V をそれぞれ独立に自由度 m と n の χ² 分布に従う確率変数とする．このとき，U と V をそれぞれの自由度で割った量の比は，分散比もしくは F 値と呼ばれ，自由度 m，n の F 分布，F(m，n)，に従う．すなわち，

である．標準正規乱数 m = 4 の２乗和と n = 10 の２乗和をそれぞれ N = 10000個発生させ，自由度 4 と 10 の χ² 分布に従う乱数列を生成する．この χ² 分布乱数を自由度で割った量の比を取った乱数列を生成させたところ，そのヒストグラムは自由度 4，10 の F 分布とよく一致していた．なお，χ² 分布乱数は rchisq(num, df) で発生させることができるが，データが従うと想定されることが多い正規分布に従う確率変数から F 分布が生成されることを実感するため，正規乱数から F 分布ヒストグラムを構成した．

# 独立な χ² 分布乱数の比に F 分布をあてはめる R スクリプト
N <- 10000 # 乱数列の長さ　
m <- 4 # 分子自由度　　
n <- 10 # 分母自由度
um0 <- matrix(rnorm(m*N), ncol=m) # N×m の標準正規乱数乱数行列
um2 <- um0^2 # 行列の要素の２乗　
um <- apply(um2, 1, sum) # 行ごとの和　
um <- um/m # 自由度で割る　
un0 <- matrix(rnorm(n*N), ncol=n) # 　
un2 <- un0^2 # 　
un <- apply(un2, 1, sum) # 　
un <- un/n # 　
fv <- um/un # χ² 分布乱数の比
fmx <- ceiling(max(fv)) # fv の最大値を超える整数
hist(fv, breaks=seq(0,fmx,by=0.2), freq=FALSE, xlim=c(0,6), main="")
curve(df(x, 4, 10), 0, 6, add=T, col=2) # 自由度 4，10 の F 分布の重ね合わせ
title(main="独立な χ2 分布乱数の比に自由度 4，10 の F 分布のあてはめ", cex.main=0.9)

**# 独立な χ² 分布乱数の比に F 分布をあてはめる R スクリプト**
N <- 10000	# 乱数列の長さ
m <- 4	# 分子自由度
n <- 10	# 分母自由度
um0 <- matrix(rnorm(m*N), ncol=m)	# N×m の標準正規乱数乱数行列
um2 <- um0^2	# 行列の要素の２乗
um <- apply(um2, 1, sum)	# 行ごとの和
um <- um/m	# 自由度で割る
un0 <- matrix(rnorm(n*N), ncol=n)	#
un2 <- un0^2	#
un <- apply(un2, 1, sum)	#
un <- un/n	#
fv <- um/un	# χ² 分布乱数の比
fmx <- ceiling(max(fv))	# fv の最大値を超える整数
hist(fv, breaks=seq(0,fmx,by=0.2), freq=FALSE, xlim=c(0,6), main="")
curve(df(x, 4, 10), 0, 6, add=T, col=2)	# 自由度 4，10 の F 分布の重ね合わせ
title(main="独立な χ2 分布乱数の比に自由度 4，10 の F 分布のあてはめ", cex.main=0.9)

課題：分子，分母の自由度を変えて，χ² 分布乱数の比が F 分布に従うことを確かめよ．

t 分布

　正の自由度パラメータ n をもつ分布．標準正規分布より裾が重く（x が 0 より離れてもなかなか確率密度が 0 に近づかない），自由度が小さいほど裾が重くなる．自由度 n = 1 のときはコーシー分布になり，n = ∞ のときは標準正規分布となる．

自由度パラメータ n による形状の違い

**# t 分布の自由度による形状の違い R スクリプト（一部）**
curve(dnorm(x), -6, 6)	# 標準正規分布表示
abline(v=0, h=0)	# x 軸と y 軸の表示
title(main="t 分布の自由度による形状の違い")	# タイトル

課題： t 分布の確率密度関数は，自由度を n として dt(x, n) で与えられる．n の値を変えることにより，上の図のようなグラフを描け．

自由度パラメータ n による正規分布とのずれ
　t 分布の正規分布との「ずれ」は分布の端の方が顕著となる．このため，自由度による 97.5％点の違いが重要となる．分布の端のずれは，正規 Q - Q プロットでよくわかる．これをみると，自由度 2 の t 分布では，分布の端は正規分布と大きく異なるが，自由度 10 の t 分布ではずれが小さくなっている．

**# 正規分布とのずれの R スクリプト**
y <- rt(1000, df=10)	# 自由度 10 の t 分布乱数1000個生成
qqnorm(y, xlab="正規分布分位点", ylab="t 分布分位点", main="")	# 正規 Q - Q プロット
qqline(y, col=2)	# 正規分布の四分位範囲直線表示
title(main="t(10) の正規 Q - Q プロット")	#

課題： 自由度を n の値を変えて，標準正規分布とのずれの様子を正規 Q - Q プロットで確かめよ．

標準正規分布確率変数と χ² 分布確率変数との比
　Z を標準正規分布に従う確率変数とし，U を自由度 n の χ² 分布に従う確率変数で，Z と U は互いに独立であるとする．このとき，Z と U をその自由度 n で割った量の平方根との比は，t 値と呼ばれ，自由度 n の t 分布，t(n)，に従う．すなわち，

である．なおこの関係より，t² は，自由度 1，n の F 分布，F(1，n)，に従うことがわかる．
　標準正規乱数 Z と，n = 10 の２乗和を発生させてできる自由度 n の χ² 分布乱数をそれぞれ N = 10000個発生させる．この列から標準正規乱数と，自由度 n の χ² 分布乱数をその自由度で割った量の平方根との比である t 値を生成し，そのヒストグラムをみると，自由度 n の t 分布，t(n)，によく一致していた．

**# 標準正規乱数から生成した t 値と t 分布の R スクリプト**
N <- 10000	# シミュレーション回数
n <- 10	# １回のサンプルサイズ
un0 <- matrix(rnorm(n*N), ncol=n)	# N×n の標準正規乱数行列
un2 <- un0^2	# 標準正規乱数行列の要素の２乗
un <- apply(un2, 1, sum)	# 要素の２乗の各行の和（自由度 n の χ² 分布乱数 N 個）
unr <- sqrt(un/n)	# 自由度 n の χ² 分布乱数を n で割った平方根
z <- rnorm(N)	# 標準正規乱数 N 個
tv <- z/unr	# t 値 N 個
tmx <- ceiling(max(abs(tv)))	# t 値の絶対値の最大
hist(tv, breaks=seq(-tmx,tmx,by=0.2), freq=FALSE, xlim=c(-5,5), main="")
curve(dt(x, 10), add=T, col=2)	# 自由度 10 の t 分布の重ねがき
title(main="標準正規乱数から生成した t 値に t 分布の重ね合わせ")

正規母集団からの標本に基づく推論

独立な正規分布の合成分布

平均 μ₁，分散 σ₁²，の正規分布からの標本 x ～ N( μ₁，σ₁² ) と，平均 μ₂，分散 σ₂²，の正規分布からの標本 y ～ N( μ₂，σ₂² ) があり，両者が互いに独立であるとする．（y の値は x の値の影響を受けない．）

和の分布
x ＋ y は平均 μ₁ ＋ μ₂，分散 σ₁² ＋ σ₂²，の正規分布に従う．
x ＋ y ～ N（ μ₁ ＋ μ₂， σ₁² ＋ σ₂² ）
差の分布
x － y は平均 μ₁ － μ₂，分散 σ₁² ＋ σ₂²，の正規分布に従う．
x － y ～ N（ μ₁ － μ₂， σ₁² ＋ σ₂² ）
一般の線形結合の分布
a と b を任意の実数（スカラー）とすると，x と y の線形結合 ax ＋ by は，
ax ＋ by ～ N（ aμ₁ ＋ bμ₂， a² σ₁² ＋ b² σ₂² ）
標本平均の分布
特に，x₁，x₂，…，x_n を平均 μ，分散 σ² の正規分布からの無作為標本であるとすると，標本平均 x^- の平均と分散は，それぞれ，
E[x^-] = E[Σx_i/n] = ΣE[x_i]/n = (Σμ)/n = μ， Var[x^-] = Var[Σx_i/n] = ΣVar[x_i]/n² = (Σσ²)/n² = σ²/n
となる．よって，
x^- ～ N（μ，σ²/n)

標本平均 x^- の分布例
平均 50，標準偏差 10 の正規分布 N(50，100) から大きさ n = 20 の標本を N = 10000 回抽出し，その標本平均の分布をみた．もとの母集団の分布に比べ，標本平均は分散が小さいので，母平均 μ = 50 のまわりにより集中して分布する．母平均 μ は，標本平均 x^- で精度よく推定できることがわかる．

**# 標本平均の分布の R スクリプト**
N <- 10000	# 標本抽出の回数
n <- 20	# １回のサンプルサイズ
m <- 50; s <- 10	# 平均，標準偏差
r <- rnorm(N, m, s)	# 母集団からの標本
mean(r)	# 標本平均
var(r)	# 標本分散
sd(r)	# 標本標準偏差
rn <- matrix(rnorm(N*n, m, s), ncol=n)	# 大きさ n の標本抽出 N 回
rm <- apply(rn, 1, mean)	# 標本平均
mean(rm)	# 標本平均の平均
var(rm)	# 標本平均の分散
sd(rm)	# 標本平均の標準偏差
op <- par(mfrow = c(1, 2))	#
hist(r, breaks=seq(0,100, by=1), xlim=c(15,85),ylim=c(0,2500),xlab="",ylab="頻度",main="")
title(main="正規分布 N(50,100) のヒストグラム", cex.main=0.9)
hist(rm, breaks=seq(30,70, by=1), xlim=c(15,85),ylim=c(0,2500), xlab="",ylab="頻度",main="")
title(main="大きさ 20 の標本平均のヒストグラム", cex.main=0.9)
par(op)	#

２つの母集団からの標本の差の分布
　平均身長 172.5cm，標準偏差 6cm の集団 A と，平均身長 168cm，標準偏差 4.5cm の集団 B がある．いま，集団 A，B からそれぞれ 1 人をランダムに選んだとき，集団 A から選ばれた人の方が集団 B から選ばれた人より背が高くなる確率をかんがえてみる．
　集団 A からの標本を x，集団 B からの標本を y とする．
x ～ N（172.5，36），y ～ N（168，20.25）なので， u ＝ x － y ～ N（4.5，56.25）に従う．
つまり，集団 A からの標本と集団 B からの標本の差は，平均 4.5cm，標準偏差 √56.25＝7.5cm の正規分布に従う．この正規分布が 0 より大きくなる確率を求めればよい．

**# ２つの母集団からの標本の差の R スクリプト**
N <- 10000	# 標本抽出の回数
m1 <- 172.5; s1 <- 6	# 集団 A の平均と標準偏差
m2 <- 168; s2 <- 4.5	# 集団 B の平均と標準偏差
a <- rnorm(N, m1, s1)	# 集団 A からの標本
b <- rnorm(N, m2, s2)	# 集団 B からの標本
op <- par(mfrow = c(1, 2))	#
hist(b, breaks=seq(140,200, by=2), ylim=c(0, 2000), col="gray",ylab="頻度", xlab="身長（cm）", main="")
title(main="2つの集団の重ね合わせ")	#
par(new=T)	# グラフの重ね合わせ
hist(a, breaks=seq(140,200, by=2), ylim=c(0,2000),density=0.1, ylab="", xlab="",main="", col="red")
d <- a - b	# ２つの母集団からの標本の差
hist(d, breaks=seq(-30,40,by=2), ylab="頻度", xlab="身長（cm）",main="")	#
title(main="2つの標本の差の分布")	#
par(op)	#
length(d[d>0])/length(d)	# シミュレーションによる確率
dm <- m1-m2; dv <- s1^2 + s2^2	# 差の分布の平均と分散
1 - pnorm(0, mean=dm, sd=sqrt(dv))	# 差が０以上の確率

２つの母集団からの標本の標本平均の差の分布
　先ほどの母集団 A，B で，こんどは両集団からそれぞれランダムに 10 名ずつ選び，それぞれの平均身長を計算した．集団 A から選ばれた人の平均身長の方が集団 B から選ばれた人の平均身長より高くなる確率を求めてみる．
　集団 A からの標本を x₁ ，…， x₁₀，集団 B からの標本を y₁ ，…， y₁₀，とし，それぞれの平均を x^-， y^- とする．
　x_i ～ N（172.5，36）より x^- ～ N（172.5，36/10）＝N（172.5，3.6），同様に， y_i ～ N（168，20.25）より y^- ～ N（168，2.025）である．
　これより，集団 A，B の平均身長の差は， u ＝ x^- － y^- ～ N（4.5，5.625）と分布する． u が０より大きくなる確率を求めればよい．

課題：上記の確率を求めよ．

正規分布に基づく母数の区間推定

　正規分布は，平均 μ と分散 σ² の２つの母数を持つ．２つの母数とも未知であるのが普通であるが，片方が既知であるときは母数に関する推論は簡単に行える．このため，多少非現実的な設定であるが，まず，既知の場合を考え，その後，より一般的である２つの母数とも未知である場合を扱う．

分散既知の場合の母平均 μ の区間推定

　正規分布する母集団で母分散 σ² がわかっている場合は，未知の母平均 μ に関する区間推定は以下のように行える．
いま，正規分布 N( μ，σ² ) において，大きさ n の標本 x₁，x₂，…，x_n を抽出したとき，母平均は標本平均で推定される．標本平均 x^- の分布は，

となる．標準正規分布の 97.5％分位点を z_0.975（= 1.96）とすると，標準正規分布する確率変数 z が -z_0.975 から z_0.975 に入る確率は 0.95 となる．つまり，

となる．最後の式を母集団平均 μ の 95％信頼区間と言う．
このように，母数の信頼区間を標本から推定することを区間推定という．区間推定においては，信頼区間の幅 2d が小さい程よい．すなわち，母分散が小さい母集団で，標本の大きさ（サンプルサイズ）が大きい程，精度の高い推定が行える．

課題：　過去の経験から分散が 9 であることがわかっている正規母集団から大きさ 16 の標本を抽出したところ，標本平均が 1.5 であった．母平均 μ の 95％信頼区間を求めよ．

95％の意味

　同じ正規母集団から標本抽出を繰り返すと，毎回標本平均として異なる値がえられ，それに対応して信頼区間も異なる．この信頼区間の 95％が真の平均 μ を含む，という意味である．
つまり，100回の標本抽出により，100 個の信頼区間を作ったら平均的にみて，95 個の信頼区間が真の平均 μ を含むことが期待できる．
下の図は，平均 0 分散 2 の正規分布 N( 0, 2 ) から大きさ 10 の標本を取りだし，分散が既知であるとして，母平均に対する信頼区間を 100 個生成したものである．"×" が標本平均を示す．左の "*" は，信頼区間が母平均の真値 0 を含まなかった場合である．

**# 平均 μ の 95 ％信頼区間 100 回生成の R スクリプト**
v <- 2; n <- 10	# 母分散と標本の大きさ
d <- qnorm(0.975)*sqrt(v/n)	# 95％信頼区間の幅
x <- c(-2.5, -2.5, 2.5, 2.5)	# グラフの x の範囲
y <- c(0, 100, 100, 0)	# グラフの y の範囲
plot(x, y, type="n", xlab="", ylab="")	# グラフ領域確保
segments(0, 0, 0, 100, col="red")	# 母平均のライン
for(i in 0:100){	# 100回の繰り返し
m <- mean(rnorm(n, mean=0, sd=sqrt(v)))	# N(0, v)からの大きさ n の標本平均
segments(m-d, i, m+d, i)	# 信頼区間の表示
points(m, i, pch=4, col="red", cex=0.8)	# 標本平均の赤×表示
if(m-d>0 \|\| m+d<0) text(-2.5, i, "*")	# 信頼区間が母平均を含まない（失敗）した場合
}	#
title(main="N（ 0, 2 ）からの大きさ 10 の標本から得られた
平均 μ の 95 ％信頼区間を 100 回作成", cex.main=1.0)	#

平均既知の場合の母分散 σ² の区間推定

　正規母集団で母平均 μ がわかっているとき，大きさ n の標本 x₁，x₂，…，x_n を抽出したとき，母分散は，

で推定される．ところで，標本は

と分布するので，自由度 n の χ² の 2.5％分位点と 97.5％分位点をそれぞれ， χ²（n）_0.025，χ²（n）_0.975 とすると，

が成り立つ．下の式の区間を母分散 σ² の 95％信頼区間と言う．

平均未知の場合の母分散 σ² の区間推定

　正規母集団では，母数が未知であるのが普通であろう．このとき，大きさ n の標本 x₁，x₂，…，x_n を抽出したとき，母平均 μ と母分散 σ² は，そえぞれ標本平均 x^- と標本分散 s²，

で推定される．母平均 μ の信頼区間を述べる前に母分散 σ² の信頼区間の構成法を述べる．
　ところで，標本や標本平均は，

と分布する．一方，

と計算されるので，(n - 1)s²/σ² という量は，

と，自由度 n - 1 の χ² 分布，χ²(n - 1)，に従うことがわかる．
　自由度 n - 1 の χ² 分布の 2.5％分位点と 97.5％分位点をそれぞれ， χ²（n - 1）_0.025，χ²（n - 1）_0.975 とすると，

が成り立つ．下の式の区間を母分散 σ² の 95％信頼区間と言う．

母分散 σ² の 95％信頼区間
　母平均が未知のときの母分散 σ² の 95％信頼区間を，母平均に対する信頼区間と同様に100回作ってみる．

**# 母分散 σ² の 95 ％信頼区間 100 回生成の R スクリプト**
m <- 20; v <- 4	# 正規母集団の平均と分散
n <- 20	# 標本の大きさ
x <- c(0, 0, 20, 20)	# グラフの x の範囲
y <- c(0, 100, 100, 0)	# グラフの y の範囲
plot(x, y, type="n", xlab="", ylab="")	# グラフ領域確保
segments(v, 0, v, 100, col="red")	# 母分散のライン
for(i in 0:100){	# 100回の繰り返し
r <- rnorm(n, m, sqrt(v))	# 母集団からの無作為標本
s <- (n-1)*var(r)	# 標本の偏差平方和
s1 <- s/qchisq(0.975, df=n-1)	# 95 ％信頼区間の下限
s2 <- s/qchisq(0.025, df=n-1)	# 95 ％信頼区間の上限
segments(s1, i, s2, i)	# 信頼区間の表示
points(var(r), i, pch=4, col="red", cex=0.8)	# 標本分散の赤×表示
if(s1 > v \|\| s2 < v) text(0, i, "*")	# 信頼区間が母分散を含まない（失敗）した場合
}	#
title(main="N（ 20, 4 ）からの大きさ20の標本から得られた
分散の95%信頼区間を100回作成", cex.main=1.0)	#

標本分散の不偏性
　ところで，χ²(n - 1) の平均は n - 1 なので，

となり，標本分散 s² は母分散 σ² の不偏（unbiased）推定量であることがわかる．

**# 標本分散の不偏性の R スクリプト**
N <- 10000	# シミュレーション回数
n <- 20	# サンプルサイズ
s1 <- NULL	#
s2 <- NULL	#
for(i in 1:N){	#
x <- rnorm(n)	# 標準正規乱数 n 個
s <- var(x)	# 標本分散
s1 <- c(s1, s)	# 標本分散列
s2 <- c(s2, s*(n-1)/n)	# n で割る分散列
}	#
m1 <- mean(s1)	# 標本分散の平均
m2 <- mean(s2)	# n で割る分散の平均
op <- par(mfrow = c(2, 1))	#
hist(s1, breaks=seq(0,3, by=0.1), main="")
abline(v = m1, col=2)	# 平均の赤線表示
title(main="標本不偏分散のヒストグラム")
hist(s2, breaks=seq(0,3, by=0.1), main="")
abline(v = m2, col=2)	# 平均の赤線表示
title(main="n で割る分散のヒストグラム")
par(op)	#
m1	# 標本分散の平均
m2	# n で割る分散の平均

分散未知の場合の母平均 μ の区間推定

　前節で考えたように正規母集団の母数が未知のときは，大きさ n の無作為標本 x₁，x₂，…，x_n から，母平均 μ と母分散 σ² は，それぞれ標本平均 x^- と標本分散 s²，

で推定される．
　標本平均 x^- の分布は標準化すると，

のように標準正規分布となり，標本分散に関係する量は，

のように自由度 n - 1 の χ² 分布する．これより，z と U をその自由度 n - 1 で割った量の平方根との比は，

のように自由度 n - 1 の t 分布に従う．
　自由度 n - 1 の t 分布の 97.5％分位点を t(n - 1)_0.975 とすると， t 分布する確率変数 t が -t(n - 1)_0.975 から t(n - 1)_0.975 に入る確率は 0.95 となる．つまり，

となる．最後の式を母分散未知のときの母集団平均 μ の 95％信頼区間と言う．

課題：　母分散既知のときの母集団平均 μ の 95％信頼区間100回生成の R スクリプトを参考にして，母分散未知のときの母集団平均 μ の 95％信頼区間を100回生成し，母分散が未知と既知で信頼区間にどのような違いがあるか考えよ．

仮説検定

帰無仮説（H₀）と対立仮説（H₁）

統計学で扱う仮説とは，母集団に対する断定や推測．たとえば，

母集団は正規分布に従っている．
母集団平均は 0 である．
母集団 A と母集団 B の平均は等しい．

などである．

統計的仮説検定で用いられる仮説は，まず，帰無仮説という形式で与えられる．
帰無仮説は棄却されることに意味がある仮説である．
帰無仮説と反対の仮説を対立仮説という．

上の3番目の例でみると，

帰無仮説：母集団 A と母集団 B の平均は等しい．（H₀： μ_A ＝ μ_B）

対立仮説：母集団 A と母集団 B の平均は等しくない．（H₀： μ_A ≠ μ_B）

母集団 A と母集団 B は異なる処理（薬の投与など）をしているので，実験の目的は，母集団 A と母集団 B の平均は異なる（処理効果がある）ことを言いたい（対立仮説が正しいことを望む）のだが，まずは「等しい（処理効果無し）」と仮定してみようという考え方．

仮説検定

検定統計量

　標本から算出される量で，検定に用いられるもので，t 値，F 値などがある．この値から帰無仮説を受託（採択）するか棄却（対立仮説の採択）するかを判定する．

有意水準

　統計的仮説検定では，たとえば２つの母集団平均が等しいという帰無仮説を考えると，この帰無仮説のもとで，検定統計量（標本平均の差に基づく t 値など）以上（もしくは未満）の値が得られる確率を求める．
くだけた言い方をすれば，帰無仮説が正しいとしたときに，標本のようなデータが得られる確率を求める．
これが十分小さい（ほとんどありえない）ときは，平均が等しいと仮定したことが誤りであったと判断して帰無仮説を棄却し，２つの母集団平均には差があると結論づける．
この確率がそれほど小さくない場合は，このような統計量が得られることもありえると考え，帰無仮説を採択し，平均が等しいと考えてもよいとする．
棄却か採択かの判断の基準となる確率を有意水準といい， 5 % や 1 % がよく用いられる．

片側検定と両側検定

実験状況によっては，薬投与などの処理を行った集団（処理群）平均 μ_A が，薬を投与しない集団（対照群）の平均 μ_B より小さくなることはないことが事前にわかっているような場合がある．このようなとき，

帰無仮説，H₀： μ_A ＝ μ_B

対立仮説，H₀： μ_A ＞ μ_B

となる．これは，事前情報より，μ_A ＜ μ_B となる可能性をまったく考えない場合である．
このため検定には，片側 5 ％点や 1 ％点を用いる．

両側検定と信頼区間

母集団平均に対する両側検定は，母集団平均に対する信頼区間と大きな関係がある．いま，帰無仮説（H₀）と対立仮説（H₁）が，

H₀：μ ＝ μ₀
H₁：μ ≠ μ₀

であり，母分散 σ² が既知のときを考える．
標本の大きさがnで，標本平均が x^- であったとすると，母平均μに対する 95％信頼区間は，

Pr[ － 1.96 ＜ √n(x^- － μ )/σ ＜ 1.96 ] ＝ 0.95，

Pr[ x^- － 1.96×σ/ √n ＜ μ ＜ x^- ＋ 1.96×σ/ √n　] ＝ 0.95

となる．
　一方，この検定の検定統計量は，標本平均の標準化値の絶対値

|z| ＝ √n|x^- － μ₀ |/σ

で，有意水準 5 ％で帰無仮説を受諾するのは，検定統計量 |z| が両側 5 ％点である 1.96 以下のときである．つまり，

帰無仮説を受諾 ⇔ － 1.96 ＜ √n(x^- － μ₀ )/σ ＜ 1.96

である．この両者の関係より，
帰無仮説を受諾 ⇔ 母平均の信頼区間に μ₀ が含まれる．

帰無仮説を棄却 ⇔ 母平均の信頼区間に μ₀ が含まれない．
が成り立つ

検定における２種類の過誤

検定は，仮説を棄却するか採択するかのいずれかであるが，統計量は分布をもつので，この判定には間違いが起こることがある．
以下のように，この過誤には 2 種類がある．

統計的検定における2種類の過誤
仮説の棄却仮説の採択

仮説が真のとき第１種の過誤正解

仮説が偽のとき正解第２種の過誤

統計的検定における2種類の過誤
	仮説の棄却	仮説の採択
仮説が真のとき	第１種の過誤	正解
仮説が偽のとき	正解	第２種の過誤

第１種の過誤が有意水準である．また，第２種の過誤の確率を β としたとき，仮説が偽のとき正しく仮説を棄却する確率，1 - β，を検出力という．よい検定は，第１種の過誤を固定したもとで検出力の高い検定方式である．

正規母集団の母平均に対する t 検定

１つの母集団に対する検定

　平均 μ，分散 σ² がともに未知である正規母集団に対して，

帰無仮説 H₀： μ ＝ μ₀

対立仮説 H₁： μ ≠ μ₀

の両側検定を考える．　いま，母集団から大きさ n の無作為標本 x₁，x₂，…，x_n を抽出したところ，標本平均が x^-，標本分散が s² であったとする．帰無仮説のもとでは，標本平均は，

と分布するので，これを，標本平均の標準誤差 s/√n で標準化した t は，

のように自由度 n - 1 の t 分布に従う．この分布の97.5％分位点を t(n - 1)_0.975 とすると，有意水準 5 ％の検定は，

|t| > t(n - 1)_0.975

のとき帰無仮説を棄却する．|t| が検定統計量で，この値を |t| 値という．

なお，この検定は，対のある標本に適用できる．対のある標本とは，n 組のペアー標本，

(x₁，y₁ )，(x₂，y₂ )， …，(x_n，y_n )

からなる．正規性の仮定のもとでは，

x_i ～ N( μ_i，σ_x² )， y_i ～ N( μ_i ＋ δ，σ_y² )

ここで興味ある母数は δ であり，μ₁，…，μ_n は攪乱母数である．y_i と x_i の差を取ると，

z_i ＝ y_i － x_i → z_i ～ N( δ，σ_z² )

となるので，１つの母集団に対する検定に帰着する．なおこの問題は，反復のない 2×n の２元配置と考えて解くこともできる．

園芸療法前後での MSE 得点
　園芸療法（horticultural therapy）は第2次大戦後，兵士のリハビリテーション等を通して欧米で発達してきた．日本でも90年代から身体障害者，精神障害者，高齢者等の生活の質（QOL, Quality Of Life）やセルフエスティーム（self-esteem，自尊感情）を向上させる手段として注目されてきていている．
　園芸療法の数値的･客観的な効果の計測を行うため，認知症診断に用いられる MSE（Mental State Examination，心理機能検査），CDT（Clock Drawing Test，時計描画テスト）と老年者や認知症患者の日常生活の遂行能力を測る NM スケール（N 式老年者精神状態評価尺度）， N-ADL（N 式老年者日常生活動作能力評価尺度），および，気分の状態（抑うつ，活気のなさ，怒り，疲労，緊張，混乱）を計測する POMS（Profile Of Mood State），自己記入式 QOL 質問表 QUIK を用いた．これらの調査を園芸療法の前後でクライアントに対して行い，効果の数値的計測を行った．
　ここでは，MSE の結果についての解析を行う．MSE は 30 点満点で，点数が高いほど日常生活に適応していると考えられている．MSE に関しては前後とも回答したクライアントの総数は 19 例であった．データは下の表にまとめられている．このデータを用いて，園芸療法を施す前と後では，心理機能に差がないという帰無仮説，すなわち，

H₀：差＝ 0

の検定を行う．

データダウンロード

文献

鈴木修（編），大森宏，児玉良治，渡辺俊之，矢野広，山根健治（2004）．専修学校における園芸療法士教育育成システムの研究開発（文部科学省委託平成15年度「専修学校先進的教育研究開発事業」）
鈴木修，渡辺俊之，矢野広，山根健治，大森宏，伊東正信，最上正秀，山下容子，小泉力，児玉良治，頭士智美，細井薫，水口聡子，遠藤久子，樋田奈穂子，小島ユリ，郡司敏幸（2005）．福祉サービス提供者に対する園芸療法教育システムの研究開発（平成16年度文部科学省「専修学校社会人キャリアアップ教育推進事業」）

# １つの母集団に対する t 検定の R スクリプト
engei <- read.csv("engei.csv") # csv データ読み込み　
engei # データの表示　
x <- engei[,3] # 園芸療法前の MSE 得点を x に格納（列数で指定）　
x <- engei$療法前 # 園芸療法前の MSE 得点を x に格納（変数名で指定）　
y <- engei$療法後 # 園芸療法後の MSE 得点を x に格納（変数名で指定）　
t.test(y, x, paired=TRUE) # １母集団 t 検定，paired = TRUE で対標本を指定
d <- y - x # 療法後－療法前で療法の効果をみる　
d # 療法の効果の表示　
t.test(d) # １母集団 t 検定，先ほどと同じ検定　
n <- length(d) # 標本の大きさ（サンプルサイズ）　
mean(d) # 標本平均　
sd(d) # 標本標準偏差　
dv <- n - 1 # 標本の自由度　
t <- sqrt(n)*mean(d)/sd(d) # 効果がないとの帰無仮説のもとでの t 値　
t # 検定統計量 t 値の表示　
2*(1 - pt(t, df=dv)) # 両側検定の p 値　
t0 <- qt(0.975, df=dv) # 両側 5 ％検定の閾値　
dw <- t0*sd(d)/sqrt(n) # 95％信頼区間の幅　
mean(d)-dw # 95％信頼区間の下限　
mean(d)+dw # 95％信頼区間の上限　
t.test(d, alternative="greater") # 片側検定　

　このデータでは，クライアント全体では園芸療法の効果は認められなかった．また，MSE の満点が30点なので，元々心理機能に問題がなく満点近い得点のクライアントでは，効果が認められないのも当然といえる．その上，園芸療法処方の前後で半年程度のタイムラグがあるので，何もしなくても認知症の症状が進行する場合もあり，効果が検出しずらいこともある程度予測できる．

課題：クライアントのうち若年層（ 85 歳以下）を取り出し，園芸療法の効果を検定せよ．

t 検定の有意水準
　t 検定の有意水準をシミュレーションにより確認してみる．平均 μ = 10，分散 σ² = 4 の正規分布から大きさ n = 10 の標本を抽出し，その標本平均 x^- と標本（不偏）分散 s² から t 値を計算する．これを N = 10000回繰り返すと，t 値のヒストグラムができる．このヒストグラムは自由度 9 の t 分布に従っているはずである．

帰無仮説，H₀：μ = 10

の検定では， t 値の絶対値 |t| が自由度 9 の t 分布の97.5％分位点 t(9)_0.975 より大きくなった場合に棄却される．このため，この個数を数えれば第１種の過誤の確率，つまり有意水準がシミュレーションにより推定できる． N = 10000回のシミュレーションでは，これがほぼ 5 ％になっていた．

**#t 検定の有意水準の R スクリプト**
N <- 10000	# シミュレーション回数
n <- 10	# サンプルサイズ
n1 <- rnorm(N*n, mean=10, sd=2)	# N(10, 4) から大きさ n の標本を N 回シミュレーション
n1.mat <- matrix(data=n1, ncol=n)	# データ行列
n1.mean <- apply(n1.mat, 1, mean)	# 各サンプルの平均
n1.var <- apply(n1.mat, 1, var)	# 各サンプルの分散
n1.var3 <- n1.var/n	# 各標本平均の分散
n1.td <- (n1.mean - 10)/sqrt(n1.var3)	# 各サンプルの t 値
mean(n1.td)	# t 値の平均
sd(n1.td)	# t 値の標準偏差
mt <- ceiling(max(abs(n1.td)))	# t 値の絶対値の最大値
xq1 <- qt(0.025, df = (n-1))	# t(9) の 2.5% 点
xq2 <- qt(0.975, df = (n-1))	# t(9) の 97.5% 点
length( n1.td[abs(n1.td) > xq2])	# 5% 検定で有意となった個数
hist(n1.td, breaks=seq(-mt, mt, by=0.2), probability=TRUE, xlab="t 値", ylab="密度", main="")
abline(v=xq1, col="red")	# 採択域の下限
abline(v=xq2, col="red")	# 採択域の上限
#curve(dt(x, df=(n-1)), -6, 6, add=T, col="red")	# t(9) の表示
title(main="t 値のヒストグラムと有意となった個数")	# タイトル

t 検定の検出力（power）
　前節では帰無仮説が真のとき，t 検定により仮説が棄却する確率を求めた．では，帰無仮説が偽であるとき，帰無仮説がどれくらいの確率で正しく棄却できるであろうか．すなわち，t 検定の検出力はどの程度であろうか．この問題に解析的に答えるのは難しいが，シミュレーションなら簡単に求めることができる．
　いま，母集団の平均を m = 11 として，N(11，4) から大きさ n = 10 の標本を抽出する．帰無仮説が偽であるとき，標本から得られる t 値の分布は簡単ではないが，N = 10000回のシミュレーションを行えば t 値のヒストグラムが得られる．シミュレーションで得られた t 値の中で帰無仮説が棄却される割合を求めれば検出力が推定できる．
　シミュレーションの結果では，検出力は約 30 ％であった．

**#t 検定の有意水準の R スクリプト**
m <- 11	# 母集団平均（帰無仮説が偽の場合）
n1 <- rnorm(N*n, mean=m, sd=2)	# N(m, 4) から大きさ n の標本を N 回シミュレーション

課題：母集団平均を m = 12 としたときの検出力を求めよ．

２つの母集団に対する検定

　２つの母集団 A，B があり，それぞれが平均を μ_A，μ_B，分散を σ_A²，σ_B² の正規分布に従っているが，その値は未知であるとする．いま，両集団の分散の値が等しく， σ_A²＝σ_B²＝σ²，と仮定できるとしよう．このとき，

帰無仮説，H₀： μ_A ＝ μ_B

対立仮説，H₁： μ_A ≠ μ_B

の検定は t 分布を用いて行える．

母集団 A から大きさ n_A，母集団 B から大きさ n_B の標本を抽出した．母集団 A からの標本の標本平均が x^-_A，標本分散が s_A² であり，母集団 B の標本平均が x^-_B，標本分散が s_B² であった．母集団 A，B が共通の分散 σ² をもつとすると，その推定値 s² は以下のように推定できる．

母集団 A からの標本の偏差平方和：　S_A＝（n_A－1）s_A²

母集団 B からの標本の偏差平方和：　S_B＝（n_B－1）s_B²

母集団 A，B 全体での偏差平方和：　S ＝ S_A ＋ S_B ＝（n_A－1）s_A²＋（n_B－1）s_B²

母集団 A，B 共通の標本分散： bunsan

また，母集団Aの標本分布は，N（μ_A，σ²）であり，母集団Bでは， N（μ_B，σ²）であることから，それぞれの標本平均は，

x^-_A ～ N（μ_A，σ²/n_A）， x^-_B ～ N（μ_B，σ²/n_B）

と分布する．これより，標本平均の差x^-_A－ x^-_Bは，

と分布する．

帰無仮説（H₀： μ_A ＝ μ_B）のもとでは，μ_A－μ_B＝0，なので，標本平均の差は，

と分布する．これを標準化した z 値，

において，標準偏差 σ の代わりに標本標準偏差 s を代入した t 値，

が自由度 n_A＋n_B－2 の t 分布に従うことを利用して検定ができる．なお，母集団 A，B からの標本の大きさがともに等しく， n_A＝n_B＝n であるときは，式がずっと簡単になる．

母集団A，Bで分散の同等性が疑われるときは，ウェルチ（Welch）の検定を用いる．

園芸療法区と対照区の MSE 得点
　前節では，心理機能検査（MSE）データを対のある 2 標本データとして解析した．この節では，このデータの園芸療法前データを対照とし，園芸療法後データを処理とみなして解析してみる．この場合，実際とは異なりこのデータの解析法としては正しくないが，対照 19 名，処理 19 名のデータ（すべて異なるクライアント）とみなした場合である．
　まず最初に，処理区と対照区での分布の様子を，箱ひげ図（box plot）で見て両者の違いの程度を観察し，その後２つの母集団に対する t 検定（２標本 t 検定）を行う．

**# ２標本 t 検定の R スクリプト**
engei <- read.csv("engei.csv")	# csv データ読み込み
x <- engei$療法前	# 園芸療法前の MSE 得点を x に格納（変数名で指定）
y <- engei$療法後	# 園芸療法後の MSE 得点を y に格納（変数名で指定）
boxplot(x, y, names= c("対照区","処理区"), ylab="MSE 得点", cex.axis=0.8)
title(main="園芸療法処理区と対照区の MSE 得点分布の箱ひげ図", cex.main=1.0)
t.test(y, x, var.equal=T)	# ２標本 t 検定
mx <- mean(x)	# 対照区平均
my <- mean(y)	# 処理区平均
nx <- length(x)	# 対照区サンプルサイズ
ny <- length(y)	# 処理区サンプルサイズ
dfv <- nx+ny-2	# データの自由度
vx <- var(x)	# 対照区標本分散
vy <- var(y)	# 処理区標本分散
v <- ((nx-1)vx + (ny-1)vy)/dfv	# こみにした共通の分散
d <- my - mx	# 処理区平均－対照区平均
vd <- v/nx + v/ny	# 処理平均の差の分散
tv <- d/sqrt(vd)	# t 値
2*(1 - pt(abs(tv), df=dfv))	# p 値
t0 <- qt(0.975, df=dfv)	# 自由度 dfv の t 分布の97.5％点
dw <- t0*sqrt(vd)	# 95 ％信頼区間の幅
d - dw	# 平均の差の 95％信頼区間の下限
d + dw	# 平均の差の 95％信頼区間の上限
t.test(x, y)	# ウェルチ（Welch）の検定

課題：クライアントのうち若年層（ 85 歳以下）を取り出し，２標本 t 検定を行え．

ノンパラメトリック検定

　ノンパラメトリック検定（nonparametric test）とは，母集団分布に関して，正規分布などのある特定の分布を仮定しないで統計的検定を行う方法である．この手法の利点は，多少の制約がある場合もあるが，どのような母集団分布からのデータであっても適用可能なことである．
　このため，標本中に他の観測値から飛び離れた値と思われる異常値（outlier）が含まれているような場合でも正しい検定を与えることができる．すなわち，頑健（robust）な検定法である．
一方，弱点としては，分布に関する情報を用いないので，特定の分布の元での最良の検定（正規母集団での小標本に対する t 検定など）に比べ検定（検出）力（power）が低下することである．　ノンパラメトリック検定においてはデータの値を直接使わず，これを大きさの順に並べてその順位（rank）を用いることが多い．このことは，データのもつ情報を全部使い切っていない，情報の損失があることを意味する．他方，異常値の影響は］それだけ受けにくくなっている．　ノンパラメトリック検定の以前のやり方は，n 個の標本が与えられたときに，なんらかの考え方に基づいて検定統計量（test statistic）T を求める．n が小さいときには，帰無仮説のもとでの T の分布が直接計算され，その分布に基づいた数表を用いて検定を行った．n が大きいときは，帰無仮説のもとでの T の平均 E[T ]，分散 Var[T ] を求め，中心極限定理から，

が標準正規分布 N(0，1) に近似的に従うことを利用して，標準正規分布表を用いて近似的な検定を行った．たとえば，両側検定の場合，|Z | の値が 1.96 以上となれば有意水準 0.05 で帰無仮説は棄却される．なお，T は離散分布となるので近似の精度を上げたいときには分子に 1/2 をいれて，連続性の補正，

を行う．
　現在では，オープンソースの統計環境ソフト R にノンパラメトリック検定を行う関数がかなり実装されているので，数表をみる必要がないことが多くなった．
　使用法としては，標本の正規性に少しでも疑問がもたれるときは"保険"の意味でノンパラメトリック検定を用いるとよい．この検定で有意と判断されれば非のうちどころはまったくなくなる．

１標本問題（one sample problem）

概要

　１つの母集団に関する検定問題である．ある連続分布をもつ母集団から大きさ n の無作為標本 X₁，…，X_n が抽出されたとする．ここで，母集団分布の位置母数（location parameter）に関する両側検定問題

H₀ ： ξ ＝ ξ₀，H₁ ： ξ ≠ ξ₀

および，片側検定問題

H₀ ： ξ ＝ ξ₀，H₁ ： ξ ＞ ξ₀

を考えてみよう．正規性の仮定のもとでは，X_i ～ N( ξ，σ² ) とおき， ξ と σ² の推定量として標本平均 x^- と標本不偏分散 s² を用い，t 検定を行う．
　ノンパラメトリック検定では，母集団の位置母数は平均でなくメディアン（中央値）で測られる．これは，コーシー分布のように平均が存在しない分布にも対応するためである．一方，メディアン M は

と定義されるので，すべての連続分布で存在する．
　さてこれからは，一般性を失うことなく ξ₀ ＝ 0 とする．ξ₀ ≠ 0 のときは， X_i のかわりに X_i － ξ₀ を考えればよい．

符号検定（sign test）

　いま，X₁，…，X_n のうち正の値（＋の符号をもつ）の数を T とする．ただし，X_i ＝ 0 となる標本が得られたときは，この標本はなかったものとして取り除いておく．帰無仮説のもとでは式(5)により，T は２項分布 B(n，1/2) に従う．従って，両側検定は

という棄却域をつくればよい．c の値は２項分布を計算すれば適当な有意水準に対して正確に求められる．また，n が大きいときには，

となるので，正規近似(1)を行えば任意の有意水準に対して近似的な検定ができる．片側検定に対しては，式(7)の棄却域を片側にとればよい．
　メディアンに対する符号検定は 1/2 分位点に対する検定でもある．このことに着目すれば，符号検定は任意の分位点に対して検定できる．

ウィルコクソン（Wilcoxon）の符号順位和検定（signed rank sum test）

　符号検定は，観測値の大小はまったく無視してその符号だけを用いている．これは観測値の情報をかなり無駄にしていると考えられる．この点を改良したのが Wilcoxon の符号順位和検定である．しかしながら，母集団分布が対称な分布であるという仮定があらたに加わる．
　標本の絶対値 |X | を大きさの順に順位をつけ，これを R_i とおく．たとえば X₁ ＝ 3.1，X₂ ＝ -4.5，X₃ ＝ 0.9 であったならば R₁ ＝ 2，R₂ ＝ 3，R₃ ＝ 1 である．母集団は連続分布を仮定しているので，|X_i| は確率 1 ですべて互いに異なる値をとり，R_i は一意的に定まる．
　しかしながら，実際のデータでは測定精度などや測定値の丸めにより，標本値に同じ値が含まれることがよくある．このような場合をタイ（tie）があるという．タイがあるときは，タイとなったデータの順位となり得る値の平均を順位として与えるのが普通である．
　たとえば，X₁ ＝ 1.5，X₂ ＝ -0.3，X₃ ＝ 1.5， X₄ ＝ -2.8 であったとする．X₁ と X₃ は順位として 2 か 3 を取ったはずである．そこで，この値の平均 2.5 を順位として与える．この結果， R₁ ＝ 2.5，R₂ ＝ 1，R₃ ＝ 2.5， R₄ ＝ 4 となる．このようにすればタイのあるなしにかかわらず， ΣR_i ＝ n(n＋1)/2 となる．また，X_i ＝ 0 というデータが得られたときはこのデータはなかったものとして取り除いておくのは符号検定法と同じである．
　さて，X_i ＞ 0 のときの順位和を R₊， X_i ＜ 0 のときの順位和を R_- とおき，この両者のうち小さい方を T とおく．母集団分布が対称であるので，帰無仮説 H₀ ： ξ₀ ＝ 0 のもとでは R₊ と R_- の値はほぼ同じで， ΣR_i/2 ＝ n(n＋1)/4 に近いことが期待される．よって，T が小さいときには帰無仮説を棄却することができる．

表１．順位のあり得る組み合わせ（n＝4）
　１　２　３　４　 R₊ 　 R_- 　 T

＋＋＋＋ 10 0 0

－＋＋＋ 9 1 1

＋－＋＋ 8 2 2

＋＋－＋ 7 3 3

＋＋＋－ 6 4 4

－－＋＋ 7 3 3

－＋－＋ 6 4 4

－＋＋－ 5 5 5

＋－－＋ 5 5 5

＋－＋－ 4 6 4

＋＋－－ 3 7 3

－－－＋ 4 6 4

－－＋－ 3 7 3

－＋－－ 2 8 2

＋－－－ 1 9 1

－－－－ 0 10 0

　T の分布ようすを n ＝ 4 のときに考えてみよう．順位の値は 1，2，3，4 の 4 通りある．ある順位をとったデータが正であったか負であっかはまったくの偶然で決まる．そのあり得る組み合わせは表１に示すように全部で 16 通りである．どの組み合わせも同じ確率で起こるので，これにより T の分布が決定できる．
　たとえば，T ＝ 0 となるのは 2 通りであるので，その確率は 2/16 ＝ 0.125 と計算される．もし，T ＝ 0 のとき帰無仮説を棄却すると決めたならば，その有意水準は 0.125 となる．このように T の帰無仮説のもとでの分布を計算すれば，検定の有意確率が求まる．
　なお，n が大きいときは，

となることが知られているので，正規近似を用いて近似的な検定ができる．　　前節で取り上げた園芸療法での MSE の結果についての解析を再び行う．データを以下の表にまとめた．元データに差と符号と順位も付け加えた．このデータを用いて，園芸療法を施す前と後では，心理機能に差がないという帰無仮説，すなわち，

H₀：差＝ 0

の検定を行う．

符号検定

　差が 0 のデータを取り除くとデータ総数は16となった．16 例のうち，正の符号が 7，負の符号が 6 であるので，２項分布を用いて検定が行える．表２のデータが csv ファイル形式で R の作業フォルダに 'mse.csv' という名前であるとする．符号検定に対する R のスクリプトは以下のようになる．

mse <- read.csv("mse.csv") #データ読み込み

d <- mse$after - mse$before #処方後得点－処方前得点

np <- length(d[d > 0])

nm <- length(d[d < 0])

binom.test(c(np,nm))

結果：'＋'の確率＝ 0.5625，p 値＝ 0.8036 で帰無仮説は棄却されず，園芸療法が心理機能に変化を引き起こすとは認められなかった．

Wilcoxon の順位和検定

　差が 0 のデータを取り除くとデータ総数は16となった．R₊ ＝ 86， R_- ＝ 50 となった．検定の R のスクリプトは以下のようになる．

wilcox.test(d) #Wilcoxon 検定を行う関数

結果：p 値＝ 0.363 で帰無仮説は棄却されない．

t 検定

　比較のために t 検定も行った．

t.test(d)#t 検定を行う関数

結果：平均＝ 0.895，t 値＝ 1.1648（df ＝ 18），p 値＝ 0.2593 で帰無仮説は棄却されなかった．

データの吟味

　今回の調査では，クライアント全体では園芸療法の効果は認められなかった．また，MSE の満点が30点なので，元々心理機能に問題がなく満点近い得点のクライアントでは，効果が認められないのも当然といえる．その上，園芸療法処方の前後で半年程度のタイムラグがあるので，何もしなくても認知症の症状が進行する場合もあり，効果が検出しずらいこともある程度予測できる．そこで，データをよく調べるため，差と年齢のプロットを図１に行った．

図１．園芸療法の”効果”と年齢との関係

　これをみると，年齢が高いほど効果が減少しているようにみえる．そこで，多少「後づけ」ではあるがクライアントのうち若年層（ 85 歳以下）を取り出すことにした．若年層は 10 例となり，サンプルサイズはかなり小さくなった．

符号検定

　表３のデータで帰無仮説の検定を行う．R のスクリプトは以下の通り．

young <- (1:19)[mse$age<86] #年齢86歳未満のデータ番号を取得

d2 <- d[young]

np <- length(d2[d2 > 0])

nm <- length(d2[d2 < 0])

binom.test(c(np,nm))

結果：'＋'の確率＝ 0.8889，p 値＝ 0.03906 で，帰無仮説は 5％有意で棄却された．これより，高齢でない層では，園芸療法が心理機能に変化を引き起こすと認められた．

Wilcoxon の順位和検定

R₊ ＝ 42.5，R_- ＝ 2.5 となった． R のスクリプトは以下の通り．

wilcox.test(d2)

結果：p 値＝ 0.01955 で帰無仮説は 1% 有意ではないが，5% 有意で棄却された．

t 検定

t.test(d2)

結果：平均＝ 2.8，t 値＝ 3.3308（df ＝ 9），p 値＝ 0.008788 で帰無仮説は 1% 有意で棄却された．

２標本問題（two sample problem）

概要

　２つの母集団から無作為標本 X₁，…，X_m， Y₁，…，Y_n が抽出されたとする．等分散の正規性の仮定のもとでは，

X_i ～ N( μ_x，σ² )， Y_j ～ N( μ_y，σ² )

と仮定し，帰無仮説は，

H₀ ： μ_x ＝ μ_y

となる．標本平均 X^-，Y^- とこみにした標本不偏分散 s₂ を用いて t 検定を行う．
　ノンパラメトリック検定においては，無作為標本 X_i，Y_j がそれぞれの累積分布関数 F_x(・)，F_y(・) から抽出されたと考える．帰無仮説は，すべての z に対して

H₀ ： F_x(z ) ＝ F_y(z ) )

となる．

Mann-Whitney の U 検定

　順位和検定（rank-sum test）とも呼ばれる．2 つの母集団分布の平均的な位置の違いを検出する方法である．ある程度大きな標本数では t 検定の約 95% の検出効率である．　標本 X₁，…，X_m， Y₁，…，Y_n をまとめたものを Z_i，i＝1，…，m＋n と表す．すなわち，

Z_i ＝ X_i，i＝1，…，m， Z_i+m ＝ Y_i，i＝1，…，n

である．ここで，Z を小さいものから順に順位をつけこれを R_i とおく．もし，タイがあったときは前節と同様に平均順位を割り付ける．ここで，

とおく．すなわち，R_x は X_i の順位の和であり， R_y は Y_i の順位の和である． R_x ＋ R_y ＝ (m＋n＋1)(m＋n)/2 である．
　さて，U_x を X が Y より大きくなる個数とする．いま， X_i の順序統計量（大きさの順に並べたもの）を， X₁'，…，X_m' とし，これに対応する順位を R₁'，…，R_m' とおく．明らかに X₁' は R₁'－1 個の Y より大きく， X₂' は R₂'－2 個の Y より大きい．同様に考えて， X_m' は R_m'－m 個の Y より大きい．よって，

となる．同様に，

であり，U_x ＋ U_y ＝ mn が成立する．検定統計量 U は U_x と U_y のうち小さい方とする．X の分布と Y の分布が離れていれば U の値は小さくなるはずである．
　m，n の値が大きいときは，式（12）の帰無仮説のもとで，

または，

となることが知られているので，正規近似（1）を行って検定することができる．なお，この正規近似は m，n が 7 より大きければかなり正確であることも示されている．

Kolmogorov-Smirnov の 2 標本検定

　累積分布関数 F(・)，G(・) をもつ 2 つの母集団からそれぞれ大きさ m，n の無作為標本 X₁，…，X_m， Y₁，…，Y_n が抽出されたとする．このとき，

を経験（標本）累積分布関数という．標本 Y_i に対する経験累積分布関数を G_n(x ) としたとき，2 つの母集団からの経験累積分布の最大偏差

を求める．次に，

を求め，これを検定統計量として用いる．
　2 つの母集団の累積分布関数が等しいという帰無仮説のもとでの K の漸近分布（m，n → ∞ としたときの分布）から以下で定義される臨海値が求められている．すなわち，

であり，この値は表３に示されている．

表３．Kolmogorov-Smirnov 2 標本両側検定の臨界値
確率：γ 0.99 0.95 0.90 0.85 0.80

臨界値：k_γ 1.63 1.36 1.22 1.14 1.07

3-4．解析例

　前節では，心理機能検査（MSE）データを対のある 2 標本データとして解析した．この節では，このデータの園芸療法前データを対照とし，園芸療法後データを処理とみなして解析してみる．この場合，実際とは異なりこのデータの解析法としては正しくないが，対照 19 名，処理 19 名のデータとみなすわけである．

データ分布

　対照区と処理区とのデータ分布の違いを箱ひげ図でみる．R のスクリプトは以下のようになる．これを見ると，対照区と処理区で分布に大きな違いがないようにみえる．検定で確認してみよう．

boxplot(mse$before, mse$after, names= c("対照区","処理区"), ylab="MSE 得点", cex.axis=0.8)

Mann-Whitney の U 検定

　R のスクリプトは以下の通り．

wilcox.test(mse$after, mse$before)

結果：p 値＝ 0.6812 で帰無仮説は棄却されない．

t 検定

　R のスクリプトは以下の通り．

t.test(mse$after, mse$before, var.equal=T)

結果：t 値＝ 0.3725（df = 36），p 値＝ 0.7117 で帰無仮説は棄却されない．

Kolmogorov-Smirnov 検定

　まず，対照区と処理区の経験累積分布の重ね合わせのグラフを書き，両者の乖離の程度をみて検定を行う． R のスクリプトは以下の通り．

plot(ecdf(mse$before), do.points=F, verticals=T,xlab="MSE 得点", ylab="累積確率", xlim=range(mse$after,mse$before), main="")

plot(ecdf(mse$after), do.points=F, verticals=T, add=T, col.h='red', col.v='red')

title(main="MSE 得点の経験累積分布")

legend(locator(1), legend=c("処理","対照"), lty=c(1,1),col=c("red","black"))

ks.test(mse$after, mse$before)

結果：D ＝ 0.1053，p 値＝ 1 で帰無仮説は棄却されない．経験累積分布をみても両者はほとんど重なっている．

「若年層」のデータ分布

　前節の解析では，「若年層」のデータでは，園芸療法の効果の有意性が示された．対照区と処理区とみなした場合はどうなるか試してみる．R のスクリプトは以下の通り．これをみると，処理区の方が若干上の方にシフトしているようにみえる．検定で確認する．

boxplot(mse$before[young], mse$after[young], names= c("対照区","処理区"), ylab="MSE 得点", cex.axis=0.8)

title(main="高齢でない層の MSE の得点分布", cex.main=1.0)

Mann-Whitney の U 検定

　R のスクリプトは以下の通り．

wilcox.test(mse$after[young], mse$before[young])

結果：p 値＝ 0.4452 で帰無仮説は棄却されない．

t 検定

　R のスクリプトは以下の通り．

t.test(mse$after[young], mse$before[young], var.equal=T)

結果：t 値＝ 0.7368（df = 18），p 値＝ 0.4707 で帰無仮説は棄却されない．

Kolmogorov-Smirnov 検定

　まず，対照区と処理区の経験累積分布の重ね合わせのグラフを書き，両者の乖離の程度をみて検定を行う． R のスクリプトは以下の通り．

plot(ecdf(mse$before[young]), do.points=F, verticals=T,xlab="MSE 得点", ylab="累積確率", xlim=range(mse$after[young],mse$before[young]), main="")

plot(ecdf(mse$after[young]), do.points=F, verticals=T, add=T, col.h='red', col.v='red')

title(main="高齢でない層の MSE 得点の経験累積分布", cex.main=0.8)

legend(locator(1), legend=c("処理","対照"), lty=c(1,1),col=c("red","black"))

ks.test(mse$after[young], mse$before[young])

結果：D ＝ 0.3，p 値＝ 0.7591 で帰無仮説は棄却されない．経験累積分布をみると，両者に多少の「ずれ」が認められるが，有意な「ずれ」ではなかった．

正規母集団の母分散に対する検定

母集団分散の検定

　　平均 μ，分散 σ² がともに未知である正規母集団に対して，

帰無仮説 H₀： σ² ＝ σ₀²

対立仮説 H₁： σ² ≠ σ₀²

の検定を考える．　いま，母集団から大きさ n の無作為標本 x₁，x₂，…，x_n を抽出したところ，標本平均が x^-，標本分散が s² であったとする．すると，帰無仮説ももとで（under H₀），標本分散に関係した量が，

と自由度 n - 1 の χ² 分布に従うので，U を検定統計量にして検定が行える．

　有意水準 5 ％の検定は，自由度 n - 1 の χ² 分布の 2.5％点と 97.5％点をそれぞれ χ²(n - 1)_0.025， χ²(n - 1)_0.975 とすると，

U ＜ χ²(n - 1)_0.025， U ＞ χ²(n - 1)_0.975

のいずれかの不等式を満たしたとき帰無仮説を棄却し，母分散は σ₀² と有意に異なると結論づける．

２つの母集団分散の同等性の検定

　２つの母集団 A，B があり，それぞれが平均を μ_A，μ_B，分散を σ_A²，σ_B² の正規分布に従っているが，その値は未知であるとする．このとき，２つの母分散の同等性の検定，

帰無仮説，H₀： σ_A² ＝ σ_B²

対立仮説，H₁： σ_A² ≠ σ_B²

の検定を考える．

　母集団 A から大きさ n_A，母集団 B から大きさ n_B の標本を抽出した．母集団 A からの標本の標本平均が x^-_A，標本分散が s_A² であり，母集団 B の標本平均が x^-_B，標本分散が s_B² であるとする．すると，標本分散に関係した量はそれぞれ

と χ² 分布に従い，それぞれが独立である．これらの量の比は，

のように，自由度 n_A - 1，n_B - 1 の F 分布に従う．

　ところで，帰無仮説が正しいとすると，σ_A² ＝ σ_B² とおけるので，母集団の分散比は，γ₀ = σ_A²/σ_B² = 1，となる．このとき，標本分散の分散比の統計量 γ が，

と，自由度 n_A - 1，n_B - 1 の F 分布に従うので，この γ 値を検定統計量にして２つの母分散が等しいという帰無仮説の検定が行える．
　すなわち，有意水準 5 ％の検定を行うには，自由度 n_A - 1，n_B - 1 の F 分布の 2.5％点と 97.5％点をそれぞれ F(n_A - 1，n_B - 1)_0.025， F(n_A - 1，n_B - 1)_0.975 とすると，検定統計量 γ が，

γ ＜ F(n_A - 1，n_B - 1)_0.025， γ ＞ F(n_A - 1，n_B - 1)_0.975，

のいずれかの不等式を満たしたとき帰無仮説を棄却し，２つの母集団の分散は有意に異なると結論づける．

２つの母集団の分散比の信頼区間

　２つの母集団 A，B の分散 σ_A²，σ_B² の分散比， γ₀ = σ_A²/σ_B²，の 95％信頼区間は，上記の考えから簡単に求めることができる．すなわち，互いに独立に χ² 分布する変量の比が，標本分散の分散比 γ と母集団分散比 γ₀ の比となり，

と分布する．これより，母集団分散比の 95％信頼区間は，

となる．

園芸療法区と対照区の MSE 得点
　前節では，心理機能検査（MSE）データを，検定の勉強に用いるため，対照区と処理区とみなして平均の比較をおこなった．両区の分散の等質性が疑われるので，分散の等質性の検定を行ってみる．

# 分散等質性の R スクリプト
engei <- read.csv("engei.csv") # csv データ読み込み　
x <- engei$療法前 # 園芸療法前の MSE 得点を x に格納（変数名で指定）　
y <- engei$療法後 # 園芸療法後の MSE 得点を y に格納（変数名で指定）　
var(x) # 対照区の標本分散　
var(y) # 処理区の標本分散　
var.test(x, y) # 分散の等質性の検定　

課題：分散の等質性検定で表示される数値を R の基本統計関数を用いて出せ．

分散比 F 検定の検出力
　２つの母集団の分散の違いはどれくらいあれば検出可能であるか，シミュレーションで調べる．
　まず，真の分散比が１のときを N = 10000 回シミュレーションし，正しい有意水準が得られるかを確認する．次に，真の分散比が２のときの検出力を２つの母集団からそれぞれ n = 20 のサンプルを抽出して行う．
分散の推定精度は標本の大きさ（サンプルサイズ）の影響を大きく受けると考えられるので，いくつかのサンプルサイズで試す．

**#分散比 F 検定の検出力の R スクリプト**
N <- 10000	# シミュレーション回数
n <- 20	# サンプルサイズ
s1 <- 1; s2 <- 2	# 母集団分散（分散比 = 2）
n1 <- rnorm(N*n, mean=0, sd=sqrt(s1))	# 正規乱数
n2 <- rnorm(N*n, mean=0, sd=sqrt(s2))	# 正規乱数
n1.mat <- matrix(data=n1, ncol=n)	# N×n データ行列（母集団１）
n1.var <- apply(n1.mat, 1, var)	# 各行の分散
n2.mat <- matrix(data=n2, ncol=n)	# N×n データ行列（母集団２）
n2.var <- apply(n2.mat, 1, var)	# 各行の分散
ratio <- n2.var/n1.var	# 分散比
f0 <- qf(0.025, df1=(n-1), df2=(n-1))	# F 分布2.5％点
f1 <- qf(0.975, df1=(n-1), df2=(n-1))	# F 分布97.5％点
m0 <- length(ratio[ratio < f0])	# 2.5％以下の個数
m1 <- length(ratio[ratio > f1])	# 97.5％以下の個数
m0+m1	# 帰無仮説を棄却した個数
mf <- ceiling(max(ratio))	# 分散比の最大値
hist(ratio, breaks=seq(0, mf, by=0.2), probability=TRUE, xlab="分散比", ylab="密度", main="")
abline(v=f0, col="red")	# F 分布2.5％点の表示
abline(v=f1, col="red")	# F 分布97.5％点の表示
title(main="分散比のヒストグラムと有意となった個数")	#

課題

問題４－２：淡水性ウナギの汽水域での生理活性の違いのデータ、ウナギデータ，を２標本データとして違いを検定せよ．ただし，２母集団で分散の違いがあるようなので，まず，分散の同等性の検定を行い，違いが認められるときは，データの対数変換を行うなどして，分散安定化変換を行って t 検定を行ってみよ．また，データの対数変換などを行わず．ウェルチ検定やノンパラメトリック検定を行った場合との比較検討を行え．

成功確率（比率）に関する検定

標準正規分布による近似検定（大標本理論）

　成功確率 p のベルヌイ試行を n 回行ったときの成功回数 X は， X ～ B(n, p)，のように２項分布に従う．X の平均と分散はそれぞれ， E[X ] = np，Var[X ] = np(1 - p)，である．
　ここで，成功確率が p₀ であるという帰無仮説，

H₀： p = p₀

の検定を考える．帰無仮説のもとでは，成功回数 X は，X ～ B(n, p₀)，と分布するので，X をその平均と標準偏差で標準化すると，中心極限定理から，

のように標準正規分布に漸近的に従う．
　これより，近似的な 5％両側検定は，標準正規分布の 97.5％分位点の z₀ = 1.96 より検定統計量 T = |z| の値が大きくなったとき帰無仮説を棄却することで得られる．なお，二項分布は離散的なので，Yates（イエーツ）の連続性の補正を行った検定統計量を用い，

のとき帰無仮説を棄却する方が近似の精度がよいと言われている．

　このように，中心極限定理を利用して，標準正規近似を行って検定を行うやり方を大標本（large sample）理論といい，コンピュータが発達する以前はもっぱら大標本理論に基づいた検定を行っていたが，現在では正確な確率が短時間で計算できるので，大標本理論の重要性は大きく低下したといえる．

比率の正規近似に基づく信頼区間

　成功確率 p のベルヌイ試行を n 回行ったとき x 回成功したとすると，成功確率は， p^{^} = x/n，と推定される．この推定値は最尤推定値である．
　成功回数 x は二項分布し，その平均は E[x ] = np，分散は Var[x ] = np(1 - p)，であるので，成功確率推定量 p^{^} の平均は E[p^{^} ] = E[x/n] = p，分散は Var[p^{^} ] = Var[x/n] = Var[x ]/n² = p(1 - p)/n，となる．これより，

と漸近的に分布するので，標準正規分布の 97.5％点の z₀ = 1.96 を用いると，近似的に

という不等式が成り立つ．これを整理すると，

という p の２次不等式を解くことに帰着する．いま，p の２次方程式の根を

とすると，この根を用い，p の 95％信頼区間は近似的に

となる．
　また，連続性の補正を行うには，成功確率の推定値 p を，信頼区間の下限と上限でそれぞれ

というように変えて，信頼区間が少し広くなるようにする． R では，これらの式を用いて信頼区間を構成しているようである．

　ここで，さらに近似を加えて，z₀² の項を消去すると， p の２次方程式の根は，

となるので，p の近似的な 95％信頼区間は，

と簡略化される．
　なお，この信頼区間は，成功確率推定量 p^{^} の分散において，真の成功確率 p の代わりにその推定量 p^{^} に置き換えて，Var[p^{^} ] = p^{^}(1 - p^{^})/n，とみなした場合と同じで，この信頼区間は教科書等でよく出てくる．
　簡略化された信頼区間で連続性の補正を入れるには，

として，信頼区間の幅を拡げる．

　ところで，正規近似による信頼区間の構成では，場合により信頼区間が負になったり 1 を超えることがあるが，このときは，0 と 1 で切り詰める．

二項確率の計算による正確な検定

　現在では二項確率が　R などのコンピュータソフトにより直接計算できるので，正規分布による近似検定を行う意味はあまりないといえる．直接計算のやり方を簡単な例で考えてみる．
　成功確率の正確な検定の例として，n = 10 回の試行で x = 7 回の成功が観察されたベルヌイ試行で，

帰無仮説：H₀： p ＝ 0.4

対立仮説：H₁： p ≠ 0.4

の検定を行ってみる．
　まず上側確率を求める．帰無仮説のもとで，x = 7 回の成功が得られる確率を q₇ とすると，これ以上の成功回数 8 回，9 回，10 回が得られる確率，q₈，q₉，q₁₀，を加え合わせる．これらは，

となり，上側確率は，

となる．
　下側確率は，帰無仮説のもとで，x = 0，1，…，回の成功が得られる確率で q₇ より小さいものを， q₀，q₁，…，と求める．これらは，

となり，q₂ ＞ q₇ なので，求める下側確率は，

となる．
　これより p 値は，

P_upper + P_lower ＝ 0.05476188 + 0.0463574 ＝ 0.1011193

となる．

二項確率の近似検定と正確な検定
　いま，A と B で将棋に強さに違いがあるかを調べるため，10回対戦させたところ，A の 7 勝 3 敗であった．この結果から A と B で将棋の強さに違いがあると言えるかを考えてみる．A の B に対する勝率を p とすると，帰無仮説は，A と B で将棋に強さに違いがないなら勝敗は５分５分であろうと考える．また，対立仮説は， A と B で将棋がどちらが強いか不明なので，両側とする．すなわち，

H₀： p ＝ 0.5

H₁： p ≠ 0.5

の検定を行う．ところで，比率の検定では，通常，Yates の補正を行った正規近似で検定されてきた．ここで，正確な検定との比較を行う．

# 二項確率の検定の R スクリプト
r <- 7; n <- 10 # 成功回数と試行回数　
prop.test(r, n, p=0.5, correct=F) # H₀：p = 0.5 の正規近似検定（補正なし）　
prop.test(r, n, p=0.5) # H₀：p = 0.5 の正規近似検定（連続性の補正）　
binom.test(r, n, p=0.5) # 二項確率に基づく正確な検定　
binom.test(r, n, p=0.4) # p = 0.4 の検定　

課題：試行回数と成功回数をともに増やして（n = 30），同様な検定を行え．

テレビ視聴率
　テレビ視聴率は，視聴率の高い番組ほど多くの視聴者が見ているので，広告宣伝の効果が高く影響力が強いと考えられている．このため，視聴率の高さが広告宣伝費用に反映されるので，テレビ会社は高い視聴率を得ようとして番組を製作している．
　ある調査会社のデータによると，関東地区では 600 世帯を対象にしているようである．
課題：ビデオリサーチ社によると，NHK 大河ドラマの関東地区世帯視聴率は26.2％であった．真の世帯視聴率の 95 ％信頼区間を求めよ．

適合度検定

Pearson χ² 検定

　前節の比率の検定は，χ² 分布を用いる適合度検定と大きな関係がある．ここでは n 回のベルヌイ試行で X 回成功したときに，成功確率が p₀ であるという，

帰無仮説，H₀： p ＝ p₀，対立仮説，H₁： p ≠ p₀，

の検定を考えた．そこでは，X を標準化して標準正規分布にもって行ったが，これを２乗して χ² 分布を用いることもできる．すなわち，

という関係がある．
　ところで，n 回のベルヌイ試行の結果と帰無仮説のもとでの期待値を表にすると，

	成　功	失　敗
観測度数	X	n - X
期待度数	np₀	n(1 - p₀)

となる．ここで，ピアソン（Pearson）のχ² 値，

を計算すると，

となる．つまり，χ² 値は，試行回数 n が大きくなるにつれて帰無仮説のもとで自由度 1 の χ² 分布に漸近的に従う．よって，これより検定が行える．

成功，失敗確率の適合度検定
　前節で行った A と B で将棋の強さに違いがあると言えるかの検定を，χ² 値を用いたピアソンの適合度検定で行ってみる．適合度検定では，R ではなぜか連続性の補正ができない．

# 適合度検定の R スクリプト
r <- 7; n <- 10 # 成功回数と試行回数　
x <- c(r, n-r) # 成功回数と失敗回数のベクトル　
p0 <- c(0.5, 0.5) # 成功確率と失敗確率の帰無仮説　
chisq.test(x, p=p0) # ピアソン χ² 適合度検定　

確率分布との適合度

確率分布が既知のとき

　データが想定している確率分布に適合しているかは，ピアソン（Peason）の χ² 適合度検定で行うことができる．いま，離散分布の，たとえば m = 5 のセルに対して，観測されたカウントデータと対応する想定確率が，

	セル１	セル２	セル３	セル４	セル５	計
観測度数	n₁	n₂	n₃	n₄	n₅	n
想定確率分布	p₁	p₂	p₃	p₄	p₅	1

のようになっていたとする．このとき，ピアソン（Peason）の χ² 値は，

のように近似的に自由度 m - 1 の χ² 分布に従う．これにより，データが想定確率分布に適合しているかの検定が行える．検定の帰無仮説は，

H₀：データは想定確率分布に従う．

である．　この近似は n が大きく，各セルの度数 n_i が 5 以上であることが望ましい，とされている．　一方，正規分布などの連続分布では，適当に階級分けして離散化すればこの検定が行える．ただし，階級分けは任意なので，階級分けのやり方によっては結果が異なる恐れがある．

二項分布
　二項分布の場合にピアソン（Peason）の χ² 値がどの程度 χ² 分布で近似されるかをみてみる．成功確率 p = 1/3 の試行を m = 6 回行ったときの成功回数 x の分布は二項分布 B(6, 1/3) に従う．これを n = 100 回行ったとすると，期待度数は，

成功回数	0 回	1 回	2 回	3 回	4 回	5 回	6 回	計
期待観測度数	8.8	26.3	32.9	22.0	8.2	1.7	0.1	100

となり，成功回数 5 回と 6 回は期待度数が小さいのでこれらをまとめ，成功回数 4 回以上とする．すると，成功回数のセル数は 5 となる．　n = 100 回を 1 回行うと観測度数が得られるので，χ² 値が計算される．これを， N = 10000 回行うと，帰無仮説が正しいときの χ² 値の分布がシミュレートされる． χ² 値のヒストグラムを自由度 5 - 1 = 4 の χ² 分布と比べればよい．　また，自由度 4 の χ² 分布の 95％分位点の値と比較して名目上の第１種の過誤が達成されているかをみる．

# 二項分布適合度検定シミュレーションの R スクリプト
N <- 10000 # シミュレーション回数　
m <- 6 # 試行１回でのベルヌイ試行の数　
n <- 100 # 二項確率の試行数　
p0 <- dbinom(x=0:6, size=6, p=1/3) # 二項確率 B(6, 1/3) 　
w <- rbinom(n, m, p=1/3) # n = 100 回の試行での成功回数（観測値）の系列）
tw <- table(factor(w,levels=0:m)) # 成功回数の表（データ）　
r <- chisq.test(tw, p=p0) # データと二項確率との適合度検定　
p1 <- c(p0[1:4], p0[5]+p0[6]+p0[7]) # 少ない確率をまとめた二項確率　
y <- NULL # χ² 値のベクトル
for(i in 1:N){ # 　
w <- rbinom(n, m, p=1/3) # n = 100 回の試行での成功回数（観測値）の系列）
fw <- table(factor(w,levels=0:m)) # 成功回数の表（データ）　
tw <- c(fw[1:4], fw[5]+fw[6]+fw[7]) # 成功回数 5，6，7 をまとめる
r <- chisq.test(tw, p=p1) # 適合度検定の χ² 値
y <- c(y, r$statistic) # 　
} # 　
my <- ceiling(max(y)) # y の最大値を超える最小の整数
mean(y) # 平均（真値 = 4）　
var(y) # 分散（真値 = 8）　

hist(y, breaks=seq(0,my,by=0.5),freq=FALSE,xlim=c(0,20),xlab="χ2 値",ylab="頻度",main="")
x <- seq(0,20, by=0.1) # 　
curve(dchisq(x, 4), 0, 20, add=T, col=2) # 自由度 4 χ² 分布　
title(main="二項分布の適合度と自由度 4 カイ自乗分布") # 　
q0 <- qchisq(0.95,df=4) # χ²(4) の 95％点　
segments(q0,0, q0,0.1, col="red") # 棄却域　
pv <- length(y[y>q0])/N # 　
s <- paste("有意水準 = ", pv) # 帰無仮説の棄却率（真値 = 0.05）　
text(15,0.06, s) # 　

確率分布のパラメータをデータから推定する場合

　確率分布のタイプ（二項分布やポアソン分布など）は想定できるが，パラメーターはデータから推定することが普通であろう．このときは，推定されたパラメーターのもとでの推定確率分布を用いて，セル数が m = 5 のときは，

	セル１	セル２	セル３	セル４	セル５	計
観測度数	n₁	n₂	n₃	n₄	n₅	n
推定確率分布	p^{^}₁	p^{^}₂	p^{^}₃	p^{^}₄	p^{^}₅	1

のような表ができる．推定したパラメーターの数が k であったとすると，このとき，ピアソン（Peason）の χ² 値は，

のように近似的に自由度 m - k - 1 の χ² 分布に従う．これにより，データが推定確率分布に適合しているかの検定が行える．

二項分布
　成功確率を推定する二項分布の場合にピアソン（Peason）の χ² 値がどの程度 χ² 分布で近似されるかをみてみる．成功確率 p = 1/3 の試行を m = 6 回行ったときの成功回数 x の分布は二項分布 B(6, 1/3) に従う．これを n = 100 回行ったとすると，たとえば，

成功回数	0 回	1 回	2 回	3 回	4 回	5 回	6 回	計
観測度数	12	18	25	32	13	0	0	100

のようなデータがえられる．このときの成功確率の推定値は， p^{^} = Σ x_i / (mn) = 0.36，となる．この推定確率から二項分布の確率分布を出し，χ² 値を計算する．この場合，成功確率をデータに合わせているので，先ほどの p = 1/3 よりは χ² 値は小さくなるはずである．このため，χ² 分布の自由度を小さくする必要がある．
　成功回数 5 回と 6 回は観測度数が小さいのでこれらをまとめ，成功回数 4 回以上とする．すると，成功回数のセル数は 5 となる．また，推定パラメーター数は 1 である．
　n = 100 回を 1 回行うと観測度数が得られるので，χ² 値が計算される．これを， N = 10000 回行うと，帰無仮説が正しいときの χ² 値の分布がシミュレートされる． χ² 値のヒストグラムを自由度 5 - 2 = 3 の χ² 分布と比べればよい．　また，自由度 3 の χ² 分布の 95％分位点の値と比較して名目上の第１種の過誤が達成されているかをみる．

# 二項分布適合度検定シミュレーションの R スクリプト
N <- 10000 # シミュレーション回数　
m <- 6 # 試行１回でのベルヌイ試行の数　
n <- 100 # 二項確率の試行数　
y <- NULL # χ² 値のベクトル
for(i in 1:N){ # 　
w <- rbinom(n, m, p=1/3) # n = 100 回の試行での成功回数（観測値）の系列）
pd <- mean(w)/m # データのもとでの推定成功確率　
p0 <- dbinom(x=0:6, size=6, p=pd) # 推定成功確率のもとでの二項確率分布
p1 <- c(p0[1:4], p0[5]+p0[6]+p0[7]) # 少ない確率をまとめた二項確率
fw <- table(factor(w,levels=0:m)) # 成功回数の表（データ）　
tw <- c(fw[1:4], fw[5]+fw[6]+fw[7]) # 成功回数 5，6，7 をまとめる
r <- chisq.test(tw, p=p1) # 適合度検定の χ² 値
y <- c(y, r$statistic) # 　
} # 　
my <- ceiling(max(y)) # y の最大値を超える最小の整数
mean(y) # 平均（真値 = 4）　
var(y) # 分散（真値 = 8）　

hist(y, breaks=seq(0,my,by=0.5),freq=FALSE,xlim=c(0,20),xlab="χ2 値",ylab="頻度",main="")
x <- seq(0,20, by=0.1) # 　
curve(dchisq(x, 3), 0, 20, add=T, col=2) # 自由度 3 χ² 分布　
title(main="二項分布の適合度と自由度 3 カイ自乗分布") # 　
q0 <- qchisq(0.95,df=3) # χ²(3) の 95％点　
segments(q0,0, q0,0.1, col="red") # 棄却域　
pv <- length(y[y>q0])/N # 　
s <- paste("有意水準 = ", pv) # 帰無仮説の棄却率（真値 = 0.05）　
text(15,0.06, s) # 　

Weldon のサイコロ実験の適合度検定
前期であつかった Weldon のサイコロ実験の適合度検定を行ってみる． 12個のサイコロを同時に投げ，5か6の目が出た個数をカウントした．

   5,6の個数       0    1    2    3    4    5

出た回数    185       1149       3265       5475       6114       5194

   5,6の個数       6    7    8    9 10 以上    合計

出た回数    3067       1331       403       105       18    26306

# サイコロ実験適合度検定の R スクリプト
x <- 0:10 # 5,6の個数　
y <- c(185,1149,3265,5475,6114,5194,3067,1331,403,105,18) # 出た回数　
m <- sum(x*y)/sum(y) # 出た回数の平均　
pd <- m/12 # 5，6 の出る確率の推定値　
p <- dbinom(x=0:12, size=12, p=1/3) # 正しいサイコロ（p = 1/3）のときの確率分布　
p0 <- c(p[1:10], p[11]+p[12]+p[13]) # 出る回数 10 回以上をまとめた確率分布　
rbind(y, p0*sum(y)) # 観測度数とモデルのもとでの期待度数　
chisq.test(y, p=p0) # データが p = 1/3 の二項分布に従っていることの検定
q <- dbinom(x=0:12, size=12, p=pd) # データから推定された確率に基づく二項分布　
q0 <- c(q[1:10], q[11]+q[12]+q[13]) # 出る回数 10 回以上にまとめた確率分布　
rbind(y, q0*sum(y)) # 観測度数とモデルのもとでの期待度数　
r <- chisq.test(y, p=q0) # データが p = pd の二項分布に従っていることの検定　
pchisq(r$statistic, df=r$parameter-1, lower.tail=F) # 有意確率（自由度１落とす）　

課題：「Weldon のサイコロ実験」と同様に「12人の兄弟中の女児数のデータ」に対して二項分布に対する適合度検定を行え．

英語得点データの正規分布との適合度検定
　英語得点データの標本平均と標本分散を，正規分布の平均と分散とみなして正規分布をあてはめた． Q - Q プロットでみると，下の方の得点分布とあてはまりが悪いようにみえる．
　χ² 適合度検定を行うため，40 点以下と 41 点から 50 点，70 点以上をそれぞれ１つの階級とし， 51 点から 70 点までは 5 点きざみの階級にして，全部で 7 セルに離散化した．すると，以下の表のようにまとめられた．これに合わせて，正規分布を 7 区間に区切り，各区間ごとの確率を累積分布関数を用いて計算すれば，期待度数を求めることができる．χ² 適合度検定では，自由度をパラメーター分（平均，分散）の 2 つ減らす．

英語得点データ
   得点    40 未満 41 ～ 50 51 ～ 55 56 ～ 60 61 ～ 65 66 ～ 70 70 以上

人数    6        9        12        13        17        14        9

期待度数    4.33        13.95        11.91        13.60        12.93        10.24        13.06

　しかしながら，英語得点データのように正規分布などの連続分布をデータにあてはめた場合のあてはまりの良さを調べる場合，χ² 適合度検定は，離散化に恣意性が入るのであまり薦められない．連続型データの場合は，次に述べる Kolmogorov-Smirnov 検定を用いるのが普通である．

英語得点データの正規分布との Kolmogorov-Smirnov 検定
　累積分布関数 F(・) を持つと想定される母集団から，大きさ n の無作為標本，X₁，…，X_n，が抽出されたとする．このとき，

を経験（標本）累積分布関数という．この経験累積分布関数と母集団の累積分布関数との最大偏差，

を検定統計量とする．　標本が累積分布関数 F(・) を持つ母集団から抽出されたならば，最大偏差 D はそれ程大きくないと考えられる．帰無仮説，

H₀：標本は分布 F(・) から由来した

を最大偏差 D を用いて検定する方法を，Kolmogorov-Smirnov １標本検定と言う．Kolmogorov-Smirnov 検定には，２つの経験累積分布関数が同じ分布から由来したかを検定する Kolmogorov-Smirnov ２標本検定もある．

# 英語得点の正規分布適合度検定の R スクリプト
eigo <- c( 36,70,56,68,76,60,50,63,62,42,64,60,50,68,71,67, # 英語得点データ

50,65,67,57,72,64,61,66,46,80,46,51,59,32,55,65, 65,52,57,64,23,57,53,54,38,71,57,69,77,61,51,64,

63,43,65,61,51,69,72,68,53,66,68,58,73,65,62,67, 47,81,47,52,59,33,56,66,67,52,58,65,24,58,54,55)

d <- 5 # ヒストグラムの階級幅　

op <- par(mfrow = c(1, 2)) # グラフを横に２つ並べて表示　

hist(eigo, breaks=seq(0, 100, by=d), xlab="英語得点", ylab="頻度", main="")

n <- length(eigo) # データ数　
m <- mean(eigo) # 平均　
s <- sd(eigo) # 標準偏差　
x <- 0:100 # 　
curve(n*d*dnorm(x, m, s), 0, 100, add=TRUE, col="red") # 推定正規分布重ねて表示　
title(main="英語得点のヒストグラム") # 　

qqnorm(eigo, xlab="正規分布分位点", ylab="英語得点分位点", main="")

qqline(eigo, col=2) # Q-Q プロット　
title(main="正規 Q - Q プロット") # 　
par(op) # 　
a <- c(0,40,50,55,60,65,70,100) # 階級の区切り点の定義　
b <- hist(eigo, breaks=a) # 各セルに入る人数の計算　
y <- b$counts # セルの観測度数　
l <- length(a) # 　
p <- pnorm(a[2:(l-1)], mean=m, sd=s) # 階級の区切りまでの累積確率　
ps <- c(0, p) # 　
pe <- c(p, 1) # 　
q <- pe-ps # セルの確率分布　
rbind(y, sum(y)*q) # セルの観測度数と期待度数　
r <- chisq.test(y, p=q) # χ² 適合度検定　
pchisq(r$statistic, df=r$parameter-2, lower.tail=F) # 有意確率（自由度 2 落とす）　

plot(ecdf(eigo), xlab="英語得点", do.points=F, ylab="累積確率", main="")

curve(pnorm(x, m, s), 0, 100, add=TRUE, col="red") # 正規分布の累積分布　
title(main="英語得点の標本累積分布") # 　
ks.test(eigo, "pnorm", m, s) # Kolmogorov-Smirnov １標本検定　

課題： 英語得点データでは 25 点以下の 2 名が他の集団から離れているようにみえる．この 2 名を異常値（out-lier）としてデータから除き，正規分布との適合度検定を行い，あてはまりがどう変化したかを考察せよ．

参考文献

心理・教育のための統計法（第 2 版），山内光哉，1998，サイエンス社
工学のためのデータサイエンス入門－フリーな統計環境Rを用いたデータ解析－，間瀬茂ら，2004，数理工学社
実践生物統計学－分子から生態まで－（第 1 章，第 2 章），東京大学生物測定学研究室編（大森宏ら）， 2004，朝倉書店
R で学ぶデータマインニング I －データ解析の視点から－，熊谷悦生・船尾暢男，2007，九天社
R で学ぶデータマインニング II －シミュレーションの視点から－，熊谷悦生・船尾暢男，2007，九天社

1 + 1		#数値演算
x <- c(2, 3, 5)		#ベクトルの定義
y <- c(10, 14, -7)
x + y		#ベクトルの和
2x		#ベクトルのスカラー倍
sum(x)		#ベクトル要素の和
1:10		#連続した値
x <- 1:10		#
y <- c(1,3,2.8,2.5,3,3.5,3.8,4,3.5,3.6)		#
length(y)		# y の長さ
plot(x, y)		#グラフ表示
plot(x, y, type="l")		#グラフ表示

length(eigo)		#データ数
mean(eigo)		#標本平均
var(eigo)		#標本分散
sd(eigo)		#標本標準偏差
boxplot(eigo, main="英語得点の箱ヒゲ図")		#箱ひげ図
boxplot.stats(eigo)		#箱ひげ図用統計量
hist(eigo, breaks=seq(0, 100, by=5), xlab="英語得点", ylab="頻度", main="")
title(main = "英語得点のヒストグラム")		#グラフタイトル
stem(eigo, scale=2)		#幹葉表示

偏差を標本標準偏差（SD）で割ったもの．
標準化データ（z_i）の平均は 0，標準偏差は 1，（分散も1）

変数 X	x₁	x₂	x₃	x₄	x₅
確率 P	p₁	p₂	p₃	p₄	p₅

x <- 0:12	#個数
dice <- c(185,1149,3265,5475,6114,5194,3067,1331,403,105,18,0,0)	#回数データ
sum(dice)	#試行回数
pdice <- dice/sum(dice)	#回数の確率
m <- sum(x*pdice)	#平均
p <- m/12	#5，6の出る確率
s2 <- sum(pdice*(x-m)^2)	#分散
v <- 12p(1-p)	#二項分布のもとでの分散
h1 <- dbinom(x, 12, 1/3)	#正しいサイコロのもとでの二項確率分布
h2 <- dbinom(x, 12, p)	#推定確率からの二項確率分布
dicedis <- rbind(pdice,h2,h1)	#行ベクトル－＞行列
colnames(dicedis) <- as.character(0:12)	#列の名前
barplot(dicedis, beside=TRUE, cex.axis=0.8, cex.lab=1.0, xlab="5,6の個数", ylab="確率", legend=c("データ","p=0.338", "p=0.333"))
title(main="Weldon のサイコロ実験の分布")	#グラフタイトル

x <- 0:8	#グラフのx軸の範囲
lam <- 2	#λの定義
yp <- dpois(x,lam)	#ポアソン分布の確率密度
y1 <- dbinom(x, 5, 0.4)	#二項分布（n = 5，p = 0.4）の確率密度
y2 <- dbinom(x, 10, 0.2)	#二項分布（n = 10，p = 0.2）の確率密度
y3 <- dbinom(x, 20, 1/10)	#二項分布（n = 20，p = 0.1）の確率密度
y4 <- dbinom(x, 40, 1/20)	#二項分布（n = 40，p = 0.05）の確率密度
plot(x, y1, type="b", ylab="確率")	#二項分布（n = 5，p = 0.4）のプロット（黒）
points(x, y2, type="b", col="green")	#二項分布（n = 10，p = 0.2）のプロット（赤）
points(x, y3, type="b", col="blue")	#二項分布（n = 20，p = 0.1）のプロット（青）
points(x, y4, type="b", col="purple")	#二項分布（n = 40，p = 0.05）のプロット（紫）
points(x, yp, type="b", col="red")	#ポアソン分布のプロット（赤）
title(main="二項分布（np = 2）がポアソン分布に近づく様子")
# 凡例の記述（locator(1)は，凡例の記述場所をクリックで指定）
legend(locator(1), c("p=0.4", "p=0.2", "p=0.1", "p=0.05", "ポアソン"),
lty=1, col=c("black", "green", "blue", "purple", "red"))

x <- 57:77	# 身長（x）の範囲
y <- c(2, 4, 14, 41, 83, 169, 394, 669, 990, 1223, 1329,	# 身長ごとのデータ
1230, 1063, 646, 392, 202, 79, 32, 16, 5, 2)	#
s <- sum(y)	# データ総数
m <- sum(x*y/s)	# データの平均
v <- sum(y/s*(x-m)^2)	# データの分散
plot(x, y/s, type="h", xlab="身長（インチ）", ylab="頻度")	# データの棒グラフ表示
curve(dnorm(x, m, sqrt(v)), 57, 77, add=T, col="red")	# 正規密度のグラフ表示
title(main="身長データに対する正規分布のあてはめ")	# タイトル

n <- 5	# 打数
x <- 0:n	# xの範囲
p <- 0.3	# 打率
hit <- dbinom(x, size=n, prob=0.3)	# 二項確率
y <- pbinom(x, size=n, prob=0.3)	# 二項累積確率
m <- n*p	# 平均
sd <- sqrt(np(1-p))	# 標準偏差
op <- par(mfrow = c(1, 2))	#
plot(x, hit, type="h", ylim=c(0,0.4), xlim=c(0,7), xlab="ヒット数", ylab="確率密度")
curve(dnorm(x, mean=m, sd=sd), add=TRUE, col="red")	# 確率密度
plot(x, y, type="s", ylim=c(0,1), xlim=c(0,7), xlab="ヒット数", ylab="累積確率")
curve(pnorm(x, mean=m, sd=sd), add=TRUE, col="red")	# 累積確率
par(op)	#
title(main ="二項分布：n = 5 打数，打率 p = 0.3；正規分布：N(1.5, 1.05) ")

x <- 57:77	# 身長の範囲
y <- c(2, 4, 14, 41, 83, 169, 394, 669, 990, 1223, 1329, 1230, 1063, 646, 392, 202, 79, 32, 16, 5, 2)
hei <- NULL	# 身長ごとのカウント
for(i in 1:length(x))	#
hei <- c(hei, rep(x[i], y[i]))	# カウントデータを個人データに変換
qqnorm(hei, xlab="正規分布分位点", ylab="データ分位点", main="")	# 正規 Q - Q プロット表示
qqline(hei, col="red")	# 正規分布の直線表示
title(main="英国人成人男子身長の正規 Q-Q プロット")	# グラフタイトル

N <- 10000	# 乱数列の長さ
hit <- rbinom(N, size=100, prob=0.3)	# 100打席でのヒット数の乱数列生成
qqnorm(hit, xlab="正規分布分位点", ylab="データ分位点", main="")	# 正規 Q - Q プロット表示
qqline(hit, col="red")	# 正規分布の直線表示
title(main="100打席ヒット数分布の正規 Q-Q プロット")	# グラフタイトル

curve(dchisq(x, 1), 0, 20)	# 自由度 1 の χ² 分布のグラフの表示
abline(v=0, h=0)	# x 軸と y 軸の表示
curve(dchisq(x, 4), add=T, col=2)	# 自由度 4 の χ² 分布のグラフを色 2（赤）で追加
curve(dchisq(x, 10), add=T, col=3)	# 自由度 10 の χ² 分布のグラフを色 3（緑）で追加
legend(10, 0.7, c("n = 1", "n = 4", "n = 10"), lty=1, col=c(1, 2, 3))
title(main="χ2 分布の自由度 n による形状の違い")	# タイトル

op <- par(mfrow = c(1, 2))	#
curve(df(x, 1, 10), 0, 5, ylim=c(0,1.5), ylab="確率密度", xlab="n = 10")	# m = 1，n = 10 の F 分布
abline(v=0, h=0)	# x 軸，y 軸
curve(df(x, 2, 10), 0, 5, add=T, col=2)	# m = 2，n = 10 の F 分布
curve(df(x, 4, 10), 0, 5, add=T, col=3)	# m = 4，n = 10 の F 分布
curve(df(x, 8, 10), 0, 5, add=T, col=4)	# m = 8，n = 10 の F 分布
legend(2.5, 1.4, c("m = 1", "m = 2", "m = 4", "m = 8"), lty=1, col=1:4)	# 凡例
curve(df(x, 4, 50), 0, 5, col=2, ylab="確率密度", xlab="m = 4")	# m = 4，n = 50 の F 分布
abline(v=0, h=0)	# x 軸，y 軸
curve(df(x, 4, 10), 0, 5, add=T)	# m = 4，n = 10 の F 分布
legend(2.5, 0.7, c("n =10", "n = 50"), lty=1, col=c("black","red"))	# 凡例
par(op)	#
title(main="F 分布の分子と分母の自由度の違いによる形状")	# タイトル

engei <- read.csv("engei.csv")	# csv データ読み込み
engei	# データの表示
x <- engei[,3]	# 園芸療法前の MSE 得点を x に格納（列数で指定）
x <- engei$療法前	# 園芸療法前の MSE 得点を x に格納（変数名で指定）
y <- engei$療法後	# 園芸療法後の MSE 得点を x に格納（変数名で指定）
t.test(y, x, paired=TRUE)	# １母集団 t 検定，paired = TRUE で対標本を指定
d <- y - x	# 療法後－療法前で療法の効果をみる
d	# 療法の効果の表示
t.test(d)	# １母集団 t 検定，先ほどと同じ検定
n <- length(d)	# 標本の大きさ（サンプルサイズ）
mean(d)	# 標本平均
sd(d)	# 標本標準偏差
dv <- n - 1	# 標本の自由度
t <- sqrt(n)*mean(d)/sd(d)	# 効果がないとの帰無仮説のもとでの t 値
t	# 検定統計量 t 値の表示
2*(1 - pt(t, df=dv))	# 両側検定の p 値
t0 <- qt(0.975, df=dv)	# 両側 5 ％検定の閾値
dw <- t0*sd(d)/sqrt(n)	# 95％信頼区間の幅
mean(d)-dw	# 95％信頼区間の下限
mean(d)+dw	# 95％信頼区間の上限
t.test(d, alternative="greater")	# 片側検定

母集団 A からの標本の偏差平方和：	S_A＝（n_A－1）s_A²
母集団 B からの標本の偏差平方和：	S_B＝（n_B－1）s_B²
母集団 A，B 全体での偏差平方和：	S ＝ S_A ＋ S_B ＝（n_A－1）s_A²＋（n_B－1）s_B²
母集団 A，B 共通の標本分散：

１	２	３	４	R₊	R_-	T
＋	＋	＋	＋	10	0	0
－	＋	＋	＋	9	1	1
＋	－	＋	＋	8	2	2
＋	＋	－	＋	7	3	3
＋	＋	＋	－	6	4	4
－	－	＋	＋	7	3	3
－	＋	－	＋	6	4	4
－	＋	＋	－	5	5	5
＋	－	－	＋	5	5	5
＋	－	＋	－	4	6	4
＋	＋	－	－	3	7	3
－	－	－	＋	4	6	4
－	－	＋	－	3	7	3
－	＋	－	－	2	8	2
＋	－	－	－	1	9	1
－	－	－	－	0	10	0

確率：γ	0.99	0.95	0.90	0.85	0.80
臨界値：k_γ	1.63	1.36	1.22	1.14	1.07

r <- 7; n <- 10	# 成功回数と試行回数
prop.test(r, n, p=0.5, correct=F)	# H₀：p = 0.5 の正規近似検定（補正なし）
prop.test(r, n, p=0.5)	# H₀：p = 0.5 の正規近似検定（連続性の補正）
binom.test(r, n, p=0.5)	# 二項確率に基づく正確な検定
binom.test(r, n, p=0.4)	# p = 0.4 の検定

r <- 7; n <- 10	# 成功回数と試行回数
x <- c(r, n-r)	# 成功回数と失敗回数のベクトル
p0 <- c(0.5, 0.5)	# 成功確率と失敗確率の帰無仮説
chisq.test(x, p=p0)	# ピアソン χ² 適合度検定

N <- 10000	# シミュレーション回数
m <- 6	# 試行１回でのベルヌイ試行の数
n <- 100	# 二項確率の試行数
p0 <- dbinom(x=0:6, size=6, p=1/3)	# 二項確率 B(6, 1/3)
w <- rbinom(n, m, p=1/3)	# n = 100 回の試行での成功回数（観測値）の系列）
tw <- table(factor(w,levels=0:m))	# 成功回数の表（データ）
r <- chisq.test(tw, p=p0)	# データと二項確率との適合度検定
p1 <- c(p0[1:4], p0[5]+p0[6]+p0[7])	# 少ない確率をまとめた二項確率
y <- NULL	# χ² 値のベクトル
for(i in 1:N){	#
w <- rbinom(n, m, p=1/3)	# n = 100 回の試行での成功回数（観測値）の系列）
fw <- table(factor(w,levels=0:m))	# 成功回数の表（データ）
tw <- c(fw[1:4], fw[5]+fw[6]+fw[7])	# 成功回数 5，6，7 をまとめる
r <- chisq.test(tw, p=p1)	# 適合度検定の χ² 値
y <- c(y, r$statistic)	#
}	#
my <- ceiling(max(y))	# y の最大値を超える最小の整数
mean(y)	# 平均（真値 = 4）
var(y)	# 分散（真値 = 8）
hist(y, breaks=seq(0,my,by=0.5),freq=FALSE,xlim=c(0,20),xlab="χ2 値",ylab="頻度",main="")
x <- seq(0,20, by=0.1)	#
curve(dchisq(x, 4), 0, 20, add=T, col=2)	# 自由度 4 χ² 分布
title(main="二項分布の適合度と自由度 4 カイ自乗分布")	#
q0 <- qchisq(0.95,df=4)	# χ²(4) の 95％点
segments(q0,0, q0,0.1, col="red")	# 棄却域
pv <- length(y[y>q0])/N	#
s <- paste("有意水準 = ", pv)	# 帰無仮説の棄却率（真値 = 0.05）
text(15,0.06, s)	#

x <- 0:10	# 5,6の個数
y <- c(185,1149,3265,5475,6114,5194,3067,1331,403,105,18)	# 出た回数
m <- sum(x*y)/sum(y)	# 出た回数の平均
pd <- m/12	# 5，6 の出る確率の推定値
p <- dbinom(x=0:12, size=12, p=1/3)	# 正しいサイコロ（p = 1/3）のときの確率分布
p0 <- c(p[1:10], p[11]+p[12]+p[13])	# 出る回数 10 回以上をまとめた確率分布
rbind(y, p0*sum(y))	# 観測度数とモデルのもとでの期待度数
chisq.test(y, p=p0)	# データが p = 1/3 の二項分布に従っていることの検定
q <- dbinom(x=0:12, size=12, p=pd)	# データから推定された確率に基づく二項分布
q0 <- c(q[1:10], q[11]+q[12]+q[13])	# 出る回数 10 回以上にまとめた確率分布
rbind(y, q0*sum(y))	# 観測度数とモデルのもとでの期待度数
r <- chisq.test(y, p=q0)	# データが p = pd の二項分布に従っていることの検定
pchisq(r$statistic, df=r$parameter-1, lower.tail=F)	# 有意確率（自由度１落とす）

得点	40 未満	41 ～ 50	51 ～ 55	56 ～ 60	61 ～ 65	66 ～ 70	70 以上
人数	6	9	12	13	17	14	9
期待度数	4.33	13.95	11.91	13.60	12.93	10.24	13.06

eigo <- c( 36,70,56,68,76,60,50,63,62,42,64,60,50,68,71,67,	# 英語得点データ
50,65,67,57,72,64,61,66,46,80,46,51,59,32,55,65, 65,52,57,64,23,57,53,54,38,71,57,69,77,61,51,64,
63,43,65,61,51,69,72,68,53,66,68,58,73,65,62,67, 47,81,47,52,59,33,56,66,67,52,58,65,24,58,54,55)
d <- 5	# ヒストグラムの階級幅
op <- par(mfrow = c(1, 2))	# グラフを横に２つ並べて表示
hist(eigo, breaks=seq(0, 100, by=d), xlab="英語得点", ylab="頻度", main="")
n <- length(eigo)	# データ数
m <- mean(eigo)	# 平均
s <- sd(eigo)	# 標準偏差
x <- 0:100	#
curve(nddnorm(x, m, s), 0, 100, add=TRUE, col="red")	# 推定正規分布重ねて表示
title(main="英語得点のヒストグラム")	#
qqnorm(eigo, xlab="正規分布分位点", ylab="英語得点分位点", main="")
qqline(eigo, col=2)	# Q-Q プロット
title(main="正規 Q - Q プロット")	#
par(op)	#
a <- c(0,40,50,55,60,65,70,100)	# 階級の区切り点の定義
b <- hist(eigo, breaks=a)	# 各セルに入る人数の計算
y <- b$counts	# セルの観測度数
l <- length(a)	#
p <- pnorm(a[2:(l-1)], mean=m, sd=s)	# 階級の区切りまでの累積確率
ps <- c(0, p)	#
pe <- c(p, 1)	#
q <- pe-ps	# セルの確率分布
rbind(y, sum(y)*q)	# セルの観測度数と期待度数
r <- chisq.test(y, p=q)	# χ² 適合度検定
pchisq(r$statistic, df=r$parameter-2, lower.tail=F)	# 有意確率（自由度 2 落とす）
plot(ecdf(eigo), xlab="英語得点", do.points=F, ylab="累積確率", main="")
curve(pnorm(x, m, s), 0, 100, add=TRUE, col="red")	# 正規分布の累積分布
title(main="英語得点の標本累積分布")	#
ks.test(eigo, "pnorm", m, s)	# Kolmogorov-Smirnov １標本検定

東京国際大学大学院

心理データ解析

東京大学大学院農学生命科学研究科 大森宏

R の基本的な使い方を学ぶ

データ分布と基本統計量

データ

量的データ

データの視覚化

位置情報

ちらばりの情報

英語得点データ

データ操作

課題

確率分布

離散確率分布

連続型確率分布

累積分布関数

分布の代表値

平均

分散

１次元の分布

離散分布の例

離散一様分布

二項分布

ポアソン（Poisson）分布

連続型分布の例

一様分布（uniform distribution)

正規分布（normal distribution)

χ2（カイ２乗）分布

F 分布

t 分布

正規母集団からの標本に基づく推論

独立な正規分布の合成分布

正規分布に基づく母数の区間推定

分散既知の場合の母平均 μ の区間推定

95％ の意味

平均既知の場合の母分散 σ2 の区間推定

平均未知の場合の母分散 σ2 の区間推定

分散未知の場合の母平均 μ の区間推定

仮説検定

帰無仮説（H0）と対立仮説（H1）

仮説検定

検定統計量

有意水準

片側検定と両側検定

両側検定と信頼区間

検定における２種類の過誤

正規母集団の母平均に対する t 検定

１つの母集団に対する検定

２つの母集団に対する検定

ノンパラメトリック検定

１標本問題（one sample problem）

概要

符号検定（sign test）

ウィルコクソン（Wilcoxon）の符号順位和検定（signed rank sum test）

符号検定

Wilcoxon の順位和検定

t 検定

データの吟味

符号検定

Wilcoxon の順位和検定

t 検定

２標本問題（two sample problem）

概要

Mann-Whitney の U 検定

Kolmogorov-Smirnov の 2 標本検定

3-4．解析例

データ分布

Mann-Whitney の U 検定

t 検定

Kolmogorov-Smirnov 検定

「若年層」のデータ分布

Mann-Whitney の U 検定

t 検定

Kolmogorov-Smirnov 検定

正規母集団の母分散に対する検定

母集団分散の検定

２つの母集団分散の同等性の検定

２つの母集団の分散比の信頼区間

課題

東京大学大学院農学生命科学研究科　大森宏

χ²（カイ２乗）分布

95％の意味

平均既知の場合の母分散 σ² の区間推定

平均未知の場合の母分散 σ² の区間推定

帰無仮説（H₀）と対立仮説（H₁）

Pearson χ² 検定