東京国際大学大学院

心理データ解析(後期)

東京大学大学院農学生命科学研究科 大森宏


1.分割表の解析

 対象をいくつかの質的変数でカテゴリーに分けることはよく行われる.たとえば,社会科学データでは, 人間集団を性別,年齢,職業,趣味などで分類する.ここで興味がもたれるのは,たとえば,被験者の社会的属性 (性別,年齢,学歴など)により,ある問題に対する意見や趣味嗜好が異なっているかどうか,である.これを 統計学的に書き直すと,属性ごとで意見分布が同じかどうかを検定することに帰着する.

成功確率(比率)の同等性の近似検定

 成功確率 px のベルヌイ試行を n 回行ったときの成功回数を X, 成功確率 py のベルヌイ試行を m 回行ったときの成功回数を Y とする.このとき, 2つの成功確率が等しいかどうか,すなわち,
帰無仮説,H0: px = py, 対立仮説,H1: px ≠ py
の検定を考える.帰無仮説のもとでは,px = py = p とおけるので, px の推定量である X/n と py の推定量である Y/m の 平均と分散は,それぞれ,
equal
となる.これより,X/n - Y/m の帰無仮説のもとで平均と分散は,
equal
となるので,これをその平均を引いて標準偏差で割って標準化した z は,
equal
のように漸近的に標準正規分布に従う.
 ところで,帰無仮説のもとでの成功確率 p は,XY をこみにして,
equal
と推定されるので,これを z に代入すれば,
equal
となり,T = |z| を検定統計量にして,たとえば,T > 1.96 のとき帰無仮説を棄却すれば, 近似的な有意水準 5%の検定が行える.
 なお,連続性の補正を入れた検定統計量は,
equal
となる.

2×2分割表

 上で述べた比率の同等性の検定は,別の表現ができる.すなわち,成功確率 px の試行 X では a 回成功し, b 回失敗したが,別の成功確率 py の試行 Y では c 回成功,d 回失敗であったとする.このとき, 試行 X と試行 Y で成功確率が等しいという,
帰無仮説,H0: px = py, 対立仮説,H1: px ≠ py
の検定を考える.
 このようなデータは,

2 × 2 分割表データ
   成 功   失 敗   計 
 試行 X  a b  a + b 
 試行 Y  c d  c + d
 計  a + c b + d N

とまとめられる.ただし,N = a + b + c + d,である. これを2×2分割表という.各試行の成功回数と失敗回数を記録した部分をセル,その外側の 「計」に対応する部分を周辺度数という.
 周辺度数を固定したときに,帰無仮説のもとでの各セル期待度数は,

帰無仮説のもとでの期待度数
   成 功   失 敗 
 試行 X   (a + b)(a + c)/N   (a + b)(b + d)/N 
 試行 Y   (c + d)(a + c)/N  (c + d)(b + d)/N

となる.ここで,ピアソン(Pearson)のχ2 値,

fit
を計算する.このとき,
Na - (a + b)(a + c) = (a + b + c + d)a - (a2 + ab + ac + bc) = ad - bc
という関係を利用すると, 2×2分割表の χ2 値は,
contengency
と計算される.
 ところで,比率の同等性検定の z において,X = a,Y = c,n = a + b,m = c + d, m + n = N,とおきかえると,
contengency
となり,z2 値が χ2 値と同じであることがわかる.これより,
contengency
と分布するので,自由度 1 の χ2 分布を利用して,成功確率の同等性の検定を行うことができる.  また,χ2 値に連続性の補正を行うときは,
contengency
とする.

Fisher の直接確率法

 試行回数が少ないときは,各セルの期待度数が小さくなるので,近似の精度はよくない.2×2 分割表では, 一般に期待度数が 5 以下のセルがあると χ2 検定は適当でないと言われている. このようなときは,周辺度数を固定して,データの表が得られる確率より小さな場合をすべて足し合わせて有意 確率(p 値)を計算する.
 前節の囲碁と将棋の例で説明する.データを 2 × 2 分割表でまとめると以下のようになる.

将棋と囲碁 2 × 2 分割表
   勝 ち   負 け     計    場合の数
 将 棋  7 3  10    10C7
 囲 碁  4 6  10   10C4
 計  11 9  20    20C11

上の表で,勝ち負けがまったくランダムに起こったとすると,この表ができる確率は,
p = 10C7×10C4 /20C11 = 0.15004
となる.  次に,周辺度数を固定した場合できる可能性のある表をすべて数えあげ,勝敗がランダムなときの表が 生成する確率を計算すると以下のようになる.

パターン1 勝ち 負け 計   場合の数
将 棋 10    10C6
囲 碁 10    10C5
計   11  20    20C11
  確 率  10C8×10C3 /20C11 = 0.03215
  
パターン2 勝ち 負け 計   場合の数
将 棋 10    10C9
囲 碁 10    10C2
計   11  20    20C11
  確 率  10C9×10C2 /20C11 = 0.00268
  
パターン3 勝ち 負け 計   場合の数
将 棋 10  10    10C10
囲 碁 10    10C1
計   11  20    20C11
  確 率  10C10×10C1 /20C11 = 0.00006
 
パターン4 勝ち 負け 計   場合の数
将 棋 10    10C6
囲 碁 10    10C5
計   11  20    20C11
  確 率  10C6×10C5 /20C11 = 0.315075
  
パターン5 勝ち 負け 計   場合の数
将 棋 10    10C5
囲 碁 10    10C6
計   11  20    20C11
  確 率  10C5×10C6 /20C11 = 0.315075
  
パターン6 勝ち 負け 計   場合の数
将 棋 10    10C4
囲 碁 10    10C7
計   11  20    20C11
  確 率  10C4×10C7 /20C11 = 0.15004
 
パターン7 勝ち 負け 計   場合の数
将 棋 10    10C3
囲 碁 10    10C8
計   11  20    20C11
  確 率  10C3×10C8 /20C11 = 0.03215
  
パターン8 勝ち 負け 計   場合の数
将 棋 10    10C2
囲 碁 10    10C9
計   11  20    20C11
  確 率  10C2×10C9 /20C11 = 0.00268
  
パターン9 勝ち 負け 計   場合の数
将 棋 10    10C1
囲 碁 10  10    10C10
計   11  20    20C11
  確 率  10C1×10C10 /20C11 = 0.00006

 この中でデータのような表が得られる確率と同じかそれより小さな確率をすべて加え合わせたものが, 有意確率である.すなわち,パターン1,パターン2,パターン3,パターン6,パターン7,パターン8, パターン9,の確率を加え合わせる.  特に,上側確率が,データとパターン1,パターン2,パターン3,を加えたもので,
上側確率:Pupper = 0.15004 + 0.03215 + 0.00268 + 0.00006 = 0.1849
であり,下側確率が残りのパターンの確率を加え,
下側確率:Plower = 0.15004 + 0.03215 + 0.00268 + 0.00006 = 0.1849
となる.有意確率(p 値)は,これを加え,
p 値:Pupper + Plower = 0.1849 + 0.1849 = 0.3698
となる.

クロス集計と独立性の検定

 n 標本を2つの変数 A,B で分類したとき,2つの変数に関連があるかを調べたい. 変数 A を集団属性(集団1,集団2),変数 B を反応パターン(反応1,反応2)とした とき,データは以下のようにまとめられる.これをクロス集計と呼ぶ.

2 × 2 分割表データ
  反応1  反応2  計  
 集団1  n11 n12 n1・
 集団2  n21 n22 n2・
 計  n・1 n・2 n

 ここで,nij は,集団 i の標本の中で,反応 j を取った人数(度数) である.また,ni・ は集団 i の標本の大きさで, n・j は標本全体(大きさ n)の中で反応 j を取った人数 を表し,それぞれ周辺度数という.
 このような表において,集団で反応パターンに違いがなければ,集団 i で反応 j を取る確率は, 集団 i である確率 ni・/n に 集団 j である確率 n・j/n をかけた ni・n・j/ n2 となることが期待される.これより, 集団 i で反応 j を取る人数(度数)は, ni・n・j/n となることが期待される.これを独立性の仮定という.
 いま,集団 i の標本の中で,反応 j を取る確率を pij とし,集団 i の周辺確率を pi., 反応 j の周辺確率を p.j とすると,独立性の仮説は,

帰無仮説,H0: pij = pi.p.j, 対立仮説,H1: pij ≠ pi.p.j
の検定になる.帰無仮説のもとで,表現は違うが前節とまったく同じ χ2 値が,
contengency
と分布するので,独立性の検定を行うことができる.連続性の補正も前節とまったく同じようにして行う.
 すなわち,比率の同等性の検定と独立性の検定は,意味が違うが検定のやり方はまったく同じである.

φ(ファイ)係数

 2 × 2 分割表において,変数 A と変数 B の間の関連の強さを表す指標. 四分点相関係数(four-fold point correlation coefficient)とも言う.
 前節の将棋の例でみると,「将棋」 という変数と「勝ち」という変数を考える.「将棋」は将棋を行ったとき 1 を取り,「将棋」を行わなかった とき 0 を取る.「勝ち」は勝ったとき 1 を取り,負けたとき 0 を取るものとする. すると,全部で 20 回の対戦結果は,
  「将棋」   11111111110000000000
  「勝ち」   11111110001111000000

のようにまとめられる.φ 係数は,この 2 つの変数間のピアソン相関係数である. すなわち,「将棋」と「勝ち」の相関である.
 多少の計算により,ピアソン χ2 値との関係は,

phico
であることがわかる.

# φ 係数の R スクリプト
a <- c(rep(1, 10), rep(0, 10))		# 「将棋」の値
b <- c(rep(1, 7), rep(0, 3), rep(1, 4), rep(0, 6))		#「勝ち」の値
cor(a, b)					# φ 係数(a,b 間の相関係数)
n <- length(a)
shogi <- c(7, 3)			# A の将棋の勝ち負け数
igo <- c(4, 6)				# A の囲碁の勝ち負け数   
x <- rbind(shogi, igo)
c2 <- chisq.test(x, correct=F)$statistic	# ピアソン χ2 値(連続性補正なし)
sqrt(c2/n)					# φ 係数

オッズ比(odds ratio)

 変数 A,B 間の関連の強さを測る指標としてオッズ比がある. たとえば,食中毒事件が起きたとき, 食中毒症状が出たか出なかったか(変数 A)を 出された食材を食べた人と食べなかった人(変数 B)で 分類する.このとき,ある食材に対しての分類は以下のようであったとする.

   発症あり(A1)   発症なし(A2
 食べた(B1)  a b
 食べなかった(B2)  c d

 食材を食べたときに発症する確率 Pr[A1| B1] の推定値は a/(a + b), 発症しない確率 Pr[A2| B1] の推定値は b/(a + b) である. これより,その食材を食べたとき食中毒を発症する危険率(オッズ)は,
Pr[A1| B1]/P[A2| B1] = a/b
であり,同様に食べなかったときの発症オッズは,
Pr[A1| B2]/P[A2| B2] = c/d
である.この両者の比,
odds
をオッズ比といい,ある食材を食べたことが食中毒症状発症にどれだけ危険であるかの尺度になる. 危険が同等のときは,オッズ比は 1 となる.なお,どこかのセルデータが 0 であったときは, セルのすべての値に 0.5 を加えて補正する.
 ところで,R の fisher.test() では,超幾何分布に基づいてオッズ比の最尤推定を 行っているらしいので,上の式の単純な推定値とは値が多少異なっているが,ソースの解読を していないので詳細は不明である.
 ピアソン χ2 検定は,
帰無仮説 H0:オッズ比 φ = 1
の検定と同等である.

シンプソンのパラドックス

 2 元分割表に層構造があるとき,層ごとで解析しないと誤った結論を導くことがある. たとえば,ある政策に対する賛否を 400 名に尋ね,性別,年齢層べつに集計したところ以下のようになった.

  賛成 反対  計 
 男  132 67 199
93 108 201
225 175 400
    
  賛成 反対  計 
35 未満 131 67 198
35 以上 94 108 202
225 175 400

 これをみると,男性は約 2/3 が賛成してあり,年齢別では 35 未満の賛成も約 2/3 であった. この結果をみると,若い男性がこの政策に賛成していると考えがちである.しかし,性別,年齢別に細かく 集計してみると,

  賛成 反対  計 
男 35 未満 41 58 99
男 35 以上 91 9 100
132 67 199
    
  賛成 反対  計 
女 35 未満 90 9 99
女 35 以上 3 99 102
93 108 201

となり,35 歳未満の男性の反対がけっこう多く,予想とは異なる結果となった.このようになった理由は,35 歳 以上の男女で賛否がまったく異なっていて,さらに女性でも 35 歳未満と以上で賛否がまったく異なって いたからである.このような状況を無視して,年齢層でひとくくりにしたり,性別でひとくくりしたことが 誤った推論を引き起こす原因となったと考えられる.
 このように,まったく異なった性格を持つ集団をまとめてしまってデータの解釈を行うことは危険である. したがって,2 元分割表に基づいて分析をするときは,集団の中に層構造が隠れていないかよく調べる 必要がある.

マンテル・ヘンツェル(Mantel-Haenszel)検定

 分割表に層構造があるかを調べる検定

# マンテル・ヘンツェル検定の R スクリプト
Data <-
array(c(41, 91, 58, 9,
        90, 3, 9, 99),
      dim = c(2, 2, 2),
      dimnames = list(
          年齢 = c("35 未満", "35 以上"),
          賛否 = c("賛成", "反対"),
          性別 = c("男性", "女性")))
Data
mantelhaen.test(Data)

マクネマー(McNemar)検定

 分割表において,非対角成分である i,j 成分と j,i 成分が等しい(i≠j)を帰無仮説とする検定. この検定は,同一の被験者集団に時期をおいて,首相や政党などへの支持を尋ねたとき,支持が変化したかを みたいときに用いられる.たとえば,ある政策に対する賛否を時期を開けて尋ねたところ,以下の表 になったとしよう.

   賛成(2 回目)   反対(2 回目)
 賛成(1 回目)  a b
 反対(1 回目)  c d

1 回目と 2 回目で意見が変わらなかった人数は a と d であり,意見が変わったのが b と c である. 帰無仮説は,

H0:1 回目と 2 回目で賛否の比率が変わらない.

である.帰無仮説のもとでは,反対 → 賛成と賛成 → 反対と変化した人数が等しく (b + c)/2 である ことが期待される.すると,ピアソンの χ2 値は,
mcnem
となるので,これが検定統計量になる.

R × C 表

 大きさ n の標本を2つの変数 A,B で分類したとき,2つの変数に関連があるかを調べたい. 変数 A が R 個のカテゴリー A1, A2,…,AR,に分かれ, 変数 B が C 個のカテゴリー B1, B2,…,BC,に分かれていると すると,標本のうち,カテゴリー Ai,Bj に落ちた個数を nij とすると,以下のようび R × C 表にクロス集計される.

R × C 分割表データ
  B1  B2   …  BC  計  
 A1  n11 n12  …  n1C n1・
 A2  n21 n22  …  n2C n2・
 AR  nR1 nR2  …  nRC nR・
 計  n・1 n・2  …  n.C n

すると,2 × 2 分割表のときと同様に, 集団 i の標本の中で,反応 j を取る確率を pij とし,集団 i の周辺確率を pi., 反応 j の周辺確率を p.j とすると,独立性の仮説は,

帰無仮説,H0: pij = pi.p.j, 対立仮説,H1: pij ≠ pi.p.j
の検定になる.帰無仮説のもとで χ2 値が,
contengency
と分布するので,独立性の検定や頻度分布の同等性の検定を行うことができる.

2.分散分析

 分散分析は,ANOVA (Analysis of Variance) と略記されることもある.分散分析は,複数の処理を同時に 行ったときに,処理効果を推定するための最も基本的な手法である.データ全体の持つ情報は,総平方和 にまとめられているが,これを,処理の分散成分(処理平均平方)と誤差の分散成分(誤差平均平方)とに 分離して,その大きさを比較することにより,処理の効果を見積もるものである.

因子と水準

 経済学では価格や成長率,工学では作業時間や故障率,農学では収量や抵抗性など, 調査研究したい特性を形質(character)という.着目した形質に影響を与えると考えられるもの, 例えば,収量では品種,温度,施肥量などを要因または因子(factor)という. 要因の影響を調べるためいくつかの品種を用いたり, 施肥量に段階を設けたりするが,それを水準(level)という.

一元配置(one-way layout)

構造モデル

 t 検定では,2 つの処理平均の比較を行ったが,この節ではこれを拡張して,複数の処理平均の比較を行う 手法を考える.いま,a 水準の処理(treatment)A1,…,Aa,があり, 処理 Ai を行った ni 個の標本, Xi1,…,Xini,が得られた とする.処理 Ai からの標本は,平均 μi = μ + αi,分散 σ2 の正規分布に従うと仮定する.ここで,μ を総平均(grand mean), αi を処理効果(treatment effect)もしくは,主効果(main effect)と言い, Σiαi = 0,である.ここで,平均 0,分散 σ2 を持つ 誤差項(error term)eij を 導入し,標本の構造モデル,
model
として表現すると,データの持つ構造が理解しやすくなる.

平方和分解

 いま,処理 Ai の標本平均を X-i., 標本総平均を X-.. とすると,これらは,
model
と計算される.標本全体の持つ情報は,総平方和 ST(Total Sum of Squares)で表現される.これは,
model
のように誤差平方和 Se(Error Sum of Squares)と 処理平方和 SA(Treatment Sum of Squares)とに分解される.これは,積の項が
model
のように 0 となるからである.

平方和の期待値

 個々の標本 Xij と処理 Ai の標本平均 X-i., 標本総平均 X-.. の構造モデルがそれぞれ,
model
のようになるので,誤差平方和 Se と処理平方和 SA の期待値は,それぞれ,
model
model
のように計算できる.

帰無仮説のもとでの平方和の比の分布

 一元配置モデルにおける帰無仮説は,すべての処理効果がない,つまり,

H0:αi = 0,i = 1,…,a, 

である.前節の平方和の期待値から,帰無仮説のもとで,Se2 は自由度 n - a の χ2 分布に従い,SA2 は自由度 a - 1 の χ2 分布に 従うことがわかる.これらの χ2 分布をその自由度で割った比の F 値は,
model
のように自由度 a - 1,n - a の F 分布に従う.
 ここで,MA は,処理平方和 SA を その自由度 a - 1 で割ったもので,処理平均平方(treatment mean square)と呼ばれ,処理平均から求めた 誤差分散 σ2 の推定値である.一方,Me は,誤差平方和 Se を その自由度 n - a で割ったもので,誤差平均平方(error mean square)と呼ばれ,誤差分散の推定値である.
 帰無仮説のもとでは MA と Me はほぼ等しいことが期待されるので,その比 F 値は 1 に近いことが期待される.よって,F 値が大きな値をとるときは帰無仮説が正しくないと考え,帰無仮説を 棄却する.F 値が大きいか小さいかの判断基準が対応する自由度の F 分布で決められる.

分散分析表と F 検定

 一元配置モデルの解析結果は,以下の分散分析表(ANOVA table)にまとめられる.

  変動因   自由度(df) 平方和(S.S.) 平均平方(M.S.)   F 値  
主効果 a - 1 SA MA = SA/(a - 1) MA/Me
誤 差 n - a Se Me = Se/(n - a)  
全 体 n - 1 ST    

 この表から検定統計量 F 値が求められる.そして, 自由度 a - 1,n - a の F 分布の 1 - γ 点(例えば 95 %点)F(a - 1,n - a)1 - γ より F 値が大きい,すなわち,

F > F(a - 1,n - a)1 - γ

であるとき,帰無仮説を棄却すると,有意水準 γ (例えば 5 %)の検定が行える.これを,F 検定(F test) という.

対比(contarst)

 処理平均 μi のある群と他の群との違いに特に興味がある場合がある.例えば,処理 1,2,3 の 平均と処理 4,5 の平均の間
model
に差があるかをみたいような場合である.一般に,
model
である比較を対比という.

 対比 C = ΣiciμiC^ = ΣiciX-i. で推定されるが, 帰無仮説(αi = 0)のもとでは, 対比推定量の平均と分散は,

model
となるので,分散 σ2 をその推定量 s2 で置き換えた検定統計量 t は,
model
のように自由度 n - a の t 分布に従うので,対比 C = Σiciμi = 0 の 検定を行うことができる.特に,各処理水準の標本数が ni = m と一定で,対比の係数を Σic2i = 1 と標準化すると,検定統計量は,
model
と簡略化される.

 ところで,別の対比 Σidiμi があったときに, Σici di = 0,となるものを直交対比という. 直交対比の組は同時に検定ができる.  事前に比較が決められるときは,後述する多重比較による有意確率の補正を行わないことが多いと思われる.

多重比較(multiple comparison)

 分散分析(正確には実験計画)の文脈では,試験設計の段階で帰無仮説の設定が行われる.つまり,検定の内容 が事前に決定されている.このような「先付け」のときは,検定の数がそれほど多くないなら, 複数の検定を行っても有意水準についての補正を行わないのが普通だと思われる.
 しかし,データが得られた後,「後付け」でどの処理間の差が有意であるか調べたい誘惑にかられることが多い. 結果として差が 大きかった処理間で t 検定を繰り返して行うと,たくさんの検定を行うので,たまたま有意になる確率が 名目上の有意水準(たとえば 5 %)を超えてしまう恐れがある.これが,多重比較である.現在では, コンピュータにより多くの検定を簡単に行うことができるので,以前に比べて多重比較の問題を考慮しなければ ならないと考えられる.

 前節の対比でも,考えられる対比を無原則に行うときは多重比較の問題を考慮しなければならないが,この節 では対比の中でも最も単純な対比較(pairwise comparison),すなわち, 個々の処理水準間の比較のみを取り上げる.
 いま,処理平均 μi と μj の比較を行う場合を考える. 2 つの処理平均の差 μi - μj は, dij = X-i. - X-j. で推定される. 帰無仮説(αi = αj = 0)のもとで,dij の平均と分散は,

model
となるので,分散 σ2 をその推定量 s2 で置き換えた 検定統計量 tij は,
model
のように自由度 n - a の t 分布に従うので dij = 0 の検定を行うことができる.
 有意水準 α'(たとえば 5 %) の検定は, 自由度 n - a の t 分布の 1 - α'/2(たとえば 97.5 %) 分位点, t(n - a)1 - α'/2 を用いて,
model
が成り立つとき μi と μj の効果に違いがあると判定される.ここで, LSD(Least squared distance)は最小有意差という量で,以前は,α' = 0.05 として,処理効果のある組み合わせ を見つけるためよく用いられていたが,最近は,多重比較を考慮に入れた有意水準の補正を考えるのが普通 なので,単純な LSD は使用しない方が良いと思われる.
 いま,a 水準の主効果があったとすると,すべての組み合わせは r = a(a - 1)/2 通りあり,「後付け」の 検定を行うときは,全体で r 回の検定を行っていると考えなければならない. R でも 対比較では多重比較による有意確率の補正が簡単に行える.

二元配置(two-way layout)

構造モデル

 2 つの因子 A,B に対し,その水準の数をそれぞれ a,b とする.同じ因子と水準の繰り返し (repetition)を r とする.A 因子の第 i 水準で B 因子の第 j 水準の第 k 番目の標本データ Xijk は,
model
とおける.μ は総平均,αi は因子 A の主効果,βj は因子 B の主効果, (αβ)ij は因子 A と B の交互作用(interaction)で,
model
の制約を満たしている.eijk はモデルで説明できない誤差項である.

各種平方和

 因子 A,B の第 i,j 水準の平均,因子 A の第 i 水準の平均,因子 B の第 j 水準の平均および 標本総平均をそれぞれ,
model
とおく.すると,総平方和 ST,因子 A の平方和 SA, 因子 B の平方和 SB, 交互作用平方和 SA×B,誤差平方和 Se はそれぞれ,
model
と計算される.1 元配置分散分析のときと同様に,
ST = SA + SB + SA×B + Se
という平方和の分解ができる.

分散分析表と F 検定

 二元配置モデルの解析結果は,以下の分散分析表(ANOVA table)にまとめられる.

  変動因   自由度(df) 平方和(S.S.) 平均平方(M.S.)   F 値  
主効果 A a - 1 SA MA = SA/(a - 1) MA/Me
主効果 B b - 1 SB MB = SB/(b - 1) MB/Me
交互作用 (a - 1)(b - 1) SA×B MA×B = SA×B/(a - 1)(b - 1) MA×B/Me
誤 差 ab(r - 1) Se Me = Se/(n - a)  
全 体 n - 1 ST    

実験計画法

に続く.

実験計画法(追加)


参考文献

  1. 心理・教育のための統計法(第 2 版),山内光哉,1998,サイエンス社
  2. 工学のためのデータサイエンス入門−フリーな統計環境Rを用いたデータ解析−,間瀬茂ら,2004, 数理工学社
  3. 実践生物統計学−分子から生態まで−(第 1 章,第 2 章), 東京大学生物測定学研究室編(大森宏ら), 2004,朝倉書店
  4. R で学ぶデータマインニング I −データ解析の視点から−,熊谷悦生・船尾暢男,2007,九天社
  5. R で学ぶデータマインニング II −シミュレーションの視点から−,熊谷悦生・船尾暢男,2007,九天社
  6. 生物統計学入門,上村賢治・高野泰・大森宏,2008,オーム社

Copyright (C) 2008, Hiroshi Omori. 最終更新:2008年10月 4日