2009.4.16

東京国際大学

統計学の基礎

東京大学大学院農学生命科学研究科 大森宏


講義プリントサイト:http://lbm.ab.a.u-tokyo.ac.jp/~omori/kokusai/index.htm

携帯解答サイト: http://lbm.ab.a.u-tokyo.ac.jp/~omori/k/

QRコード


1. 統計的データはどのように用いられているか

1-1.データの使用例

 世論調査,視聴率,政党支持率,株価,売上高,販売シェア…
など多岐にわたる.
 主張や意見に説得力をもたせるため.

1.2009年4月16日付け日本経済新聞

テーマパーク明暗、主要10施設中7カ所が入場者減 08年度

テーマパーク 08入場者数(万人)増減
東京ディズニーリゾート(千葉浦安)2,722+7.1
ユニバーサル・スタジオ・ジャパン(大阪)846微減
東京ドームシティ(東京文京)479-21.5
ナガシマリゾート(三重桑名)465+7.6
八景島シーパラダイス(横浜)453-11.5
ナムコ・ナンジャタウン(東京豊島)205-5.1
鈴鹿サーキット(三重鈴鹿)191-8.6
ハウステンボス(長崎)185-15.5
志摩スペイン村(三重志摩)124+4.2
キッザニア東京(東京江東)91-2.2

以下の設問に携帯から回答せよ。
問1:ディズニーランドに行ったか
1.何度も行ったことがある.2.数回は行った.3.行ったことがある. 4.行ったことはないが行きたい.5.行ったことはない
 
問2:東京ドームシティ
問3:八景島シーパラダイス
問4:ナムコ・ナンジャタウン
上記のように答えた理由を掲示板に投稿せよ。

2.漢字検定データ例(文献4)

 日本漢字能力検定協会が発表したデータに対し,共同通信(2005/08/25)が以下の記事を配信した.
大学生は漢字が苦手.高卒程度問題,正答率4割
 高校卒業程度とされる漢字検定2級の問題で,大学1年生の正答率が39.8%しかなかった ことが24日,日本漢字能力検定協会(京都市下京区)による初めての調査でわかった. 大学生が高校教育課程の漢字を習得しないまま卒業・進学している実態が浮かんだ.
 調査は今年4−5月,首都圏と関西圏,東海地区から無作為に抽出した中学,高校,大学の 新入生と上場企業の新入社員計8356人を対象に実施.漢字検定で過去に出題した問題を使い, 同音・同訓異字,熟語の読み書きなどを記述させた.
 大学1年生には,「閑古鳥」「吟味」「醜聞」の読みや「魚のクサミ」「マイゾウ文化財」 「門前のコゾウ」の漢字を書かせる問題などが出題された.
 小学校卒業程度(同5級)での中学1年生の正答率は78.5%,中学卒業程度の問題(同3級)での 高校1年生の正答率は59.0%で,同協会は「高学年になるほど漢字学習がおろそか,学習の積み残し が増えている」と指摘,新入社員も大学生と同じ2級で60.7%の正答率にとどまった.

1-2.データの視覚化

1.表による整理

 文章中の数字は,表にまとめるとより見やすくなる(と思う).

漢字検定の正答率
調査対象  正答率(%)  
 中学1年生  78.5
 高校1年生  59.0
 大学1年生  39.8
新入社員60.7

2.グラフ表示

表よりグラフの方がより見やすい(と思う).
kanji1

3.グラフ強調表示

基準線を変えると,より主張(大学生は漢字が苦手)が強調される(と思う).
kanji2

設問

問1:共同通信社は「大学生は漢字が苦手」と主張したが,それに対する考えを以下から選び, 選択肢回答テスト第5問に携帯から送信せよ.
1.共同通信社の主張に全面的に同意する.
2.共同通信社の主張にそういわれればそうだなと感じた.
3.共同通信社の主張には納得いかない点がある.
4.共同通信社の主張にはまったく納得がいかない.
 
問3.問1の回答の理由を掲示板に投稿せよ.

1-3.なにを比較しているかの吟味

1.母集団

 調査対象がどのような集団を想定しているのか(これを母集団という)を考える.
 漢字検定の例では,標本抽出を「首都圏と関西圏,東海地区」から行っているので,日本の大都市圏の住人である. また,「無作為」に対象を選らんでいるので,偏り(バイアス)はない. たとえば,ネット調査の場合,ネットに対する興味などの偏りが生じる恐れがある.

 各比較対象ごとに詳しくみると,

2.比較内容

 2つ以上の集団を比較する場合,それぞれの集団に同じ処理をほどこすのが普通である.そうしないと, 処理の効果の集団での違いがわからず,何を比較したのかがわからなくなる.
 漢字検定試験では,大学1年生と新入社員は,漢字検定2級(高校卒業程度)で試験を行ったが, 高校1年生は漢字検定3級(中学卒業程度),中学1年生は漢字検定5級(小学校卒業程度)を 行っており,集団全体は同じ処理をほどこしていない.
 以上をまとめると,

漢字検定の正答率
調査対象対象属性  正答率(%)  試験内容
 中学1年生  大都市圏居住同世代を完全に代表 78.5漢字検定5級(小学校卒業程度)
 高校1年生  同世代をほぼ代表 59.0漢字検定3級(中学卒業程度)
 大学1年生  同世代の半数を代表(漢字能力が比較的高い) 39.8漢字検定2級(高校卒業程度)
新入社員同世代の極一部のみ代表(漢字能力が高い) 60.7漢字検定2級(高校卒業程度)

設問

問4.どのような試験を行えば大学生の漢字能力がより明瞭にわかるか.掲示板に投稿せよ.
 

参考文献

  1. 心理・教育のための統計法(第 2 版),山内光哉,1998,サイエンス社
  2. 工学のためのデータサイエンス入門−フリーな統計環境Rを用いたデータ解析−,間瀬茂ら,2004, 数理工学社
  3. 実践生物統計学−分子から生態まで−(第 1 章,第 2 章), 東京大学生物測定学研究室編(大森宏ら), 2004,朝倉書店
  4. R で学ぶデータマインニング I −データ解析の視点から−,熊谷悦生・船尾暢男,2007,九天社
  5. R で学ぶデータマインニング II −シミュレーションの視点から−,熊谷悦生・船尾暢男,2007,九天社

Copyright (C) 2008, Hiroshi Omori. 最終更新:2009年 4月16日