数理統計II

担当: 菊地


第1回 データ解析とは

2007.4.19

講義について

教科書
基礎統計学I 「統計学入門」
東京大学教養学部統計学教室編
東京大学出版会
(生協にて購入可)
評価
定期的なレポート提出により、評価します。出欠は調べません。
講義ノート
http://www.kikuchi-lab.jp/ms2/2007/

1.1 記述統計学と推測統計学

記述統計学
得られているデータについて、さまざまな統計量を計算し、そのデータ自身の性質をみる。
推測統計学
得られているデータから、そのデータを取り出したもとになる集団の性質を推測する。

1.2 標本と母集団

標本
得られたデータ、取り出されたデータ、観測されたデータ
母集団
標本の背後にあるそのデータを取り出した、元になる集団
統計的推測では、標本の性質から、母集団の性質を推定したり、仮説検定を行う。

1.3 標本調査と全数調査

標本調査
母集団から何らかの方法で標本を取り出し、調査を行う。
全数調査
母集団全体で調査を行う。
母集団のデータ数が多すぎる、または、全数調査が実質的に不可能であるなどの理由で、標本調査を行う。標本調査から、統計的推測により、母集団の性質を推測する。

1.4 量的データと質的データ

量的データ
長さ、重さ、金額など、その値を数値として測定できるデータ
質的データ
男女、学歴、職業などある状態やカテゴリーに属していることを表すデータ

1.5 1次元データ・多次元データと時系列データ

1次元データ
学生の身長のデータなど、一つの対象について一つの観測値をとるデータ
2次元データ
身長と体重のデータなど、一つの対象について二つの観測値をとるデータ
多次元データ
1次元データに対して、一つの対象について二つ以上の観測値をとるデータ、すなわち、2次元以上のデータ
時系列データ
毎日の株価の推移や毎年の日本の人口の推移など、同一の対象について異なった時間で観測されたデータ。時間とともに変化するデータ

1.6 データ解析の手順

  1. ある集団について、その性質を調べたい。
    これが、母集団である。

  2. 実験(主に自然科学分野)、調査(主に社会科学分野)でデータを得る。
    このデータを、原データ、生データ、元データなどと呼ぶ。データを得るための手法は、実験計画法、社会調査法などと呼ばれる。なお、このデータがいわゆる標本である。

  3. 実験、調査で得られたデータを元にして、記述統計で生データの性質を見る。

  4. データを得た元になる母集団の、そもそも知りたかった性質を、推測統計で推測する。

菊地研究室のページへ