数理統計II
担当: 菊地
第1回 データ解析とは
2007.4.19
講義について
- 教科書
- 基礎統計学I 「統計学入門」
東京大学教養学部統計学教室編
東京大学出版会
(生協にて購入可)
- 評価
- 定期的なレポート提出により、評価します。出欠は調べません。
- 講義ノート
- http://www.kikuchi-lab.jp/ms2/2007/
1.1 記述統計学と推測統計学
- 記述統計学
- 得られているデータについて、さまざまな統計量を計算し、そのデータ自身の性質をみる。
- 推測統計学
- 得られているデータから、そのデータを取り出したもとになる集団の性質を推測する。
1.2 標本と母集団
- 標本
- 得られたデータ、取り出されたデータ、観測されたデータ
- 母集団
- 標本の背後にあるそのデータを取り出した、元になる集団
統計的推測では、標本の性質から、母集団の性質を推定したり、仮説検定を行う。
1.3 標本調査と全数調査
- 標本調査
- 母集団から何らかの方法で標本を取り出し、調査を行う。
- 全数調査
- 母集団全体で調査を行う。
母集団のデータ数が多すぎる、または、全数調査が実質的に不可能であるなどの理由で、標本調査を行う。標本調査から、統計的推測により、母集団の性質を推測する。
1.4 量的データと質的データ
- 量的データ
- 長さ、重さ、金額など、その値を数値として測定できるデータ
- 質的データ
- 男女、学歴、職業などある状態やカテゴリーに属していることを表すデータ
1.5 1次元データ・多次元データと時系列データ
- 1次元データ
- 学生の身長のデータなど、一つの対象について一つの観測値をとるデータ
- 2次元データ
- 身長と体重のデータなど、一つの対象について二つの観測値をとるデータ
- 多次元データ
- 1次元データに対して、一つの対象について二つ以上の観測値をとるデータ、すなわち、2次元以上のデータ
- 時系列データ
- 毎日の株価の推移や毎年の日本の人口の推移など、同一の対象について異なった時間で観測されたデータ。時間とともに変化するデータ
1.6 データ解析の手順
- ある集団について、その性質を調べたい。
これが、母集団である。
- 実験(主に自然科学分野)、調査(主に社会科学分野)でデータを得る。
このデータを、原データ、生データ、元データなどと呼ぶ。データを得るための手法は、実験計画法、社会調査法などと呼ばれる。なお、このデータがいわゆる標本である。
- 実験、調査で得られたデータを元にして、記述統計で生データの性質を見る。
- データを得た元になる母集団の、そもそも知りたかった性質を、推測統計で推測する。
菊地研究室のページへ