情報科学実験II

2003年度春学期
担当: 菊地


目的・方法

データ解析の基礎となる記述統計により、データ分析する。用意したデータについて、標本平均、標本分散、共分散、相関係数などの基礎的な統計量を求め、データ解析のための計算を体験する。

内容


1. データの入手

こちらで用意したデータをブラウザで開き、計算を行うディレクトリに保存する。


2. 保存したデータを読み込む

データは、受験番号、数学の得点、英語の得点の順にタブで区切られて並び、100名分で構成されている。これを、適当な変数に読み込む。

データは、以下のようなものである。なお、用意したデータファイルには、下の1行目の項目名(番号 数学 英語と書いてある行)は入っていない。

番号 数学 英語
1    43   61
2    66   75
3    63   81
4    41   64
5    32   58
.    .    .
.    .    .
.    .    .
100  51   76

3. 各統計量を求める

i番目の人の数学、英語の得点を表す変数を、それぞれXi、Yiとすると、代表的な統計量は以下のようになる。

数学の標本平均μX = (ΣXi) / n
数学の標本分散σX2 = (Σ(Xi - μX)2) / n
数学の標準偏差σX = 標本分散σX2の平方根

英語の標本平均μY = (ΣYi) / n
英語の標本分散σY2 = (Σ(Yi - μY)2) / n
英語の標準偏差σY = 標本分散σY2の平方根

数学と英語の共分散σXY = {Σ{(Xi - μX)(Yi - μY)}} / n
数学と英語の相関係数ρXY = σXY / (σX σY)

これ以外にも、最大値、最小値、メディアン、モードなどがある。これらについては、データ解析Iの講義ノート「1次元データの記述統計」を参照。

4. 上記の結果をレポートにまとめる

上で求めた統計量について、レポートにまとめる。数学、英語の得点分布の違いや、数学と英語の得点の相関関係について、考察を行うこと。

レポート提出期限

7/1(火)の実験で提出