情報科学実験II

2003年度春学期
担当: 菊地


内容


1. 第2週に生成したm個の標本平均を平均0、分散が1となるよう変数変換する。

μの平均、分散の値は、理論的にはそれぞれ、p、p(1-p)/nとなる。ここで、

μ = (μ - 平均) / 標準偏差

すなわち、

μ = (μ - p) / sqrt(p(1-p)/n)
(sqrtは、平方根を表す。)

という変換を行う。変換後に、もう一度平均と分散を計算しなおし、平均が0、分散が1に近い値となることを確認すること。

Cを用いる場合には、平方根は以下の手順で求める。


2. 生成したm個の変換したデータのヒストグラムを描く。

変換した値が、

(-∞, -3.0], (-3.0, -2.5], (-2.5, -2.0], ..., (2.5, 3.0], (3.0, ∞)

の14個の区間にいくつずつ含まれるか計算する。それを元にして、*のマークを使って以下のようなヒストグラムを描く。

p=0.5, n=1000, m=300
元の平均、分散: 0.499597 0.000274
変換後の平均、分散: -0.025509 1.097896
ヒストグラム
======================================================

***
********
***************
************************
*****************************************************
*******************************************************
********************************************
************************************************
****************************
************
********
**

======================================================
この分布(ヒストグラム)の形は、理論的には中心極限定理により、nが大きくなると、きれいな正規分布に近付くことがわかっている。


3. 上記のシミュレーションによって確認できたことについて、レポートを作成する。

レポートには実験で作成したプログラムと、シミュレーションの結果を必ず示すこと。例えば、作成したプログラムでは、p、n、mの値をいろいろと変化させることができるはずなので、変化させることによって計算結果も変化するはずである。変化させたことによって、結果がどう変わるのか(例えば、理論的な形により近付く、など)について、考察を行うことが考えられる。

レポート提出期限

6/24(火)の実験で提出