数理統計II
担当: 菊地
第9回 点推定と区間推定
2006.6.8
9.1 点推定
パラメータθをある一つの値θhatで推定する方法。θhatはX1, X2, ..., Xnの関数である。実際にはθの値と一致せず、誤差を伴う。誤差は、推定量θhatの標本分布から計算できる。
- 母平均μの推定量
-
標本平均Xmean=(X1+...+Xn)/nは、母平均を推定するための推定量である。
- 母分散σ2の推定量
-
母分散σ2の推定量として、標本分散s2=Σ(Xi-Xmean)2/(n-1)が用いられることが多い。nで割ったものは、小さめに偏った推定量となってしまうからである。
9.2 区間推定
真のパラメータの値θがある区間[L, U]に入る確率が1-α以上になるような統計量L、Uを求める推定方法。すなわち、
-
P(L <= θ <= U) >= 1-α
となる統計量L、Uを求めれば良い。なお、αはθが[L, U]に入らない確率とも解釈できる。L、Uをそれぞれ、下側信頼限界、上側信頼限界と呼び、1-αを信頼性係数、区間[L, U]をθの100(1-α)%信頼区間と呼ぶ。100(1-α)%は、α=0.05、すなわち95%を使うことが多い。
9.3 正規母集団の母平均の区間推定
標本平均XmeanはN(μ,σ2/n)に従うので、これを標準化したZ=(Xmean - μ) / (σ/√n)は、標準正規分布N(0,1)に従う。Zの分布の内側で100(1-α)%の確率となる区間は、
-
P(-Zα/2 <= Z <= Zα/2) = 1-α
である。なお、Z=(Xmean - μ) / (σ/√n) なので、
-
P(-Zα/2 <= (Xmean - μ) / (σ/√n) <= Zα/2) = 1-α
である。カッコ内をμについて解くと、
-
P(Xmean - Zα/2・σ / √n <= μ <= Xmean + Zα/2・σ / √n) = 1-α
である。これがまさに100(1-α)%でμを含むような区間になり、μの信頼性係数1-αの信頼区間は
-
[Xmean-Zα/2・σ/√n, Xmean+Zα/2・σ/√n]
となる。
σ2が未知の場合には、不偏標本分散s2をσ2のかわりに用いると、t=(Xmean-μ)/(s/√n)がt(n-1)に従う。よって、上のZをtでおきかえて、μの100(1-α)%信頼区間は、
-
[Xmean-tα/2(n-1)・s/√n, Xmean+tα/2(n-1)・s/√n]
となる。
9.4 正規母集団の母分散の区間推定
χ2=(n-1)s2/σ2はχ2(n-1)に従うので、
-
P(χ1-α/22(n-1) <= (n-1)s2/σ2 <= χα/22(n-1)) = 1-α
となる。よって、これをσ2について解くと、σ2の100(1-α)%信頼区間は、
-
[(n-1)・s2/χα/22(n-1), (n-1)・s2/χ1-α/22(n-1)]
となる。
9.5 二項分布のパラメータの区間推定
一般に、Bi(1,p)に従う標本から、pの信頼区間を求めることは標本の大きさnが大きくなると、計算が困難になる。そこで、中心極限定理を使って近似的に求める。
XiをBi(1,p)に従う標本とする。母平均、母分散はそれぞれp、p(1-p)であり、中心極限定理からXmeanの分布はnが大きくなると、N(p,p(1-p)/n)で近似できる。よって、Xmeanを標準化した(Xmean-p)/√(p(1-p)/n)は、nが大きくなると標準正規分布で近似できる。この近似を用いると、
-
P(-Zα/2 <= (Xmean-p)/√(p(1-p)/n) <= Zα/2) ≒ 1-α
である。phat=Xmean=ΣXi/nとして、pについて解くと、
-
P(phat-Zα/2・√(p(1-p)/n) <= p <= phat+Zα/2・√(p(1-p)/n)) ≒ 1-α
となる。これでは、信頼限界の式に未知パラメータpが入ってしまっているが、phatはpの一致推定量であるからnが大きい場合にはほとんどpに等しいと考えて良い。そこで、信頼限界の式にあるpをphatでおきかえて、pの100(1-α)%信頼区間は近似的に
-
[phat-Zα/2・√(phat(1-phat)/n), phat+Zα/2・√(phat(1-phat)/n)]
で求められる。