数理統計II

担当: 菊地


第9回 点推定と区間推定

2007.6.21

9.1 点推定

パラメータθをある一つの値θhatで推定する方法。θhatはX1, X2, ..., Xnの関数である。実際にはθの値と一致せず、誤差を伴う。誤差は、推定量θhatの標本分布から計算できる。
母平均μの推定量
標本平均Xmean=(X1+...+Xn)/nは、母平均を推定するための推定量である。

母分散σ2の推定量
母分散σ2の推定量として、標本分散s2=Σ(Xi-Xmean)2/(n-1)が用いられることが多い。nで割ったものは、小さめに偏った推定量となってしまうからである。

9.2 区間推定

真のパラメータの値θがある区間[L, U]に入る確率が1-α以上になるような統計量L、Uを求める推定方法。すなわち、

P(L <= θ <= U) >= 1-α

となる統計量L、Uを求めれば良い。なお、αはθが[L, U]に入らない確率とも解釈できる。L、Uをそれぞれ、下側信頼限界上側信頼限界と呼び、1-αを信頼性係数、区間[L, U]をθの100(1-α)%信頼区間と呼ぶ。100(1-α)%は、α=0.05、すなわち95%を使うことが多い。


9.3 正規母集団の母平均の区間推定

標本平均XmeanはN(μ,σ2/n)に従うので、これを標準化したZ=(Xmean - μ) / (σ/√n)は、標準正規分布N(0,1)に従う。Zの分布の内側で100(1-α)%の確率となる区間は、

P(-Zα/2 <= Z <= Zα/2) = 1-α

である。なお、Z=(Xmean - μ) / (σ/√n) なので、

P(-Zα/2 <= (Xmean - μ) / (σ/√n) <= Zα/2) = 1-α

である。カッコ内をμについて解くと、

P(Xmean - Zα/2・σ / √n <= μ <= Xmean + Zα/2・σ / √n) = 1-α

である。これがまさに100(1-α)%でμを含むような区間になり、μの信頼性係数1-αの信頼区間は

[Xmean-Zα/2・σ/√n, Xmean+Zα/2・σ/√n]

となる。

σ2が未知の場合には、不偏標本分散s2をσ2のかわりに用いると、t=(Xmean-μ)/(s/√n)がt(n-1)に従う。よって、上のZをtでおきかえて、μの100(1-α)%信頼区間は、

[Xmean-tα/2(n-1)・s/√n, Xmean+tα/2(n-1)・s/√n]

となる。


9.4 正規母集団の母分散の区間推定

χ2=(n-1)s22はχ2(n-1)に従うので、

P(χ1-α/22(n-1) <= (n-1)s22 <= χα/22(n-1)) = 1-α

となる。よって、これをσ2について解くと、σ2の100(1-α)%信頼区間は、

[(n-1)・s2α/22(n-1), (n-1)・s21-α/22(n-1)]

となる。


9.5 二項分布のパラメータの区間推定

一般に、Bi(1,p)に従う標本から、pの信頼区間を求めることは標本の大きさnが大きくなると、計算が困難になる。そこで、中心極限定理を使って近似的に求める。

XiをBi(1,p)に従う標本とする。母平均、母分散はそれぞれp、p(1-p)であり、中心極限定理からXmeanの分布はnが大きくなると、N(p,p(1-p)/n)で近似できる。よって、Xmeanを標準化した(Xmean-p)/√(p(1-p)/n)は、nが大きくなると標準正規分布で近似できる。この近似を用いると、

P(-Zα/2 <= (Xmean-p)/√(p(1-p)/n) <= Zα/2) ≒ 1-α

である。phat=Xmean=ΣXi/nとして、pについて解くと、

P(phat-Zα/2・√(p(1-p)/n) <= p <= phat+Zα/2・√(p(1-p)/n)) ≒ 1-α

となる。これでは、信頼限界の式に未知パラメータpが入ってしまっているが、phatはpの一致推定量であるからnが大きい場合にはほとんどpに等しいと考えて良い。そこで、信頼限界の式にあるpをphatでおきかえて、pの100(1-α)%信頼区間は近似的に

[phat-Zα/2・√(phat(1-phat)/n), phat+Zα/2・√(phat(1-phat)/n)]

で求められる。