BDAstyle

ビジネスデータ分析ツールの作成 with Excel

母分散の信頼区間の推定 with Excel

母分散のχ2推定

Step 0シチュエーションの設定

大学Xのある科目にて500名強の学生にペーパーでの提出を課されたレポートがあります。担当教員は今年度の講義から,学生に対し2000文字程度”というアバウトな字数指定を「レポートの条件」に加えることにしました。またそれにともない,レポートの最終頁には必ず総字数を明記するよう指示しています。

後日受講者からレポートを回収した際,この教員はここから31名のレポートを無作為に抽出して,この年の学生がどの程度の文字数を狙ってくるのかレポートの最終頁にざっと目を通してみました。具体的に,これは下表のようになりました。

初期データ

以下このデータから信頼係数95%で母分散の区間推定をおこないます。

Step 1前提

母集団は正規分布にしたがうものとします。また母平均は未知とします。

Step 2見出しの入力

母分散σ2の信頼区間は次の式によって求められます。

(n-1)s^2/χ^2(n-1,α/2)≦σ^2≦(n-1)s^2/χ^2(n-1,1-α/2)

ただし, n:サンプルサイズ, s2:不偏分散, χ2(n-1,α/2):自由度n-1のときの上側α/2パーセント点, χ2(n-1,1-α/2):自由度n-1のときの下側α/2パーセント点.

これをシート上で計算するため,下のような見出しを作成しておきます。

Step 3n, df の入力または計算

サンプルサイズおよび自由度を計算または入力します(セルE2, E3)。

なお計算の場合は次式となります。

n =COUNT(B2:B32)
df =E2-1

Step 4s2の計算

不偏分散を求めます。

式は次のとおりです。

ver.2010 or later =VAR.S(B2:B32)
ver.2007 =VAR(B2:B32)

またここは,step 7の計算式を調整する前提で,不偏分散に代えて偏差平方和を表示させてもOKです。

Σ(xi-x bar)2 =DEVSQ(B2:B32)

Step 5信頼係数の入力

母分散σ2が推定する信頼区間に入る確からしさを指定します。一般には90%,95%,99%といったところが利用されます。

ここでは設定のとおり0.95(95%)を選択します。これにより,有意水準も決まります(1-信頼係数)。

Step 6χ2値の入力または計算

χ2分布おけるパーセント点を計算または入力します(直下は計算の例)。CHISQ.INV.RT関数は上側確率に対するχ2値を返すので,下側χ2値はCHISQ.INV.RT(有意水準α/2+信頼係数)で計算します(バージョン2007の場合:CHIINV関数)。

[上側] ver.2010 or later =CHISQ.INV.RT(E7/2, E3)
[下側] ver.2010 or later =CHISQ.INV.RT(E7/2+E8, E3)
[上側] ver.2007 =CHIINV(E7/2, E3)
[下側] ver.2007 =CHIINV(E7/2+E8, E3)

また直接入力する場合,χ2分布表から自由度n-1のときの上側確率に対応するχ2値を読み取ります。たとえば先に上げた3つの信頼係数に対応する値を示すと下の表のようになります。

上側 α/2% 点
90% 43.773
95% 46.979
99% 53.672
下側 α/2% 点(上側 1-α/2 %点)
90% 18.493
95% 16.791
99% 13.787

Step 7信頼区間の計算

Step 2の式から,信頼区間を求めます。ここでの式は具体的には,

下側信頼限界 =E3*E5/E11
上側信頼限界 =E3*E5/E12

となります。

またStep 4で偏差平方和を選択した場合,式は

下側信頼限界 =E5/E11
上側信頼限界 =E5/E12

とします。

Step 8信頼区間の計算(桁をくり上げる場合)

小数点以下x桁で値を丸める必要のあるとき,信頼区間を満たすよう 下は切り捨て・上は切り上げによって対応します。ここでは少数点以下の情報を落とすこととします。

下側 =ROUNDDOWN(D15,0)
上側 =ROUNDUP(F15,0)

結果:母分散の信頼区間は信頼係数95%[8874,24829]となります(標準偏差94~158字)。

参考文献

母分散の推定に対応するexcelアドインソフト

その他の参照