BDAstyle

ビジネスデータ分析ツールの作成 with Excel

母比率の信頼区間の推定 with Excel

ショートカット

1. 大標本のときの z推定

Case 1-Step 0シチュエーションの設定

スナック菓子製造X社は,新商品のパッケージデザインについて,社内評価の高いものから順にA~D4つの案を持っています。X社は今のところA案を採用したいと考えていますが,不安もあります。そこでこの商品のメインターゲット層に対し,反応を探ってみることになりました。

具体的には,ターゲットとなる特定の属性の女性30人(ここでは無作為の抽出と仮定します)に,A~Dについて支持できるデザインを1つだけ選択してもらう…といった調査をおこないました。下の表がその結果です。

このデータから,メインターゲット層のデザインAに関する支持率の区間推定をおこないます。結果,信頼係数80%で下側が50%を超えてくるようであれば,X社はデザインAを採択する方針です。

Case 1-Step 1前提

母集団の分布は不明です。しかし標本サイズn≧30を満たすことから,標本比率は正規分布に近似的に従うと判断し,z分布を使って推定をすすめます。

Case 1-Step 2見出しの入力

母比率Pの信頼区間は次の式によって求められます。

p-z(α/2)√p(1-p)/n≦P≦p+z(α/2)√p(1-p)/n

ただし, p bar:標本比率, √p(1-p):標本標準偏差, n:標本サイズ, z(α/2):標準正規分布の上側α/2パーセント点.

これをシート上で計算するため,下表のような見出しを作成しておきます。

Case 1-Step 3p bar, n, √p(1-p) の入力または計算

A案について標本比率p barを計算します(セルC4)。これを別途転記し(セルF5,一覧性の点から),さらに標本サイズnを転記します(セルF3,同)。

加えて標準偏差√p(1-p)を計算します(セルF6)。

Case 1-Step 4信頼係数の決定

母比率Pが推定する信頼区間に入る確からしさを指定します。一般には90%,95%,99%といったところが利用されます。

ここでは設定のとおり0.80(80%)を選択します。これにより,有意水準も決まります(1-信頼係数)。

Case 1-Step 5zの入力または計算

標準正規分布おけるパーセント点を計算または入力します(下は計算の例です)。NORM.S.INV関数は累積確率cpに対するzの値を返すので,上側zNORM.S.INV(有意水準α/2+信頼係数)で計算します(バージョン2007の場合:NORMSINV関数)。このケース(信頼係数80%)では,cp=90%として対応するzを求めることになります。

また直接入力する場合,標準正規分布表からcpに対応するzを読み取ります。たとえば先に上げた3つの信頼係数を加えて,対応する上側zを示すと下の表のようになります。

80% 1.28
90% 1.64
95% 1.96
99% 2.58

Case 1-Step 6信頼区間の計算

Step 2の式から,信頼区間を求めます。ここでの式は具体的には,

下側 =F5-F11*(F6/SQRT(F3))
上側 =F5+F11*(F6/SQRT(F3))

となります。

Case 1-Step 7信頼区間の計算(桁をくり上げる場合)

小数点以下x桁で値を丸めるとき,信頼区間を満たすよう 下は切り捨て・上は切り上げによって対応します。ここでは少数点4桁以降の情報を落とすこととします。

下側 =ROUNDDOWN(E14,3)
上側 =ROUNDUP(G14,3)

結果:メインターゲット層の支持に関して,信頼係数80%のとき下側信頼限界は50%をこえることが確認できます。

Case 1-Step 8専用の関数を使うなら

式の内容をブラックボックスにしても問題のない場合,CONFIDENCE関数(ver.2007)あるいはCONFIDENCE.NORM関数(ver.2010以降)によっても計算できます。

ver.2007 =CONFIDENCE(α, √p(1-p), n)
ver.2010- =CONFIDENCE.NORM(α, √p(1-p), n)

戻り値は幅の半分(1/2)です。これをp barに加減して上限・下限を求めます。

2. 小標本のときの F推定

Case 2-Step 0シチュエーションの設定

ある大学の大学祭実行委員会は,この年の成功を左右するイベント“企画Aを学生に対し積極的にPRしています。

周知期間をいくらか経たのち,さらに周知を続けるべきかが議論され,結局,効果を測定してから判断しようという方針になりました。そこで,無作為に抽出した20人の学生に対し,企画Aを知っているか聞き取りをおこなった結果が下の表です。

このデータから,現時点における企画Aの認知度を推定します。

Case 2-Step 1前提

標本サイズn≧30を満たさないことから,標本比率は正規分布にしたがわないと判断し,F分布を使って推定をすすめます。

Case 2-Step 2見出しの入力

母比率Pの信頼区間は次の式によって求められます。

n2/n1F(n1,n2;α/2)+n2≦P≦m1F(m1,m2;α/2)/m1F(m1,m2;α/2)+m2 ただし, n1=2n(1-p)+2, n2=2np, m1=2np+2, m2=2n(1-p)

p bar:標本比率, n:標本サイズ. また, F(n1,n2;α/2):自由度n1, n2のF分布の上側α/2パーセント点, F(m1,m2;α/2):自由度m1, m2のF分布の上側α/2パーセント点.

これをシート上で計算するため,下表のような見出しを作成しておきます。

Case 2-Step 3p bar, n, n1~m2 の入力または計算

認知度(「知っている」)について標本比率p barを計算し(セルC4)別途転記します(セルF5,一覧性の点から)。さらに標本サイズnを転記し(セルF3,同),p barおよびnをもとに自由度n1,n2,m1,m2を計算します。

Case 2-Step 4信頼係数の決定

母比率Pが推定する信頼区間に入る確からしさを指定します。一般には90%,95%,99%といったところが利用されます。

ここでは0.95(95%)を選択します。これにより,有意水準も決まります(1-信頼係数)。

Case 2-Step 5Fの計算

自由度n1,n2,自由度m1,m2のそれぞれのF分布におけるパーセント点を計算します。F.INV.RT関数は上側確率pに対するFの値を返すので,F.INV.RT(有意水準α/2, 第1自由度, 第2自由度)として計算します(バージョン2007の場合:FINV関数)。このケース(信頼係数95%)では有意水準α=5%となります。

Case 2-Step 6信頼区間の計算

Step 2の式から信頼区間を求めます。具体的には,

下側 =F8/(F7*F15+F8)
上側 =F9*F16/(F9*F16+F10)

となります。

Case 2-Step 7信頼区間の計算(桁をくり上げる場合)

小数点以下x桁で値を丸めるとき,信頼区間を満たすよう 下は切り捨て・上は切り上げによって対応します。ここでは少数点3桁以降の情報を落とすこととします。

下側 =ROUNDDOWN(E19,2)
上側 =ROUNDUP(G19,2)

結果:学生における企画Aの認知率は,信頼係数95%23%~69%の間にあると考えられます。

参考文献

母比率の推定に対応するexcelアドインソフト

その他の参照