BDAstyle

ビジネスデータ分析ツールの作成 with Excel

母平均の信頼区間の推定 with Excel

ショートカット

信頼区間推定法のフローチャート

1. 母分散既知大標本のときのz推定

Case 1-Step 0シチュエーションの設定

家電メーカーY社は商品Aを製造しています。Y社はその商品Aに関して,M県での店頭販売価格を毎年調査しています。前回は全数調査をおこなっており,今回は標本調査をおこなうことになりました(母標準偏差[母分散]は既知と仮定)。そこで,M県全域から無作為に選んだAの取扱100店を対象にして,あるとき一斉に価格調査をおこなった結果が下の表です。

このデータからM県における平均価格を推定します。

初期データ

Case 1-Step 1前提

この例では母集団の分散が既知です。

また 標本サイズn≧100を満たすことから,

ものとし,z推定をすすめます。

Case 1-Step 2見出しの入力

母平均μの信頼区間は次の式によって求められます。

x-z(α/2)σ/√n≦μ≦x+z(α/2)σ/√n

ただし, x bar:標本平均, σ:母標準偏差, n:標本サイズ, z(α/2):標準正規分布の上側α/2パーセント点.

これをシート上で計算するため,下表のような見出しを作成しておきます。

Case 1-Step 3n, x bar, σ の入力または計算

標本サイズnを入力ないし計算します(後者の場合COUNT関数など)。また標本平均x barを計算します(AVERAGE関数)。さらに母標準偏差σは既知の値を入力します。

Case 1-Step 4信頼係数の決定

母平均μが推定する信頼区間に入る確からしさを指定します。一般には90%,95%,99%といったところが利用されます。標準正規分布の場合,信頼係数を大きくするほど区間の幅が広がります。

ここでは0.95(95%)を選択します。これにより,有意水準も決まります(1-信頼係数)。

Case 1-Step 5zの入力または計算

標準正規分布おけるパーセント点を計算または入力します(下は計算の例です)。NORM.S.INV関数は累積確率pに対するzの値を返すので,上側zNORM.S.INV(有意水準α/2+信頼係数)で計算します(バージョン2007の場合:NORMSINV関数)。このケース(信頼係数95%)では,p=97.5%として対応するzを求めることになります。

また直接入力する場合,標準正規分布表からpに対応するzを読み取ります。たとえば先に上げた3つの信頼係数に対応する上側zは,下の表のとおりです。

90% 1.64
95% 1.96
99% 2.58

Case 1-Step 6信頼区間の計算

Step 2の式から信頼区間を求めます。具体的には,

下側 =D5-D11*(D6/SQRT(D3))
上側 =D5+D11*(D6/SQRT(D3))

となります。

Case 1-Step 7信頼区間の計算(桁をくり上げる場合)

小数点以下の値を丸めるときは,信頼区間を満たすよう 下は切り捨て・上は切り上げによって対応します。

下側 =ROUNDDOWN(C14,0)
上側 =ROUNDUP(E14,0)

結果:M県での平均販売価格は,信頼係数95%31,804円~32,589円の間にあると考えられます。

Case 1-Step 8専用の関数を使うなら

式の内容をブラックボックスにしても問題のない場合,CONFIDENCE関数(ver.2007)あるいはCONFIDENCE.NORM関数(ver.2010以降)によっても計算できます。

ver.2007 =CONFIDENCE(α, σ, n)
ver.2010- =CONFIDENCE.NORM(α, σ, n)

戻り値は幅の半分(1/2)です。これをx barに加減して上限・下限を求めます。

2. 母分散既知小標本のときのz推定

Case 2-Step 0シチュエーションの設定

企業調査会社Yのリサーチャー数百人は,備品庫よりあたらしい鉛筆を自由に持ち出すことができます(1度に1本に限る)。持ち出す際には,各自で日付とIDを台帳に残すことになっています。

あるとき文具を管理する総務部では,ある月の使用本数についてどの程度のものか数字を出す必要に迫られました。過去に全員を対象とした集計をおこなったことはありますが(母標準偏差[母分散]既知と仮定),あらためて調べるのにも時間がかかります。そこで,まずは値を推定して報告することになりました。

社員マスタから無作為に28人を抽出し,台帳より使用本数を集計したものが下の表です。このデータから,ある月における鉛筆の平均使用本数を推定します。

初期データ

Case 2-Step 1前提

この例では母集団の分散が既知です。

また 標本サイズn≧100を満たさない点については,

ものとし,z推定をすすめます。

Case 2-Step 2見出しの入力

母平均μの信頼区間は次の式によって求められます。

x-z(α/2)σ/√n≦μ≦x+z(α/2)σ/√n

ただし, x bar:標本平均, σ:母標準偏差, n:標本サイズ, z(α/2):標準正規分布の上側α/2パーセント点.

これをシート上で計算するため,下表のような見出しを作成しておきます。

Case 2-Step 3n, x bar, σ の入力または計算

標本サイズnを入力ないし計算します(後者の場合COUNT関数など)。また標本平均x barを計算します(AVERAGE関数)。さらに母標準偏差σは既知の値を入力します。

Case 2-Step 4信頼係数の決定

母平均μが推定する信頼区間に入る確からしさを指定します。一般には90%,95%,99%といったところが利用されます。標準正規分布の場合,信頼係数を大きくするほど区間の幅が広がります。

ここでは0.95(95%)を選択します。これにより,有意水準も決まります(1-信頼係数)。

Case 2-Step 5zの入力または計算

標準正規分布おけるパーセント点を計算または入力します(下は計算の例です)。NORM.S.INV関数は累積確率pに対するzの値を返すので,上側zNORM.S.INV(有意水準α/2+信頼係数) で計算します(バージョン2007の場合:NORMSINV関数)。このケース(信頼係数95%)では,p=97.5%として対応するzを求めることになります。

また直接入力する場合,標準正規分布表からpに対応するzを読み取ります。たとえば先に上げた3つの信頼係数に対応する上側zは,下の表のとおりです。

90% 1.64
95% 1.96
99% 2.58

Case 2-Step 6信頼区間の計算

Step 2の式から信頼区間を求めます。具体的には,

下側 =D5-D11*(D6/SQRT(D3))
上側 =D5+D11*(D6/SQRT(D3))

となります。

Case 2-Step 7信頼区間の計算(桁をくり上げる場合)

小数点以下の値を丸めるときは,信頼区間を満たすよう 下は切り捨て・上は切り上げによって対応します。

下側 =ROUNDDOWN(C14,1)
上側 =ROUNDUP(E14,1)

結果:鉛筆の平均使用本数は,信頼係数95%3.6本~4.8本の間にあると考えられます。

Case 2-Step 8専用の関数を使うなら

式の内容をブラックボックスにしても問題のない場合,CONFIDENCE関数(ver.2007)あるいはCONFIDENCE.NORM関数(ver.2010以降)によっても計算できます。

ver.2007 =CONFIDENCE(α, σ, n)
ver.2010- =CONFIDENCE.NORM(α, σ, n)

戻り値は幅の半分(1/2)です。これをx barに加減して上限・下限を求めます。

3. 母分散未知大標本のときのz推定

Case 3-Step 0シチュエーションの設定

家電メーカーY社は商品Aを製造しています。Y社はその商品Aに関して,M県での店頭販売価格をはじめて調査します(母標準偏差[母分散]は未知)。予算の都合もあり,今回は標本調査をおこなうことになりました。そこで,M県全域から無作為に選んだAの取扱100店を対象にして,あるとき一斉に価格調査をおこなった結果が下の表です。

このデータからM県における平均価格を推定します。

初期データ

Case 3-Step 1前提

この例では母集団の分散が未知です。

また 標本サイズn≧100を満たすことから,

ものとし,z推定をすすめます。

Case 3-Step 2見出しの入力

母平均μの信頼区間は次の式によって求められます。

x-z(α/2)σ/√n≦μ≦x+z(α/2)σ/√n

ただし, x bar:標本平均, s:標本標準偏差, n:標本サイズ, z(α/2):標準正規分布の上側α/2パーセント点.

これをシート上で計算するため,下表のような見出しを作成しておきます。

Case 3-Step 3n, x bar, s の入力または計算

標本サイズnを入力ないし計算します(後者の場合COUNT関数など)。また標本平均x barを計算します(AVERAGE関数)。さらに標本標準偏差sを計算します(STDEV.P関数,2007の場合STDEVP関数)※。

nのとらえ方によっては不偏標準偏差(このサイトでは分散の分母がn-1の方分散・標準偏差と変動係数)でもいいかと思います(STDEV.S関数,2007の場合STDEV関数)。

Case 3-Step 4信頼係数の決定

母平均μが推定する信頼区間に入る確からしさを指定します。一般には90%,95%,99%といったところが利用されます。標準正規分布の場合,信頼係数を大きくするほど区間の幅が広がります。

ここでは0.95(95%)を選択します。これにより,有意水準も決まります(1-信頼係数)。

Case 3-Step 5zの入力または計算

標準正規分布おけるパーセント点を計算または入力します(下は計算の例です)。NORM.S.INV関数は累積確率pに対するzの値を返すので,上側zNORM.S.INV(有意水準α/2+信頼係数)で計算します(バージョン2007の場合:NORMSINV関数)。このケース(信頼係数95%)では,p=97.5%として対応するzを求めることになります。

また直接入力する場合,標準正規分布表からpに対応するzを読み取ります。たとえば先に上げた3つの信頼係数に対応する上側zは,下の表のとおりです。

90% 1.64
95% 1.96
99% 2.58

Case 3-Step 6信頼区間の計算

Step 2の式から信頼区間を求めます。具体的には,

下側 =D5-D11*(D6/SQRT(D3))
上側 =D5+D11*(D6/SQRT(D3))

となります。

Case 3-Step 7信頼区間の計算(桁をくり上げる場合)

小数点以下の値を丸めるときは,信頼区間を満たすよう 下は切り捨て・上は切り上げによって対応します。

下側 =ROUNDDOWN(C14,0)
上側 =ROUNDUP(E14,0)

結果:M県での平均販売価格は,信頼係数95%31,809円~32,584円の間にあると考えられます。

Case 3-Step 8専用の関数を使うなら

式の内容をブラックボックスにしても問題のない場合,CONFIDENCE関数(ver.2007)あるいはCONFIDENCE.NORM関数(ver.2010以降)によっても計算できます。

ver.2007 =CONFIDENCE(α, s, n)
ver.2010- =CONFIDENCE.NORM(α, s, n)

戻り値は幅の半分(1/2)です。これをx barに加減して上限・下限を求めます。

4. 母分散未知小標本のときのt推定

Case 4-Step 0シチュエーションの設定

企業調査会社Yのリサーチャー数百人は,備品庫よりあたらしい鉛筆を自由に持ち出すことができます(1度に1本に限る)。持ち出す際には,各自で日付とIDを台帳に残すことになっています。

あるとき文具を管理する総務部では,ある月の使用本数についてどの程度のものか数字を出す必要に迫られました。過去に同様の集計をおこなったことはなく,全数調査も難しい状況にあります(母標準偏差[母分散]未知)。そこで,今回は値を推定して報告することになりました。

社員マスタから無作為に28人を抽出し,台帳より使用本数を集計したものが下の表です。このデータから,ある月における鉛筆の平均使用本数を推定します。

初期データ

Case 4-Step 1前定

この例では母集団の分散が未知です。

また 標本サイズn≧100を満たさないことから,

ものとします。

Case 4-Step 2見出しの入力

信頼区間は次の式によって求めます。

x-t(n-1,α/2)s/√n-1≦μ≦x+t(n-1,α/2)s/√n-1

ただし, x bar:標本平均, s:標本標準偏差, n:標本サイズ, t(n-1; α/2):自由度 n-1 の t分布の上側α/2パーセント点.

これをシート上で計算するため,下表のような見出しを作成しておきます。

Case 4-Step 3n, df, x bar, s の入力または計算

標本サイズn,自由度dfを入力ないし計算します(計算の場合COUNT関数など)。また標本平均x barを計算します(AVERAGE関数)。さらに標本標準偏差sを計算します(STDEV.P関数,2007の場合STDEVP関数)。

Case 4-Step 4信頼係数の決定

母平均μが推定する信頼区間に入る確からしさを指定します。一般には90%,95%,99%といったところが利用されます。t分布の場合も,信頼係数を大きくするほど区間の幅が広がります。

ここでは0.95(95%)を選択します。これにより,有意水準も決まります(1-信頼係数)。

Case 4-Step 5tの入力または計算

自由度n-1t分布おけるパーセント点を計算または入力します(下は計算の例です)。T.INV.2T関数は自由度n-1のときの両側確率pNORM.S.INVとの違い)に対する上側のtを返すので,T.INV.2T(p, df)として計算します(バージョン2007の場合:TINV関数)。このケース(信頼係数95%)では有意水準α=5%=pとなります。

また直接入力する場合,t分布表から自由度n-1のときの両側pに対応するtを読み取ります。たとえば先に上げた3つの確率に対応する上側tdf=27のとき)は,下の表のようになります。

90% 1.703
95% 2.052
99% 2.771

Case 4-Step 6信頼区間の計算

Step 2の式から信頼区間を求めます。具体的には,

下側 =D6-D12*(D7/SQRT(D3-1))
上側 =D6+D12*(D7/SQRT(D3-1))

となります。

Case 4-Step 7信頼区間の計算(桁をくり上げる場合)

小数点以下の値を丸めるときは,信頼区間を満たすよう 下は切り捨て・上は切り上げによって対応します。

下側 =ROUNDDOWN(C15,1)
上側 =ROUNDUP(E15,1)

結果:鉛筆の平均使用本数は,信頼係数95%3.5本~4.9本の間にあると考えられます。

Case 4-Step 8専用の関数を使うなら

式の内容をブラックボックスにしても問題のない場合,ver.2010以降に限りCONFIDENCE.T関数によっても計算できます。この場合,不偏標準偏差(このサイトでは分散の分母がn-1の方;STDEV.S関数の戻り値分散・標準偏差と変動係数)に差し替えて計算します。

ver.2007 該当関数なし
ver.2010- =CONFIDENCE.T(α, 不偏標準偏差, n)

戻り値は幅の半分(1/2)です。これをx barに加減して上限・下限を求めます。

参考文献

母平均の推定に対応するexcelアドインソフト

その他の参照