BDAstyle

ビジネスデータ分析ツールの作成 with Excel

正規分布の確率とパーセント点の計算 with Excel

正規分布

1. 確率変数x から確率を求める

Step 0シチュエーションの設定

建設資材製造X社が製造する直径50mm規格の丸鋼Aの製品品質は,平均50.02mm, 標準偏差0.07mmの正規分布にしたがうことがわかっています。

Step 1NORMDIST, NORM.DIST関数

正規分布における下側確率(「累積確率」とも)は,エクセルではNORMDIST(バージョン2007,ただし後方に互換性あり。以下のバージョン2007用関数に同じ)またはNORM.DIST(バージョン2010以降)関数で求めます。引数は,それぞれ次のとおりです。

[ver.2007] NORMDIST(x, 平均, 標準偏差, 関数形式) ―"Office"

[ver.2010 or later] NORM.DIST(x, 平均, 標準偏差, 関数形式) ―"Office"

引数「関数形式」は,[true]の指定で下側確率(面積)が,[false]の指定で確率密度(高さ)が返ります(ここでは後者を指定する手続きはありません)。

また求めたいものが上側の確率であれ,区間のそれであれ,いずれもNORMDISTあるいはNORM.DIST関数にて求められます。

Step 2あるxより小さくなる(※)確率――下側確率p

※連続型確率変数がある1点をとる確率=0[cf. 連続確率分布―"Wikipedia"]。ここでは「以下」や「以上」といった境界を含む表現と差異はないものと考えます(以下に同じ)。

最初に,直径が50.00mmを下回る丸鋼が製造される確率を求めます。x=丸鋼Aの直径50.00mmとしてNORMDISTまたはNORM.DIST関数による計算式を作成すると,下図・下表のようになります。

2007 =NORMDIST(B4,B1,B2,TRUE)
2010 or later =NORM.DIST(B4,B1,B2,TRUE)

戻り値:0.388(38.8%)[※少数点第4位で四捨五入。以下に同じ]。これは,下のグラフ[※イメージ。以下に同じ]のグレーの彩色部分の面積です。

Step 3あるxより大きくなる確率――上側確率1-p

つづいて,直径が50.05mmを上回る丸鋼が製造される確率を求めます。x=丸鋼Aの直径50.05mmとして,NORMDISTまたはNORM.DIST関数による計算式を作成します。

2007 =1-NORMDIST(B4,B1,B2,TRUE)
2010 or later =1-NORM.DIST(B4,B1,B2,TRUE)

戻り値:0.334(33.4%)。これは,下のグラフのグレーの彩色部分の面積です。

Step 4区間 x1~ x2 内の値をとる確率px2-px1

Step 2・3の結果を未知と仮定して,直径が50.00mm50.05mmの丸鋼Aが製造される確率を求めます。x1=丸鋼Aの直径50.00mm, x2=丸鋼Aの直径50.05mmとしてNORMDISTまたはNORM.DIST関数による計算式を作成します。

2007 =NORMDIST(B5,B1,B2,TRUE)-NORMDIST(B4,B1,B2,TRUE)
2010 or later =NORM.DIST(B5,B1,B2,TRUE)-NORM.DIST(B4,B1,B2,TRUE)

戻り値:0.278(27.8%)。これは,下のグラフのグレーの彩色部分の面積です。

2. 下側確率p または 上側確率1-p から確率変数x を求める[パーセント点]

Step 1NORMINV, NORM.INV関数

上と同じシチュエーションを使って,1.とは逆に,下側確率pまたは上側確率1-pの値をもとに直径を求めていきます。この計算は,エクセルではNORMINV(バージョン2007)またはNORM.INV(バージョン2010以降)関数で求めます。引数は,それぞれ次のとおりです。

[ver.2007] NORMINV(確率, 平均, 標準偏差) ―"Office"

[ver.2010 or later] NORM.INV(確率, 平均, 標準偏差) ―"Office"

Step 2下側確率p のときの確率変数x

最初に,下側確率が38.8%のときの丸鋼Aの直径を求めるものとします。p=0.388としてNORMINVまたはNORM.INV関数による計算式を作成すると,下図・下表のようになります。

2007 =NORMINV(B4,B1,B2)
2010 or later =NORM.INV(B4,B1,B2)

戻り値:50.00(mm)。これは,下のグラフの横軸上・赤色のマーカー部分の値です。

Step 3上側確率1-p のときの確率変数x

次に,上側確率が33.4%のときの丸鋼Aの直径を求めます。1-p=0.334としてNORMINVまたはNORM.INV関数による計算式を作成すると,下図・下表のようになります。

2007 =NORMINV(1-B4,B1,B2)
2010 or later =NORM.INV(1-B4,B1,B2)

戻り値:50.05(mm)。これは,下のグラフの横軸上・赤色のマーカー部分の値です。

標準正規分布

3. 基準値z から確率を求める

Step 1NORMSDIST, NORM.S.DIST関数

標準正規分布における下側確率(「累積確率」とも)は,エクセルではNORMSDIST(バージョン2007)または NORM.S.DIST(バージョン2010以降)関数で求めます。引数は,それぞれ次のとおりです。

[ver.2007] NORMSDIST(z) ―"Office"

[ver.2010 or later] NORM.S.DIST(z, 関数形式) ―"Office"

引数"z":基準値。zスコア, 標準得点とも。「関数形式」は前述のNorm.Dist関数に同じ。

また求めたいものが上側の確率であれ,区間のそれであれ,いずれもNORMSDISTあるいはNORM.S.DIST関数にて求められます。

Step 2あるzより小さくなる確率――下側確率p

最初に,z-1.644を下回る確率を求めます。z=-1.644としてNORMSDISTまたはNORM.S.DIST関数による計算式を作成すると,下図・下表のようになります。

2007 =NORMSDIST(B1)
2010 or later =NORM.S.DIST(B1,TRUE)

戻り値:0.050(5%)。これは,下のグラフのグレーの彩色部分の面積です。

Step 3あるzより大きくなる確率――上側確率1-p

つづいて,z1.282を上回る確率を求めます。z=1.282としてNORMSDISTまたはNORM.S.DIST関数による計算式を作成します。

2007 =1-NORMSDIST(B1)
2010 or later =1-NORM.S.DIST(B1,TRUE)

戻り値:0.100(10%)。これは,下のグラフのグレーの彩色部分の面積です。

Step 4区間 z1~ z2 内の値をとる確率pz2-pz1

z-1.960~1.960の値をとる確率を求めます。z1=-1.960, z2=1.960としてNORMSDISTまたはNORM.S.DIST関数による計算式を作成します。

2007 =NORMSDIST(B2)-NORMSDIST(B1)
2010 or later =NORM.S.DIST(B2,TRUE)-NORM.S.DIST(B1,TRUE)

戻り値:0.950(95%)。これは,下のグラフのグレーの彩色部分の面積です。

4.下側確率p または 上側確率1-p から基準値z を求める[パーセント点]

Step 1NORMSINV, NORM.S.INV関数

ここでは下側確率pまたは上側確率1-pをもとにzを求めていきます。つまり,3.とは逆の考え方です。この計算は,エクセルではNORMSINV(バージョン2007)またはNORM.S.INV(バージョン2010以降)関数で求めます。関数の引数は,次のとおりです。

[ver.2007] NORMSINV(確率) ―"Office"

[ver.2010 or later] NORM.S.INV(確率) ―"Office"

Step 2下側確率pのときの基準値z

1に,下側確率が25.0%のときの基準値zを求めます。p=0.250としてNORMSINVまたはNORM.S.INV関数による計算式を作成すると,下図・下表のようになります。

2007 =NORMSINV(B1)
2010 or later =NORM.S.INV(B1)

戻り値:-0.674。これは,下のグラフの横軸上・赤色のマーカー部分の値です。

Step 3上側確率1-pのときの基準値z

2に,上側確率が15.9%のときの基準値zを求めます。1-p=0.159としてNORMSINVまたはNORM.S.INV関数による計算式を作成すると,下図・下表のようになります。

2007 =NORMSINV(1-B1)
2010 or later =NORM.S.INV(1-B1)

戻り値:1.000。これは,下のグラフの横軸上・赤色のマーカー部分の値です。

参考文献

その他の参照