BDAstyle

ビジネスデータ分析ツールの作成 with Excel

t分布の確率とパーセント点の計算 with Excel

Step 0シチュエーションの設定

ここでは,下のようなt分布表上側確率)を使って確率あるいはt値を求める作業を,エクセルでの処理に置き換えて見ていきます。

以下共通の設定として,自由度は9(サンプルサイズn=10)とします。また0.5を超える片側確率は扱わないものとします。

1. 確率変数 t から確率を求める

Step 1ある t より大きくなる確率――上側確率

t=1.833のとき,t分布表において上側確率は0.05 (5%)とわかります(下図矢印の手順)。

Step 2TDIST, T.DIST.RT関数

この上側確率は,エクセルではTDIST(バージョン2007,ただし後方に互換性あり。以下のバージョン2007用関数に同じ)またはT.DIST.RT(バージョン2010以降)関数で求めます。引数は,それぞれ次のとおりです。

[ver.2007] TDIST(t, 自由度, 尾部※) ―"Office"

※引数「尾部」は,[1] の指定で上側確率(面積)が,[2] の指定で両側確率が返ります。ここで求めたいのは上側ですから[1]を用います

[ver.2010 or later] T.DIST.RT(t, 自由度) ―"Office"

具体的には,下図・下表のような式で上側確率が求められます。

2007 =TDIST(B3,B2,1)
2010 or later =T.DIST.RT(B3,B2)

戻り値:0.050(5%)[※少数点第4位で四捨五入。以下に同じ]。これは,下のグラフ[※イメージ。以下に同じ]のグレーの彩色部分の面積です。

Step 3ある t より小さくなる確率――下側確率

ここでは0より小さなtの値を想定し,このtのときの下側確率を求めます。

先のt分布表(上側の確率とtとの対応が記されたもの)を使って下側確率を求めるとなると,マイナスのt が載っていないのでtの絶対値をとることになります。

Step 4TDIST, T.DIST.RT, T.DIST関数

1つに,エクセルでも上の考え方と同様にして,tの絶対値をとって下側確率を求める方法があります。

具体的には,下図・下表のような式で下側確率が求められます。

2007 =TDIST(ABS(B3),B2,1)
2010 or later =T.DIST.RT(ABS(B3),B2)

また2つ目として,T.DIST関数を用いる方法があります(バージョン2010以降)。この場合には絶対値をとる必要はありません(下図)。

[ver.2010 or later] T.DIST(t, 自由度, 関数形式※) ―"Office"

※引数「関数形式」は,[true] の指定で下側(累積)確率が,[false] の指定で確率密度(高さ)が返ります(ここでは後者を指定する手続きはありません)。

具体的には,下図・下表のような式で下側確率が求められます。

2010 or later =T.DIST(B3,B2,TRUE)

戻り値:0.050(5%)。これは,下のグラフのグレーの彩色部分の面積です。

Step 5ある t の絶対値より大きくなる確率――両側確率

|t|=2.262のとき,t分布表において両側確率は0.05(5%,上側2つ分2.5%×2とわかります(下図矢印の手順)。

Step 6TDIST, T.DIST.2T関数

t分布における両側確率は,TDISTまたはT.DIST.2T(バージョン2010以降)関数で求めます。関数の引数は,それぞれ次のとおりです。

[ver.2007] TDIST(|t|, 自由度, 尾部※)

※引数「尾部」は,[1] の指定で上側確率(面積)が,[2] の指定で両側確率が返ります。ここで求めたいのは両側ですから[2]を用います

[ver.2010 or later] T.DIST.2T(|t|, 自由度) ―"Office"

具体的には,下図・下表のような式で両側確率が求められます。

2007 =TDIST(abs(B3),B2,2)
2010 or later =T.DIST.2T(abs(B3),B2)

マイナスの t を扱うときのみ

戻り値:0.050(5%)。これは,下のグラフのグレーの彩色部分の面積です。

2. 片側確率(上or下) または 両側確率 から確率変数t を求める[パーセント点]

Step 1片側確率p のときの確率変数t

p=0.05のとき,t分布表においてt1.833とわかります(下図矢印の手順)。

Step 2TINV, T.INV.2T, T.INV関数

片側pに対するパーセント点は,TINV(バージョン2007)またはT.INV.2T(バージョン2010以降)関数で求めます。引数は,それぞれ次のとおりです。

[ver.2007] TINV(両側2*p, 自由度) ―"Office"

[ver.2010 or later] T.INV.2T(両側2*p, 自由度) ―"Office"

※引数「両側2*p」に注意です。これらの関数は両側(換算の)確率を要求します。

具体的には,下図・下表のような式でtが求められます。

2007 =TINV(2*B3,B2)
2010 or later =T.INV.2T(2*B3,B2)

戻り値:1.833。これは,下のグラフの横軸上・赤いマーカー部分の値です。0より大きな方のtのみ返されるので,下側確率をもとにした処理の場合,t-1を乗じます。

またバージョン2010以降では,T.INV関数を用いる方法もあります。この場合はtの符号について調整する必要はありません(下図)。

T.INV関数の引数は次のとおりです。

[ver.2010 or later] T.INV(下側p, 自由度) ―"Office"

具体的には,下図・下表のような式でtが求められます。

下側確率をもとにした計算 =T.INV(B3,B2)
上側確率をもとにした計算 =T.INV(1-B3,B2)

戻り値:-1.833 or 1.833。これは,下のグラフの横軸上・赤色のマーカー部分の値です。

Step 3両側確率2*p のときの確率変数t

両側確率(2*p)=0.05のとき(片側は両側の半分),t分布表においてt2.262とわかります(下図矢印の手順)。

Step 4TINV, T.INV.2T, T.INV関数

両側2*pに対するパーセント点は,TINV(バージョン2007)またはT.INV.2T(バージョン2010以降)関数で求めます。ただし0より大きな方のtのみが返されます。引数は,それぞれ次のとおりです。

[ver.2007] TINV(両側2*p, 自由度)

[ver.2010 or later] T.INV.2T(両側2*p, 自由度)

具体的には,下図・下表のような式でtが求められます。

2007 =TINV(B3,B2)
2010 or later =T.INV.2T(B3,B2)

戻り値:2.262。これは,下のグラフの横軸上・赤色のマーカー部分の値です。

またバージョン2010以降では,T.INV関数を用いる方法もあります。これは いずれかのtをピンポイントで求めます(下図)。

0より小さなt =T.INV(B3/2,B2)
0より大きなt =T.INV(1-B3/2,B2)

戻り値:-2.262 and 2.262。これは,下のグラフの横軸上・赤色のマーカー部分の値です。

参考文献

その他の参照