中堅商社Z社の経理部門では,毎月末の経費精算の入力作業にかかる時間が大きな負担となっていました。そこで,OCRとRPAを組み合わせた「自動入力システム」の導入を検討しています。
導入の稟議を通すため,従来の「手作業(A群)」と「自動入力システム(B群)」で,それぞれ100枚の領収書を処理するのにかかる時間(分)を,複数の担当者に協力してもらい計測しました。下表がその結果です(単位:分。無作為による抽出。なお,ここでは諸々の制限からデータの数は均一にできなかったと仮定します)。
平均と不偏分散を求めてみると,下表のようになりました。
| CELL F2 | =AVERAGE(B2:B19) |
|---|---|
| CELL F3 | =VAR.S(B2:B19) |
| CELL G2 | =AVERAGE(C2:C16) |
| CELL G3 | =VAR.S(C2:C16) |
システム(B群)の方が平均処理時間が短く,また機械的な処理であるため人によるばらつき(分散)も小さいようです。この平均時間の差が確率的に意味のあるものなのか,t検定によって確認します。
なお,A群とB群で明らかに分散が異なる(等分散ではない)ため,ここではウェルチのt検定(非等分散を仮定した2標本)をおこないます(両側検定,有意水準5%)。
工程
母集団は正規分布にしたがうものとみなします(仮定)。また,帰無仮説H0と対立仮説H1は次のように設定します。
| H0 | μA=μB(手作業とシステムによる処理時間の母平均に差はない) |
|---|---|
| H1 | μA≠μB(手作業とシステムによる処理時間の母平均に差がある) |
ただし,μ:母平均。
ExcelではT.TEST関数を使用することで,複雑な自由度の計算などを経ることなく,ダイレクトにP値を求めることができます。
| P値 | =T.TEST(配列1, 配列2, 尾の部分, 検定の種類) |
|---|
引数の「検定の種類」は,以下の対応表に基づき,シチュエーションに合わせて指定します。
| 1 | 対応のある検定(同じ被験者の前後比較など) |
|---|---|
| 2 | 等分散を仮定した2標本(2群の分散が等しいとみなせる場合) |
| 3 | 非等分散を仮定した2標本(ウェルチのt検定) |
今回の例では,STEP 0で確認した通り2群の分散に明らかな差があるため,「3」を指定します。
ExcelのT.TEST関数を使用せず、手計算でウェルチのt検定をおこなう場合、検定統計量($t$値)は以下の式で求められます。
さらに厄介なのが自由度($\nu$)の算出です。等分散を仮定できないため、自由度は以下の「ウェルチ・サタスウェイトの近似式」という非常に複雑な数式を用いて算出されます。
ただし、$\bar{X}$:標本平均、$s^2$:不偏分散、$n$:サンプルサイズです。
実務において、この計算を電卓や手作業のセル参照でおこなうのはミスの温床となりがちです。それゆえ、内部でこの複雑な近似計算を自動処理し、ダイレクトにP値を弾き出してくれるT.TEST関数(検定の種類:3)の利用が強く推奨されます。
有意水準を0.05(5%)とし,「差があること」を確認するため尾の部分には「2(両側検定)」を指定します。
| CELL F5 | =T.TEST(B2:B19,C2:C16,2,3) |
|---|
P値は 0.0013 となりました。
得られたP値を,あらかじめ決めておいた有意水準(α)と比較して判断します。
| 判断 | P値(0.0013) < 有意水準(0.05) |
|---|
P値が有意水準を下回ったため,帰無仮説H0は棄却されます。したがって,「手作業とシステムによる処理時間の平均には,統計的に有意な差がある」と判断します。
中堅商社Z社は,「自動入力システムの導入によって,従来の作業時間を有意に短縮できる」という客観的な裏付けを得ることができました。これを受けて,経理部門は全社的なシステム導入を推進することを決定しました。