検出力を計算する方法【適切なサンプルサイズで検定しよう!】

検定

検出力(1-β)は、検定の確からしさを設計する上で重要な指標です。

今回はその検出力を計算する方法を紹介します。

今回は概念を押さえるために、z検定の場合(つまり母分散既知)での検出力の計算方法を紹介します。

基本的な概念さえ押さえておけば、実際のt検定における検出力設定などはEZRなどの統計ソフトに任せても良いでしょう。

検出力をテーマとした書籍は非常に貴重です。勉強する際はちょっと難しいですがこちらを読んでみて下さい。

動画でも紹介しています

スポンサーリンク

検出力を計算しよう

検定条件の設定

まずはz検定の流れを見てみましょう。

H0:帰無仮説 $$μ_0=μ_1$$

H1:対立仮説 $$μ_0≠μ_1$$

有意水準α:0.05

正規分布を用いた母平均の検定の場合、検定統計量は

$$z_0=\frac{\overline{x}-μ_0}{\sqrt{σ^2_0/n}}$$

となります。このZ0

$$|Z_0|>Z_{α/2}$$

となった場合H0を棄却して対立仮説を採択します。

これが母分散既知の平均値の検定である、z検定になります。

以前にも解説していますので、詳細を知りたい場合は以下の記事を参照してください。

検出力の計算

それでは本題に入ります。

検出力はH1:対立仮説が成り立つ前提で計算します。つまり

$$μ_0≠μ_1$$

という条件で計算するということです。

まず検出力1-βとは対立仮説が正しい場合に、対立仮説を採択する確率になります。

グラフで見ると、分かりやすいです。

H0を前提にするというのは、青色分布に注目するという事。

そしてH1に注目するという事は橙色分布に注目するという事です。

青色と橙色分布の距離が離れるほど、1-βつまり対立仮説を採択する可能性が上昇するのです。

よって1-βの値は以下の式によって導かれます。

$$1-β=Pr(|Z_0|>Z_{α/2})$$

Prはカッコ()内が成立する確率を示します。つまりこの式は先ほどの帰無仮説を棄却する確率は1-βであるということを示しています。

次にこのPr()内を変形させていきます。

ここでZ0は先に示したように

$$z_0=\frac{\overline{x}-μ_0}{\sqrt{σ^2_0/n}}$$

ですので、

$$1-β=Pr(|Z_0|>Z_{α/2})=Pr(\frac{\overline{x}-μ_0}{\sqrt{σ^2_0/n}}≦-Z_{α/2})+Pr(\frac{\overline{x}-μ_0}{\sqrt{σ^2_0/n}}≧Z_{α/2})$$

となります。

これを変形すると

$$1-β=Pr(\frac{\overline{x}-μ_1}{\sqrt{σ^2_0/n}}+\frac{μ_1-μ_0}{\sqrt{σ^2_0/n}}≦-Z_{α/2})+Pr(\frac{\overline{x}-μ_1}{\sqrt{σ^2_0/n}}+\frac{μ_1-μ_0}{\sqrt{σ^2_0/n}}≧Z_{α/2})$$

になります。ここで重要なのが対立仮説

$$μ_0≠μ_1$$

を前提として変形させるという事です。

$$1-β=Pr(Z_1≦-Z_{α/2}-\sqrt{n}Δ)+Pr(Z_1≧Z_{α/2}-\sqrt{n}Δ)$$

ただし

$$Δ=\frac{μ_1-μ_0}{σ_0}$$

Δは効果量です。青色橙色の分布の位置関係を示している値です。

$$Z_1=\frac{\overline{x}-μ_1}{\sqrt{σ^2_0/n}}$$

μ0と異なる(≠)μ1からなる検定統計量Z1が、ある値(不等式の右側)を下回る(or上回る)時に対立仮説が成り立つ確率、検出力の式が導出されました。

ちなみに帰無仮説が成り立つ際は以下の式、

$$1-β=Pr(\frac{\overline{x}-μ_1}{\sqrt{σ^2_0/n}}+\frac{μ_1-μ_0}{\sqrt{σ^2_0/n}}≦-Z_{α/2})+Pr(\frac{\overline{x}-μ_1}{\sqrt{σ^2_0/n}}+\frac{μ_1-μ_0}{\sqrt{σ^2_0/n}}≧Z_{α/2})$$

が、μ10何某の箇所において分子は0になるし10と同じ値になりますので、最初の式に戻ってしまいます。

これは帰無仮説が成り立つ場合、1-β=αということを示しています。

スポンサーリンク

検出力の式の使い方

基本的に検定の事前と事後に使用します。

検定前にはサンプルサイズを決定する

事前使用では、効果量Δを実績により任意に決定します。

また、検出力1-βは一般的には0.8で設定します。

有意水準αは0.05で設定します。

以上を決定すると、自動的にサンプルサイズnが決定されます。

このようにして、最適と思われるサンプルサイズを決定することが出来ます。

検定後に検定の確からしさをチェック

事前に設定した検出力とサンプルサイズは、設定した効果量が確かだった場合にのみ成り立ちます。

しかし実際には、効果量の実測値は設定値よりもズレますので、検定後にサンプルの効果量、サンプルサイズ、有意水準の値から検出力を算出します。

これで、検定がどれだけの検出力で実施されたのか確認できます。

また、この時の結果から検出力が足りていなかった場合は、効果量の実測値を利用して再度サンプルサイズを再算出して検定をやり直すことが出来ます。

スポンサーリンク

まとめ

今回は検出力の計算方法から、使用法までを解説しました。

実際には、EZRで検出力やサンプルサイズは算出出来るので、実用をする場合には以下の記事を参照ください。

検定において、検出力の計算はエクセルにデフォルトで搭載されておらず、また書籍も少ないので耳慣れない方も多いと思います。

逆を言えば、他の人もめったに使えないという事です。

ここで当記事と書籍を活用して、ぜひマスターしてください。

スポンサーリンク

今すぐ、あなたが統計学を勉強すべき理由

この世には、数多くのビジネススキルがあります。

その中でも、極めて汎用性の高いスキル。

それが統計学です。なぜそう言い切れるのか?

それはビジネスというのは、結局お金のやり取りであり、必ず数字が絡んできます。

そして数字を扱うスキルこそが統計学だからです。

故に一口に統計学といっても、

営業、マーケティング、研究開発、品質管理、工程管理、生産管理.etc

これら全てで使う事が出来るのです。

現に私は前職は品質管理、現職は研究開発職なのですが、面接のときに

「品質管理時に活用した、統計の知識を研究開発にも活かせます」

とアピールして職種をうまく切り替える事が出来ました。

そして、もし始めるなら今から勉強を始めましょう。

なんなら、今すぐこのページを閉じて本格的に勉強を開始するべきです。

なぜなら、このような『スキル』は20代でもっともキャリアアップに繋がるからです。

30代ならいざ知らず、40代になると求められるのはこれまでの業務を遂行してきた経験や人脈なのです。

これが無いとある一定以上のキャリアアップは望めませんし、40代以降のハイクラスの転職先も望めません。

20代のうちは成果を結び付けるためにこのスキルが大いに役立ちますが、年を経るごとに求められる働き方が変わるのでスキルの実績への寄与が減ってしまうのです。

なので、後からやればいいやと後回しにすると機を逸してしまう可能性が高いです。

ちなみにこれから統計学を学習をするというのであれば、ラーニングピラミッドというものを意識すると効率的です。

私自身、インプットだけでなく、youtubeや職場でアウトプットしながら活用する事で統計リテラシーを日々向上させていっています。

ぜひ、アナタも当ブログやyoutubeチャンネルで統計リテラシーを上げて、どこでも通用するビジネスパーソンになりましょう

スポンサーリンク
検定
スポンサーリンク
シグマアイ-仕事で使える統計を-

コメント