検出力に基づいたサンプルサイズの設定は、検定を誤判定を避けるために非常に大切なことです。
しかしながら、基本的なt検定の検出力の理論でさえ実は相当に難しいです。
非心t分布だの、近似式を用いるだの正直ややこしいし、相手にする気が起きません。
そもそも、研究者ならいざ知らず私のようなサラリーマンのように道具として統計学を使う場合、必要以上に理論を追いかける必要はないと思います。
なので、ある程度概念だけ理解しておいて、ややこしい計算はソフトに任せるべきでしょう。
ということで、今回はt検定における検出力とサンプルサイズの算出をEZRで導く方法を紹介します。
今回はこちらの本を参考にします。
検出力やサンプルサイズにきちんと言及した本というのは、非常に少なくそんな中で代表的な一冊になります。
ぜひご一読ください。
t検定の検出力
かなり難しい検出力の式
t検定の検出力の式は、かなり難しいです。
式は以下になります。
$$1-β=Pr{t_0≦-t(φ,α)}+Pr{t_0≧t(φ,α)}$$
t0が非心t分布に従う場合のPrの値は以下の近似式
$$Pr(t’ ≦ w)≈Pr[u≦\frac{w[1-1/4φ]-λ]}{\sqrt{1+w^2/(2φ)}}]$$
に従うらしいです。
さすがにマニアックすぎて、まともに相手をする気になりません。
z検定で考え方だけ押さえておこう
基礎概念は、z検定における検出力、サンプルサイズ算出に類します。
こちらの記事に挙げたように、対立仮説が成立する前提で
$$1-β=Pr(|Z_0|>Z_{α/2})$$
を変形させることで検出力の算出が可能になるのですが、このzがtに変わるだけです。
ただ、対象とするt分布が特殊なものになるために式が相当にややこしくなっています。
道具を使う上で、道具について完全完璧に理解している必要はないと思います。
我々はパソコンや車がどういう原理で動いているかを理解していなくとも、使いこなすことが出来ています。
さすがに統計学においては、パソコンや車よりかは原理やメカニズムを理解していないと誤使用の元になりかねませんが、かといってどこまでも追及しているといつまで経っても使う事が出来ません。
結局どこかで妥協する必要があります。
私はt検定の検出力の式は、そこまで必死に理解する必要はないように思います。
z検定の検出力、サンプルサイズで十分ではないでしょうか?
EZRでのt検定
ということで本題です。
今回は、対応の無い2群のt検定の検出力とサンプルサイズの算出方法を紹介します。
対応のない2群のt検定に関してはこちらを参照ください。
面倒な解析はソフトに任せよう
ということで、さっそく始めます。
基本的には、
・事前検証:狙いの検出力に対して、予測される効果量からサンプルサイズを導く
・事後検証:実データの効果量とサンプルサイズを使って、検出力を導く
をやってみましょう。
事前検証:サンプルサイズの算出
事前検証の条件として
平均値4、5で標準偏差2と予測される分析対象の適切なサンプルサイズを導いてみましょう。
検出力は0.8狙うとします。
まずは、EZRを起動します。
タブの統計解析を選択し、必要サンプルサイズの計算を選びます。
この中から2群の平均値の比較のためのサンプルサイズの計算を選びます。
そうすると、このような画面が出ますので
平均値の差(この場合5-4=1)
標準偏差(この場合2)
を入力します。
方法は両側検定か片側検定(One-sided)を選択し最後にOKをクリックします。
するとこのように、出力に結果が出てきます。
注目すべきは必要サンプルサイズで、結果としてはN=63必要となります。
ちなみに同時に検出力とサンプルサイズの関係を示したグラフも出力されます。
このグラフで指定の検出力(=0.8)以外のサンプルサイズも分かります。もしサンプルサイズがどうしても揃えられない場合、どの程度の検出力になるのかもこれで予想が出来るわけです。
これで事前検証完了です。
事後検証:検出力の算出
N=63を揃えて検定したところ、
平均値が3.5と5で、標準偏差が1.7だったとします。
この場合の検出力を導きます。
タブの統計解析を選択し、必要サンプルサイズの計算を選びます。
そして2群の平均値の比較のための検出力の計算を選びます。
そうすると、このような画面が出ますので
平均値の差(この場合5-3.5=1.5)
標準偏差(この場合1.7)
タイプ1、タイプ2のサンプルサイズを入力します(ともにN=63)。
を入力します。
有意水準0.05はデフォルトで入力されています。こちらは任意で変更してください。
方法は両側検定か片側検定(One-sided)を選択し最後にOKをクリックします。
すると、以下のように出力に結果が表示されます。
結果として検出力は0.99でした。
こちらもグラフが表示されます。
このように検出力0.8を狙うのであれば、N=20~25程度が良かったという事が分かります。
検出力は大きすぎると、第1種の過誤を犯す危険性が出てきます。
このように事前検証が必ず正しいとは限らないため、事後検証はぜひとも実施してください。
まとめ
今回はt検定の検出力の事前/事後検証の実施方法を紹介しました。
EZRを使えば、簡単に検定に必要な検出力やサンプルサイズを割り出すことが出来ます。
EZRを使えるようになると、様々な統計手法を簡単に実用する事が出来るようになり、それは貴重なスキルなので、市場価値が高まります。
また、今回の事例で示したように、事前検証と事後検証は思った以上に乖離します。
本当に正しく検定が出来ているかを確認するためにも、事前/事後検証はぜひ実施してください。
コメント