以前正規分布による平均値の検定(z検定)の検出力とサンプルサイズの算出を紹介をしました。
しかしながら、実際に検定を行う際は標準偏差は未知であり、z検定を実際に使うことはまずありません(z検定は標準偏差が既知であることが条件だからです)。
なので、今回は以前紹介したz検定から派生させて実戦で使えるt検定の検出力を紹介します。
今回の内容は以下の本に記載されています。検出力、サンプルサイズの算出に関してほぼ唯一詳細に紹介している稀有な本ですので、ぜひご一読することをお勧めします。
t検定の検出力の計算
非心t分布を利用しよう
検出力1-βは対立仮説H1が
$$H1:μ≠μ_0$$
のもとで計算します。この場合においてt0
$$t_0=\frac{\overline{x}-μ_0}{\sqrt{V/n}}$$
はt分布ではなく、非心t分布に従います。(はサンプルの平均で、Vはサンプルの分散、nはサンプルサイズです)
この非心t分布はかなり難しいらしく、本では近似的に確率を導く式が紹介されていました。
続けますが、検出力1-βはH1対立仮説が採択される場合
$$1-β=Pr[|t_0|≧t(φ,α)]=Pr[t_0≦-t(φ,α)]+Pr[t_0≧t(φ,α)]$$
と求めます。この場合のφは自由度でαは有意水準です。
そしてここからが肝心なのですが、先述したようにt0は非心t分布に従います。
そしてt0が非心t分布に従う場合のPrの値は以下の近似式
$$Pr(t’ ≦ w)≈Pr[u≦\frac{w[1-1/4φ]-λ]}{\sqrt{1+w^2/(2φ)}}]$$
に従います。wはt(φ,α)のときのt値で、u~N(0,1)です。
不等号「≦」から右の項が1.96の場合はPrは0.025になるというような計算をします(つまり正規分布表と照らし合わせる)。
そしてλは
$$λ=\sqrt{n}Δ$$
で表せる非心パラメータという数値です。Δは効果量です。
$$Δ=\frac{μ-μ_0}{σ}$$
実際に計算してみましょう
有意水準α=0.05、サンプルサイズn=9、効果量Δ=(μ-μ0)/σ=0.6の場合を考えてみましょう。
この場合t0は自由度φ=9-1=8、非心パラメータλ=√nΔ=√9×0.6=1.8の非心t分布に従いますので、近似式の計算は
$$1-β=Pr[t_0≦-t(8,0.05)]+Pr[t_0≧t(8,0.05)]$$
$$=Pr[t_0≦-2.306]+Pr[t_0≧2.306]$$
$$=Pr[t_0≦-2.306]+[1-Pr[t_0≦2.306]]$$
$$=Pr[u≦\frac{-2.306[1-1/(4×8)]-1.8]}{\sqrt{1+(-2.306)^2/(2×8)}}]+$$
$$1-Pr[u≦\frac{2.306[1-1/(4×8)]-1.8]}{\sqrt{1+(2.306)^2/(2×8)}}]$$
$$=Pr[u≦-3.495]+1-Pr[u≦0.376]=0.354$$
このように検出力は35.4%となります。(一般的には80%は欲しいのでこの値は低いです)
まとめ
このようにt検定での検出力の計算は、z検定におけるものより難しいものとなっています。
近似式のu≦~以降の右式が算出出来たら、そこからの計算はエクセルのNORMSDIST関数で出来るようです。
また実際のところ、概要だけは覚えておいて実践おいてはEZRに算出させる方が現実的です。
EZRでのt検定のサンプルサイズ、検出力の出し方はこちら
当サイトで学習/実践を繰り返して統計力、仕事力、開発力が伸びてきたら、更に上の職場にステップアップというのも一つの手です。
こちらでは、エンジニア専門の転職活動を支援しています。ぜひ活用してみて下さい
今すぐ、あなたが統計学を勉強すべき理由
この世には、数多くのビジネススキルがあります。
その中でも、極めて汎用性の高いスキル。
それが統計学です。なぜそう言い切れるのか?
それはビジネスというのは、結局お金のやり取りであり、必ず数字が絡んできます。
そして数字を扱うスキルこそが統計学だからです。
故に一口に統計学といっても、
営業、マーケティング、研究開発、品質管理、工程管理、生産管理.etc
これら全てで使う事が出来るのです。
現に私は前職は品質管理、現職は研究開発職なのですが、面接のときに
「品質管理時に活用した、統計の知識を研究開発にも活かせます」
とアピールして職種をうまく切り替える事が出来ました。
そして、もし始めるなら今から勉強を始めましょう。
なんなら、今すぐこのページを閉じて本格的に勉強を開始するべきです。
なぜなら、このような『スキル』は20代でもっともキャリアアップに繋がるからです。
30代ならいざ知らず、40代になると求められるのはこれまでの業務を遂行してきた経験や人脈なのです。
これが無いとある一定以上のキャリアアップは望めませんし、40代以降のハイクラスの転職先も望めません。
20代のうちは成果を結び付けるためにこのスキルが大いに役立ちますが、年を経るごとに求められる働き方が変わるのでスキルの実績への寄与が減ってしまうのです。
なので、後からやればいいやと後回しにすると機を逸してしまう可能性が高いです。
ちなみにこれから統計学を学習をするというのであれば、ラーニングピラミッドというものを意識すると効率的です。
私自身、インプットだけでなく、youtubeや職場でアウトプットしながら活用する事で統計リテラシーを日々向上させていっています。
ぜひ、アナタも当ブログやyoutubeチャンネルで統計リテラシーを上げて、どこでも通用するビジネスパーソンになりましょう
コメント