検定を使うことで、平均値同士の間に有意差があるかどうかを調べることが出来ます。
しかしながら、有意差検定は帰無仮説が棄却出来ない場合でも、差がないことを採択することが出来るとは限りません。
有意差検定は通常、差が有るか差が有るとは言えないの二択問題なのです。
ですが、実際に平均値の差を検定する際、差がないことをどうしても言いたい場合が存在します。
今回はそんな差がない事を示す検定、非劣性試験を紹介します。
帰無仮説は採択が難しい
そもそもなぜ帰無仮説を採択することが難しいのか?
これには検出力(1-β)が関係しています。
高い検出力が必要
検出力が高いと、帰無仮説を棄却しやすくなります(=有意差が出やすくなる)
逆に低いと帰無仮説が棄却しにくくなります。
つまり同じ帰無仮説を棄却出来ない場合でも、検出力によって意味合いが変わってきます。
検出力が低い場合に、有意差なしとなっても検出力が上がれば(=十分な証拠がそろえば)有意差ありと判断出来るかもしれないという疑惑が残ります。
逆に言えば、検出力が高い状況においても有意差なしとなった場合、十分な証拠を揃えて尚有意差がないとなっているのだから、きっと本当に差がないんだろうという結論になります。
つまり、検定を実施する上では検出力を高くすることが重要なのです(ただし大きすぎると有意差ありになりやすいので実際には適切な検出力(=0.8)に抑えるべき)。
ちなみに、ここで私が言っている証拠というものはサンプルサイズに他なりません。
サンプルサイズを調整することで、検出力をコントロールします。
非劣性試験とは
検出力が高い状態で、有意差なしを実証するという手段は言うなれば
「これだけ調査をしたのに、犯人と証明できなかった。だからシロだ」
という考え方に似ています。
ある意味消極的なアプローチです。
対して今回紹介する非劣性試験は、積極的なアプローチに類すると言えます。
劣っていないことを示す検定
そもそも、差がないということを示したいシチュエーションとは何でしょうか?
おそらく大体は、
「他社品より自社の開発品は劣っていないよな」
という劣っていない事を示したい場合ではないでしょうか。
劣っていないことを示したい場合に、この非劣性試験を使用します。
考え方はとてもシンプルです。
μーΔよりは大きいことを示す
劣っていない事を示すには、以下のような考え方をします。
μ>μ0-Δ
これはμはμ0からΔよりは劣っていないという事を示しています。
このΔを非劣性マージンといい、任意で決定します。それまでの実験データや実績で判断します。
この非劣性試験では、
帰無仮説H0:μ=μ0-Δ
対立仮説H1:μ>μ0-Δ
を立てて、対応のない2群のt検定(welch)の式は
$$t=\frac{x_1-(x_2-Δ)}{\sqrt{\frac{σ_1^2}{n_1}+\frac{σ_2^2}{n_2}}}$$
であり、対応の有る2群のt検定の式は
$$t=\frac{μ_d-Δ}{s/\sqrt{n}}$$
になります。対応のある、ない2群の検定は以下の記事をご覧ください。
これらのt値を使って片側検定を実施することで、非劣性を検定します。
『有意差あり』で同等であることを示せる
非劣性試験の特徴は先ほどの
高検出力下で有意差なし=同等
と違い、
有意差あり=劣っていない(同等)
を示すことが出来る点にあります。
有意差検定は基本的には有意差ありという結論に重点が置かれる手法ですので、有意差ありという結論で同等以上であることを示すことが出来ると、同等という結論にかなり説得力を持たせることが出来ます。
また、どうしても十分な検出力を担保出来るほどのサンプルを揃えることが出来ない場合にも、この手法は使うことが出来ます。
非劣性試験の欠点
この非劣性試験を用いれば、同等以上であることを示すことが出来ますが、当然欠点もあります。
非劣性マージンの選択
非劣性マージンΔの選択を間違っていた場合、当然間違った結論が導かれます。
Δが小さすぎてかつ、有意差なしなら、劣っていると誤判定する可能性が出ます。
Δが大きすぎてかつ、有意差ありなら、劣っていないと誤判定する可能性が出ます。
この同等という結論はμ0-Δよりは劣っていないとしか言えないことを、意識しておくべきでしょう。
厳密には同等であることを示すことが出来ない
非劣性試験は飽くまで劣っていないことを示す検定であり、同等であることを示すものではありません。
本当に「大きくもなく、小さくもなく」といった両側規格的な意味で同等であることを知りたい場合、非劣性試験は適用出来ません。
少なくとも劣っていないという事は、大きな差をつけて良いという可能性もはらんでいるのです。
本当に「大きくもなく、小さくもなく」を知りたい場合は、高検出力下での帰無仮説採択の方法を採用するべきなのです。
まとめ
非劣性試験を用いれば、劣っていないことを積極的に示すことが出来ます。
ですが、当然猫も杓子も非劣性試験を使えばOKという訳ではありません。
逆に使える場面は限定的です。
すべての統計的手法に言えることですが、万能な手法というものはありません。
適材適所があるのです。
各手法に対しての理解を深め、適切に使用出来るようになることが、統計に強くなる近道です。
今すぐ、あなたが統計学を勉強すべき理由
この世には、数多くのビジネススキルがあります。
その中でも、極めて汎用性の高いスキル。
それが統計学です。なぜそう言い切れるのか?
それはビジネスというのは、結局お金のやり取りであり、必ず数字が絡んできます。
そして数字を扱うスキルこそが統計学だからです。
故に一口に統計学といっても、
営業、マーケティング、研究開発、品質管理、工程管理、生産管理.etc
これら全てで使う事が出来るのです。
現に私は前職は品質管理、現職は研究開発職なのですが、面接のときに
「品質管理時に活用した、統計の知識を研究開発にも活かせます」
とアピールして職種をうまく切り替える事が出来ました。
そして、もし始めるなら今から勉強を始めましょう。
なんなら、今すぐこのページを閉じて本格的に勉強を開始するべきです。
なぜなら、このような『スキル』は20代でもっともキャリアアップに繋がるからです。
30代ならいざ知らず、40代になると求められるのはこれまでの業務を遂行してきた経験や人脈なのです。
これが無いとある一定以上のキャリアアップは望めませんし、40代以降のハイクラスの転職先も望めません。
20代のうちは成果を結び付けるためにこのスキルが大いに役立ちますが、年を経るごとに求められる働き方が変わるのでスキルの実績への寄与が減ってしまうのです。
なので、後からやればいいやと後回しにすると機を逸してしまう可能性が高いです。
ちなみにこれから統計学を学習をするというのであれば、ラーニングピラミッドというものを意識すると効率的です。
私自身、インプットだけでなく、youtubeや職場でアウトプットしながら活用する事で統計リテラシーを日々向上させていっています。
ぜひ、アナタも当ブログやyoutubeチャンネルで統計リテラシーを上げて、どこでも通用するビジネスパーソンになりましょう
コメント