カイ二乗分布とはなにものか? その2

検定

今回は前回の続きで、カイ二乗分布の使い道について解説していきます。

前回はこちら:カイ二乗分布とはなにものか? その1

カイ二乗分布を利用した検定に関して紹介します。

以前紹介したようにt検定を用いることで、分布の平均値を検定することが出来ます。

しかしながら、統計学と言えばバラツキの学問!

平均の有意差だけでなく、バラツキの有意差も知りたいというのが人情です。

カイ二乗分布はそのバラツキの検定に活用されます。

 

順を追ってみてみましょう。

検定の手順に関してよくご存じないという方は、こちらの記事を先に読んで頂けると分かりやすくなると思います。

検定の考え方

帰無仮説の設定

まずは、帰無仮説を設定します。

$$s^2=σ^2$$

ただしs^2は不偏分散、σ^2は設定した特定の分散です。

例えばある生産ラインの分散値は、これまでの算出結果から3で管理してきたが、今本当に3なのかといった場合、

サンプリングして得られた不偏分散:s^2

これまでの分散値3:σ^2

といった内容になります。

有意水準の決定

ここでは有意水準α=5%とするのが一般的です。この数値はほかの検定と変わりありません。

また両側検定の場合は、2.5%と有意水準の1/2にするという手続きも同様です。

対立検定ごとの棄却手続き

検定では、帰無仮説を棄却した際に採択する対立仮説というものを立てるのですが、今回の検定において対立仮説ごとの棄却の方法が異なります。

対立仮説s^2 > σ^2の場合:x^2 > x^2(α) 上側検定 想定より実測したバラツキが大きい

対立仮説s^2 < σ^2の場合:x^2 < x^2(α) 下側検定 想定より実測したバラツキが小さい

対立仮説s^2 ≠ σ^2の場合:x^2 < x^2(α/2) or x^2 > x^2(α/2)両側検定 想定したバラツキではない

 

x^2を算出する

t検定においてtを算出したように、この検定ではx^2を算出します。

$$x^2=\frac{(n-1)s^2}{σ^2}$$

n-1は自由度です。例えばサンプルサイズが20の場合、自由度は

$$20-1=19$$

となります。

カイ二乗分布表の数値と比較する

標準正規分布に標準正規分布表t分布にt分布表があるように、カイ二乗分布にも分布表があります。

自由度と有意水準の交点の数値が、有意水準の境界になるx^2(α)値になります。

上側検定で有意水準5%の場合、0.05の行の自由度19で

$$x^2(α)=30.14$$

になります。

また上側、下側、両側検定の場合に見る有意水準の場所ですが、今回のような有意水準α=5%の場合

下側検定:0.95(100-95%=5%)

上側検定:0.05(そのままです)

両側検定 下側0.975(100-97.5=2.5%) 上側0.025(そのままです)

このように下側は、100%から5%もしくは2.5%引いた値の自由度を確認してください。(ちょっとややこしいですね)

検定

最後に算出したx^2と分布表のx^2(α)を比較します。

先ほど述べましたように、対立仮説によって以下のように棄却の方法が異なりますので注意してください。

対立仮説s^2 > σ^2の場合:x^2 > x^2(α) 上側検定

対立仮説s^2 < σ^2の場合:x^2 < x^2(α) 下側検定

対立仮説s^2 ≠ σ^2の場合:x^2 < x^2(α/2)またはx^2 > x^2(α/2)両側検定

 

最後に

この検定を使えば、バラツキが以前の状態と同程度か、狙った値に収まっているのかを判断することが出来ます。

仕事において、数字を比較するという機会は非常に多い中で、統計的裏付けをもって「有意差がある」と言い切れることは非常に強力な武器になります。

ぜひ活用していってください。

検定
スポンサーリンク
シグマアイ-仕事で使える統計を-

コメント