分散の比較 F検定

検定

以前紹介したt検定は、平均値に有意差があるかどうかを調べるための検定でした。

効果を判断するために t検定1

効果を判断するために t検定2

効果を判断するために t検定3

ですが、t検定には前提条件があります。

それは比較する分布の分散、つまりバラツキに有意差がないことです。

バラツキが等しいかどうかを知らないうちに、t検定を行った場合その結果は間違っている可能性が高いのです。

それでは、分布同士のバラツキの有意差を知るためには、どうすればいいのでしょうか。

その答えは今回紹介する「F検定」です。

F検定はF分布を用いた検定です。

F分布とは以下の等式で示される確率変数のとる分布のことです。

$$F=\frac{x_1^2/m}{x_2^2/n}=\frac{σ_1^2}{σ_2^2}$$

m及びnはそれぞれの分布の自由度になります。

F分布はカイ二乗x^2の比率であるF値が取る分布(上記式の真ん中)ですが、同時に不偏分散の比率(上記式の最右辺)がとる分布でもあります。

F検定を行う際には、算出したそれぞれの分布の不偏分散を使うので、個人的には

「F値は不偏分散の比なんだな」

というところさえ分かっていれば、道具として使う分には十分だと思っています。

また、F検定の際に気を付けることはF値は

「分子に不偏分散の大きな方をもってくる」

という決まりごとがある点です。

F値であれ、t値であれ、カイ二乗であれ、数値が大きくなるほど、その値を取りうる確率が低くなることを考えると、なぜ分子に大きな方を持ってくる必要があるか分かってきます。

F値は2つの分散値が等しい場合は、F=1になります。一方の不偏分散がもう一方より大きくなる、もしくは小さくなると、F値は1から離れていきます。

ここで、不偏分散が大きい方を必ず分子に持ってくるという決まり事を作っておくと、分散値に差が出てくるほど、「F値は大きくなる」という単純な図式を作ることが出来るのです。

 

とりあえずは

分散に差がない場合はF=1

分散に差がある場合はF>1 そして差が広がるとその数値は大きくなる

と覚えておきましょう。

 

前置きが長なりましたが、これからF検定についてみていきます。

検定について、よく分からないという方は以下の記事をはじめとした、過去の検定の記事をご覧いただけると、理解が早まると思います。

検定の考え方

F検定の進め方

①まず帰無仮説を立てます。

帰無仮説はσA^2=σB^2です。

②有意水準を決めます。5%とすることが一般的です。

③次にF値を算出します。

$$F_0=\frac{σ_A^2}{σ_B^2}$$

この時に使う分散値は不偏分散を使用します。

③F分布表を確認します。

F分布は、有意水準ごとに準備されており、分布Aと分布Bそれぞれの自由度(サンプルサイズn-1)の交点の値を確認します。

例えば、分布Aの自由度が3で、分布Bの自由度が5の場合は、F=5.409になります。

④F値の比較をします。

不偏分散の比として算出したF0とF分布表から取ってきたFを比較して、

$$F_0 > F$$

の場合、帰無仮説:分散が等しい場合に生じる可能性5%以下となり、帰無仮説は正しくないとされ、「対立仮説:分散は等しくない」が採択されます。

逆に

$$F_0 < F$$

の場合は、帰無仮説は棄却されず、「帰無仮説:分散は等しい」可能性があるという結果となります。(以前述べたように、帰無仮説は棄却出来なかったとしても、採択することはできません)

 

最後に

以上のような流れでF検定は実施します。

そして、帰無仮説が棄却出来なかった場合、t検定を実施することが出来ます。

さて、F検定によって分散が等しくないとなった場合どうすればいいのでしょうか。

平均の検定はあきらめるしかないのでしょうか。

実は分散が等しくない場合に使用できる、平均値の検定というものがあります。

welchのt検定というのですが、それはまた別に機会に紹介したいと思います。

検定
スポンサーリンク
シグマアイ-仕事で使える統計を-

コメント