カイ二乗分布とはなにものか? その1

分布

統計を学習していると、不意に現れる単語。それが「カイ二乗分布」です。

何に使えるのか、一体何者なのか釈然とせず、苦手意識を持っている方も多いのではないでしょうか。

というより、私自身この「カイ二乗分布」に対して大きな苦手意識を持っています。

そんなカイ二乗分布の苦手意識を私自身克服するために、今回は一緒に勉強していきましょう。

カイ二乗とは何か

カイ二乗分布は分散、つまりバラツキに関しての標本分布のことを言います。

バラツキの比較検定を行う際に使用する、F検定のF分布もカイ二乗分布が元になっています。

母分散と不偏分散の比に自由度を掛けた数値

$$x^2=\frac{(n-1)s^2}{σ^2}$$

(ただしσ^2は母分散、s^2は不偏分散)の分布を自由度がn-1のカイ二乗分布と言います。

母分散は常に一定の数値ですが、不偏分散はサンプリングの度に異なるためにx^2(これをカイ二乗と読みます)は分布を形成するのです。

カイ二乗分布は自由度によってその形状は異なります。

カイ二乗分布は分子と分母ともに標準偏差を2乗した分散値なので、正の値しかとりません。なのでカイ二乗分布も正の値しかとりません。

また不偏分散の期待値は、母分散なので(不偏分散は母分散を知るための算出値です)、x^2の期待値(平均値)はn-1と自由度と一致します(母分散と不偏分散が等しいと1/1×(n-1)なので)。

そして、自由度と平均値(つまり最頻値)が等しいので、自由度が大きくなるにつれて分布の山が、大きな値にずれていきます。

そして、平均値の周りに均等にばらつく正規分布に似た形状になっていきます。

カイ二乗分布は何に使えるのか?

ここで、カイ二乗分布というものはどういったものか、イメージは掴めてきたかもしれません。

ですが、肝心なことは

「何に使えるのか?」

の一点だと思います。

専門家ではない一般的なサラリーマンとしては、学術的な意味よりも道具としての有用性に興味が向くはずです。

カイ二乗分布の使い道としては、

・分散の推定

・母分散の分散が特定の分散値に等しいかの検定

・2つの分類基準が独立であるかの検定

と便利そうなものが並んでいます。

文字数が多くなりそうなのと、まだ私が勉強中ということもありますので、実際の使用法の解説は次回以降にしたいと思います。

やきもきさせてすいません。

分布検定
スポンサーリンク
シグマアイ-仕事で使える統計を-

コメント