値を予測しよう 回帰関係1

平均

相関関係を見たときに相関性が極めて1(もしくは-1)に近い場合

「これだけ一直線なら片方の数値が決まったら、もう一方の数値を算出出来るようになるのでは?」

といった発想は当然出てくるものと思います。

その発想を実現させるものが「回帰関係」です。

エクセルでも相関関係のグラフを作ったうえで、「近似直線」で直線を引き「数式を表示」を選択すると回帰関係の式が簡単に出てきます。

しかしながら、いざどのように算出しているのかを知るとなると中々に段階が多いです。

私の印象として「結構難しい」といった感じです。

ですが扱う道具に関して多少なりとも原理は知っておかないと誤った使用をして、間違った判断をしてしまう可能性が出てきます。

ですので知識としてだけでも、把握したうえで扱っていきましょう。

条件付き平均値と回帰関係

身長と体重の関係で考えてみましょう。

基本的には身長が高い人は概して体重が重く、身長が低い人は概して体重が軽くなるというのは、経験的に実感のあることだと思います。

ですが、すべての人において身長と体重の関係が当てはまるかと言えば、

それはない

となることも、同様に経験的に実感があることと思います。

これは以下のように言い換えることが出来るということです。

身長が高い人は「平均的に」体重が重く、身長が低い人は「平均的に」体重が軽い

このように異なる身長(x)に対して、異なる平均体重(yA)が対応するという関係を身長(x)に対する体重(y)の回帰関係と言います。

ここでのポイントはあくまでxに対してのyではなく、yの平均値yAが対応するということです。

このような一定のxに対応するyAのことを、条件付き平均値と言います。

これはxという値には色々なyが対応して、その中ではxに相関しないyもいるが、平均で見たらyはxに対応しているということを指していると思われます。

図で表すとこんな感じです。

式で表すとこうなります

$$y_A=f(x)$$

ちなみに、一般的には身長から105を引くと標準的な体重になると言われていますが、これも回帰関係を意味しており式で表すと

$$平均体重y_A=身長x-105$$

これは通常の関数とは異なる関係です。

関数関係とはあくまでも一つのxに対して一つのyが決まる関係

$$y=f(x)$$

のことを言います。

線形回帰

回帰関係にも様々なものがありますが、一般的に用いられるものは一次式(つまり線形)の

$$y_A=a+bx$$

ただしa,bは定数です。

例えば先ほどの身長と体重の回帰関係の場合は

a=-105, b=1

になります。

このようなaとbのことを回帰パラメータと言います。

回帰関係の式を見出すということはつまり回帰パラメータを算出することを意味するのです。

次回に続きます。

平均 相関
スポンサーリンク
シグマアイ-仕事で使える統計を-

コメント