様々なパラメータの寄与を考える 重回帰

バラツキ

前回は決定係数について解説しました。

今回は様々なパラメータがどの程度の寄与を示すのかを見るために、重回帰を解説していきます。

x以外の回帰のパラメータ

体重yを決定づける要素として身長xが考えられますが、実際にはそれだけではありません。太っているか否かも重要なパラメータのはずです。

これまでは身長xと体重yの関係を考えてきましたが、ここに肥満のパラメータとして胸囲zも追加できないか考えていきます。

体重yは身長xだけでなく、胸囲zによっても違いその関係が線形であると考えると次のような回帰関係式が成り立ちます。

$$y_{axz}=a+bx+cz$$

これがx及びzに対するyの回帰です。ここからa,b,cを導く方法は以前紹介した最小二乗法を用います。

$$S(a,b,c)=\sum_{i=1}^{n}{(y_i-y_{ax_iz_i})^2}$$

S(a,b,c)を最小にするためには、a,b,cについて偏微分した各式を0と置き、それら3式を満足するようなa,b,cを求めることになります。

$$\frac{∂S}{∂a}=\sum_{i}{2[y_i-(a+bx_i+z_i)](-1)}=0$$

$$\frac{∂S}{∂b}=\sum_{i}{2[y_i-(a+bx_i+z_i)](-x_i)}=0$$

$$\frac{∂S}{∂c}=\sum_{i}{2[y_i-(a+bx_i+z_i)](-z_i)}=0$$

これらの式を解くと正規方程式が得られます(以前紹介した計算法と同様ですので割愛します)。得られた正規方程式を使えばa,b,cの値が得られるようになります。

注意点

この考え方はパラメータがx,z以外にいくら増えても適用できます。

ですので、様々なパラメータを組み込んでそれぞれがどのように影響しているかを知ることが出来ます。(エクセルの分析ツールにも入っているので、算出そのものは簡単です)

ですが注意する点があります。

それは変数の寄与を見る場合には、見たい変数以外すべてが固定されている状態で見ないといけないということです。

例えば

$$体重y=a+b身長x+c胸囲z$$

を考える場合、一見すると身長が1cm伸びる毎に体重が”b”kg増える。また胸囲が1cm伸びる毎に”c”kg増えると見ることが出来ます。そして”b”<“c”だった場合、体重yへの寄与は胸囲の方が大きいと言えます。

しかしながら、このb,cを見るときは

同一の胸囲ziの場合、身長xを1cm伸ばすと体重は”b”kg増える

同一の身長xiの場合、胸囲zを1cm伸ばすと体重は”c”kg増える

と考えないといけないのです。

身長が変動している状況下では、胸囲に対してのcという係数は成り立ちません。

胸囲が変動している状況下では、身長に対してのbという係数は成り立ちません。

飽くまで一次方程式であるので、変数として扱えるのは一つ(xかz)のみなのです。

ここも扱いを間違えると、誤った判断をしてしまう可能性がありますので、十分に気をつけて下さい。

 

コメント