複数の変量から一つの変量を予測する重回帰分析は、複数の要因から売上、利益、要求性能を予測しなければならないビジネスパーソンにとって非常に重要なツールです。
算出方法は以前紹介しましたが、実際に使うにあたり一々手計算やエクセルで足し算引き算するのはとても大変です。
みんな忙しいのです。
時間を節約したいはずです。
幸いにもエクセルの分析ツールを使用すれば、いとも簡単に重回帰分析が可能です。
表さえ準備出来ていれば、5秒で終わります。
今回は分析ツールによる重回帰分析の方法を紹介します。
分析ツールで重回帰分析を実施しよう
まずはデータの確認
今回は以下の表を使います。
婚姻率zを目的変数、人口xと旅券発行率yを説明変数として2変量での重回帰分析を実施します。
ここの表では、縦に長くなってしまうので滋賀県から別の列にしていますが、分析ツールを使う際には一列にしておく必要があります。
それでは実際にやってみましょう。
分析ツールを使って重回帰分析しよう
まず「データ」タブを選び右端にある「データ分析」をクリックします。
データ分析の中の「回帰分析」を選びます。
「入力y範囲」に目的変数(婚姻率z)をラベルごと選択します。
「入力x範囲」に説明変数(人口xと旅券発行率y)をラベルごと選択します。
「ラベル」にチェックを入れます。これを入れることで、先ほど選択したラベルが変数の名前として認識されます。
「有意水準」にチェックを入れます。右側の%はデフォルトで95%になっているので特に触らなくても良いです。
最後にOKをクリックしたらおしまいです。
分析結果を読み解こう
分析ツールの扱い方は拍子抜けするほど簡単なのですが、問題はアウトプットが数字の羅列で一見すると
「なんじゃこりゃ」
なところです。
ですが、押さえるべきポイントを把握しておけば、それほど難しいものではありません。
分析ツールでの回帰分析で重要なのは
・補正R2
・係数
・t値、p値
・下限、上限95%
です。
補正R2は決定係数に補正を入れたもので、ここで色々並んでいるRの中で一番当てになる値と考えてください。
値が大きいほど導いた回帰式の当てはまりが良くなります。
R2=0.65はまずまずといったところです。
係数はそのまま回帰係数を指します。この値を使えば、回帰式を書くことが出来ます。
$$婚姻率=0.000968×人口+0.030226×旅券発行+4.231009$$
t値はt分布におけるt値のことで、自由度とt値が確定するとp値が決定します。
p値は有意水準5%とした場合、0.05を下回っていれば
「係数=0である」
という帰無仮説を棄却出来、係数の信憑性が増します。今回の場合0.001と0.0028といずれも0.05を下回っており係数は意味の有る値であると言えそうです。
下限、上限95%は係数が95%の確率で、この上下限の間に存在するという意味で、当然上下限値が狭い方が回帰式の確からしさが増します。
このように分析ツールの回帰分析はあらゆる面(決定係数、検定、推定)から、分析結果がどの程度信憑性があるものなのか、考える材料を提示してくれます。
分析時間は掛からないですし、結果の考察も表を見るべき点さえ押さえておけば難しくありません。
まとめ
重回帰分析は複数の要因がどの程度効いているのかを調査する上で、非常に便利な手法です。
本来、計算方法は難しめなのですが、エクセルの分析ツールを用いる事で秒で算出出来ます。
そして、算出される表も一見すると分かりづらいですが、書いてあることが一度分かると使いこなすのに大した時間は掛かりません。
補正R2、係数、t値、p値、下限、上限95%
ここらだけ押さえておけば良いのです。
非常に便利なんで、ぜひエクセルの分析ツールを活用し、重回帰分析を使い倒してみてください。
コンテンツ紹介
昨今機械学習やディープラーニングなど、データを扱うための知識の重要度は日々増していっています。
そんな最先端のスキルを使いこなすには、土台となる統計学の知識が必要不可欠です。
しかしながら、統計学は本で読んでも何とか理論は理解できてもそこからどのように実務に活かしたら良いのか分からない。そんな机上と現実のギャップが凄まじい学問です。
そんな机上と現実のギャップを埋めるために、私は当サイトをはじめ様々なコンテンツを展開しています。
youtubeでは登録者1万人の統計学のチャンネルを運用しています。
動画投稿だけでなく、週2回のコメントに来た質問への回答配信も行っているので気になる方はどしどし質問をお寄せください。
youtubeでは無料動画だけでなく、有料のメンバーシップ限定動画も運用しています。
メンバーシップ登録リンク(押しただけで登録はされないので、気軽にクリックしてください)
エクセルやJAMOVIといった無料で使える統計ツールの実際の使い方。そして無料動画では敷居の高い(というよりマニアックゆえに再生数が見込めない(笑))解説動画をアップしています。
本を読んで実際に分析してみようと思ったけど、どうもうまくいかなかった。本では見かけない、あるいは難しすぎて扱えない手法があったという方。ぜひ一度ご参加ください(動画のリクエストがあれば反映させます)
「そうは言われても、うちのデータは統計学じゃ分析出来ないよ」
そういう方もいらっしゃると思います。私の経験上、そういったデータ分析が出来ない状況の一つとして量的変数として目の前の現象を扱えていないというものがあります。
私のnoteでは、過去私が製品開発を行う上で実践した分析しやすい数値の測定方法を公開しています。
私が開発活動する上で創意工夫を凝らして編み出してきたアイデアの数々を公開しています(私の知見が増えたら更新していきます)。本やネットではまず載っていません。うまい測定方法のアイデアが浮かばないという方はぜひこちらをご覧ください。
「いや、その前に使える手法を体系的に学びたいんだけど」
そんな方には、udemyの講座を推奨します。
初歩的な標準偏差から、実験計画法、多変量解析まで、実際に私が実用する上で本当に使用したことがある手法に絞って順序立てて解説しています。
どの手法が結局使えますのん?という方はぜひこちらをお求めください。
こんな感じで、様々なコンテンツを展開しています。
今後は品質工学や品質管理に重点を絞ったコンテンツなども発信していきます。
ぜひリクエストがありましたら、それらも反映させていきますのでまずはお気軽にご意見くださいな。
コメント
[…] 【秒で使える】重回帰分析をエクセルの分析ツールでやってみよう […]