統計学は”ばらつき”を扱う学問並びにツールです。
これまでも色々な”ばらつき”の指標を紹介してきましたが、どの指標にも使いどきというものがあります。
適材適所、”ばらつき”の指標にはそれぞれ特徴があり、得手不得手があるのです。
今回は一般的な標準偏差、分散、変動係数の特徴と使い方を紹介していきます。
統計学がうまく使えなかった人はコチラ⇒統計学を活かす 解析しやすい数値化のノウハウ
ばらつきの指標の特徴
標準偏差
統計といえば標準偏差と言われるほどに、最もメジャーな統計量です。
標準偏差は単独での使用はあまり向いていません。
標準偏差は正規分布とセットにしたときに、大きな力を発揮します。
平均値±3×標準偏差内には、データの99.7%が収まるためにデータの発生頻度の予測や品質規格の設定を行うことが出来ます。
この性質は、工程能力指数や管理図などSQCにも多用されています。
詳細は以下の記事を参照してください。
分散
分散は標準偏差を2乗した値です。単位が2乗になってしまうので、一見すると扱いにくいです。
しかしながら、加法性という性質のために、数学的には標準偏差よりも重要な値であると言えます。
加法性は読んで字のごとく、『足し算出来る』性質のことです。それ以外にも分散の比を扱うことで大小関係表せます。“ばらつき”の検定はこの性質のために、分散で行われます。
また、あらかじめ標準偏差が分かっている材料を混ぜ合わせる場合、混ぜ合わせた後の標準偏差も予測する事が出来ます。
この分散と標準偏差を組み合わせると、
・標準偏差が分かっている材料AとBをブレンドしてCを作る。
↓
・AとBの分散を算出(標準偏差の2乗)して足し算する
↓
・足した分散の平方根をとり、標準偏差に直すことでCのばらつきをあらかじめ予測できる
という芸当も可能になります。思いのほか応用の幅が大きいです。
詳細は以下の記事を参照してください。
変動係数
変動係数は標準偏差を平均値で割ったものです。
平均値を1とした場合、1σが何%振れているかを示しています。
この処理を施すおかげで、どのような媒体同士でも純粋に”ばらつき”を比較することが出来ます。
分銅と車という明らかにスケールが異なるものも、比較することが出来ます。
このシンプルな性質は、非常に強力です。
標準偏差同士では、平均値の大きさの影響を大なり小なり受けてしまうので比較しない方が良いです。
詳細は以下の記事を参照してください。
それぞれの関係性
それぞれの公式及びエクセル関数は以下になります。
分散
偏差の二乗和をサンプルサイズで割ったもの
$$V=\frac{1}{n-1}\sum_{i=1}^{n}{(x_i-\overline{x})^2}$$
エクセル関数
=VAR.P():標本そのものの分散
=VAR.S():母集団の予測値としての分散(不偏分散)
標準偏差
分散の平方根
$$σ=\sqrt{\frac{1}{n-1}\sum_{i=1}^{n}{(x_i-\overline{x})^2}}$$
エクセル関数
=STDEV.P():標本そのものの標準偏差
=STDEV.S():母集団の予測値としての標準偏差(不偏標準偏差)
変動係数
標準偏差を平均で割ったもの
$$C.V=\frac{σ}{μ}$$
エクセル関数
=STDEV.P()/AVERAGE():標本そのものの変動係数
=STDEV.S()/AVERAGE():母集団の予測値としての変動係数
まとめ
これまでも”ばらつき”に関してはいくつか紹介しましたが、網羅的な記事がなかったので改めて整理しました。
“ばらつき”だけではなく、統計量や統計的手法は様々な種類がありますが、どれにも得手不得手があり、適切な使いどきがあるのです。
正しく使用し、適切な結果からアクションを起こしましょう!
twitterとyoutubeやってます。良かったらフォローお願いします。
熊野コミチ(@gRDQJkozHInWFxI)(youtube)
コンテンツ紹介
昨今機械学習やディープラーニングなど、データを扱うための知識の重要度は日々増していっています。
そんな最先端のスキルを使いこなすには、土台となる統計学の知識が必要不可欠です。
しかしながら、統計学は本で読んでも何とか理論は理解できてもそこからどのように実務に活かしたら良いのか分からない。そんな机上と現実のギャップが凄まじい学問です。
そんな机上と現実のギャップを埋めるために、私は当サイトをはじめ様々なコンテンツを展開しています。
youtubeでは登録者1万人の統計学のチャンネルを運用しています。
動画投稿だけでなく、週2回のコメントに来た質問への回答配信も行っているので気になる方はどしどし質問をお寄せください。
youtubeでは無料動画だけでなく、有料のメンバーシップ限定動画も運用しています。
メンバーシップ登録リンク(押しただけで登録はされないので、気軽にクリックしてください)
エクセルやJAMOVIといった無料で使える統計ツールの実際の使い方。そして無料動画では敷居の高い(というよりマニアックゆえに再生数が見込めない(笑))解説動画をアップしています。
本を読んで実際に分析してみようと思ったけど、どうもうまくいかなかった。本では見かけない、あるいは難しすぎて扱えない手法があったという方。ぜひ一度ご参加ください(動画のリクエストがあれば反映させます)
「そうは言われても、うちのデータは統計学じゃ分析出来ないよ」
そういう方もいらっしゃると思います。私の経験上、そういったデータ分析が出来ない状況の一つとして量的変数として目の前の現象を扱えていないというものがあります。
私のnoteでは、過去私が製品開発を行う上で実践した分析しやすい数値の測定方法を公開しています。
私が開発活動する上で創意工夫を凝らして編み出してきたアイデアの数々を公開しています(私の知見が増えたら更新していきます)。本やネットではまず載っていません。うまい測定方法のアイデアが浮かばないという方はぜひこちらをご覧ください。
「いや、その前に使える手法を体系的に学びたいんだけど」
そんな方には、udemyの講座を推奨します。
初歩的な標準偏差から、実験計画法、多変量解析まで、実際に私が実用する上で本当に使用したことがある手法に絞って順序立てて解説しています。
どの手法が結局使えますのん?という方はぜひこちらをお求めください。
こんな感じで、様々なコンテンツを展開しています。
今後は品質工学や品質管理に重点を絞ったコンテンツなども発信していきます。
ぜひリクエストがありましたら、それらも反映させていきますのでまずはお気軽にご意見くださいな。
コメント