統計学には、工程能力指数、管理図、検定など様々な手法が存在します。
ですが、困ったことにこれら教科書に一番最初に出てくるような手法と言うのは、大抵
正規分布である事
が前提ですよ、と説明されます。
ですが、この正規分布であるか否かの判断が、統計初学者にはちと難しいところがございます。
出来れば、こんな面倒は避けたい。
ですが、ご安心ください。
実は、中心極限定理という性質のおかげで、元の分布が正規分布でなくとも、初歩的な手法を使う事が可能になります。
さて、実はこの、
「中心極限定理のために正規分布じゃなくても、これらの手法は使えますよ」
と言うのは、教科書に載っているお話。
ですが、実際のところ具体的にどの手法が、中心極限定理の恩恵で使用可能になるのかは、あまり言及されていなかったりします。
という事で今回は、中心極限定理の為に使用可能になる手法、ダメな手法をご紹介します。
管理図、平均値の検定、平均値の区間推定、工程能力指数について扱いますので、よろしくお願いします。
動画でも紹介しています。
中心極限定理で扱える手法とは?
中心極限定理の復習
簡単に中心極限定理の復習をしていきます。
中心極限定理とはサンプリングしたデータの平均値は、N(μ,σ2/n)の正規分布を取るというモノです。
詳しくをこちらを参照してください。
こちらの性質があるおかげで、を分析する手法には正規分布を前提とした手法を活用する事が可能となります。
逆を言えば、ではなく、個別のデータxを分析対象とする場合には、元分布が正規分布でないといけないのです。
とx
どちらを分析対象とするかで、元分布の重要性ががらりと変わってくるのです。
ここが今日のポイントになります。
xbar-R管理図
まず、中心極限定理が活用できる手法にxbar-R管理図が挙げられます。
xbarの管理図は、xの平均値の平均値がCL、及びxの平均値の標準偏差を元にUCL,LCLを決めます。
正に、が正規分布であることを根拠として成り立つ手法なわけです。
故にこの時に注意しないといけないのが、xの標準偏差でUCL,LCLを決めてはいけないという点になります。
xの標準偏差との標準偏差って一緒だろう?
と思われるかもしれませんが、実は違います。
の標準偏差の方が、個別のデータの偏差を除している分小さくなります。
つまり、xの標準偏差で管理図を作ると、管理値が緩くなってしまい、適切に運用できなくなるので、注意が必要なのです。
平均値の検定
z,t検定と言った平均値の検定も、中心極限定理を活用出来る手法です。
z値やt値と言った値が、正規分布やt分布に従うというメカニズムを利用して分析を実施します。
そしてz値やt値は平均値を標準化した値なので、結局取り扱っている分布は平均値の分布になるという訳です。
$$z=\frac{\overline{x}-μ}{σ^2/n}$$
$$t=\frac{\overline{x}-μ}{s^2/n}$$
当然、xの平均値の分布を分析対象としているので、中心極限定理が活用できるという訳です。
平均値の区間推定
平均値の区間推定も、中心極限定理を活用出来ます。
これは検定の項で先述したように、z値とt値が正規分布やt分布に従うというメカニズムを利用したものになるからです。
つまり、平均値の検定と全く同じ理由で、区間推定も中心極限定理を活用出来るという訳です。
工程能力指数
工程能力指数は、逆に中心極限定理を活用出来ません。
どさくさ紛れで、なんか使えそうですが、ダメなんです。
というのも、工程能力指数は個別のxのばらつきを分析対象としているからです。
そして、xが正規分布を形成していないと使えません。
xが±3σ内に収まる確率を正規分布を元にして、分析しているからです。
なので、
工程能力指数を活用する場合には、正規性を確認した上で活用する必要がある。
この点、注意をしておきましょう!
重要です!
まとめ
中心極限定理があるおかげで、元が正規分布でなくても統計の手法が使えると、良く紹介されます。
ですが、全部が全部使えるわけではありません。
手法がxを対象としているのか、を対象としているのか
ここが、分かれ目です。
ここをよく理解した上で、中心極限定理とうまく付き合っていきましょう。
今すぐ、あなたが統計学を勉強すべき理由
この世には、数多くのビジネススキルがあります。
その中でも、極めて汎用性の高いスキル。
それが統計学です。なぜそう言い切れるのか?
それはビジネスというのは、結局お金のやり取りであり、必ず数字が絡んできます。
そして数字を扱うスキルこそが統計学だからです。
故に一口に統計学といっても、
営業、マーケティング、研究開発、品質管理、工程管理、生産管理.etc
これら全てで使う事が出来るのです。
現に私は前職は品質管理、現職は研究開発職なのですが、面接のときに
「品質管理時に活用した、統計の知識を研究開発にも活かせます」
とアピールして職種をうまく切り替える事が出来ました。
そして、もし始めるなら今から勉強を始めましょう。
なんなら、今すぐこのページを閉じて本格的に勉強を開始するべきです。
なぜなら、このような『スキル』は20代でもっともキャリアアップに繋がるからです。
30代ならいざ知らず、40代になると求められるのはこれまでの業務を遂行してきた経験や人脈なのです。
これが無いとある一定以上のキャリアアップは望めませんし、40代以降のハイクラスの転職先も望めません。
20代のうちは成果を結び付けるためにこのスキルが大いに役立ちますが、年を経るごとに求められる働き方が変わるのでスキルの実績への寄与が減ってしまうのです。
なので、後からやればいいやと後回しにすると機を逸してしまう可能性が高いです。
ちなみにこれから統計学を学習をするというのであれば、ラーニングピラミッドというものを意識すると効率的です。
私自身、インプットだけでなく、youtubeや職場でアウトプットしながら活用する事で統計リテラシーを日々向上させていっています。
ぜひ、アナタも当ブログやyoutubeチャンネルで統計リテラシーを上げて、どこでも通用するビジネスパーソンになりましょう
コメント