統計における”ばらつき”の指標には、色々なものが存在します。
標準偏差、変動係数、分散、四分位偏差・・・
その中で、標準偏差と似たような名前で標準誤差というものがあります。
一瞬書き間違えかなとも思える名称ですが、標準偏差とは別に存在する指標です。
実はこの値、研究開発においては標準偏差よりも使い道がある値なんです。
今回はそんな標準誤差を標準偏差と比較しながら解説していきます。
研究開発や技術を営んでいる方はぜひ、覚えて使いこなせるようになりましょう。
標準偏差と標準誤差の特徴
まずは、それぞれの値の特徴に注目してみましょう。
標準偏差の特徴
標準偏差は以下の数式で表現される統計量です。
$$σ=\sqrt{\frac{\sum_{i=1}^{n}{(x_i-\overline{x})^2}}{n}}$$
詳しくは以下の記事を参照してください。
標準偏差の特徴は、個々のデータの”ばらつき”を表現しているという点です。
標準誤差の特徴
次に標準誤差の特徴です。
あるサンプルの標準偏差をσとした場合、標準誤差は以下の数式で表現されます。
$$SE=\frac{σ}{\sqrt{n}}$$
サンプルサイズnの平方根で標準偏差σを割った値が標準誤差なのです。
この標準誤差の特徴は、平均値の”ばらつき”を表しているという点です。
サンプルの平均値というものは、サンプルサイズが増えるほどに元の母集団の平均値に収束していきます。
これを中心極限定理といい、N(μ,(σ/√n)2)の分布をとります。
同じサンプルで比較してみよう
実際に以下のデータで、標準偏差と標準誤差を比較してみましょう。
平均値、標準偏差、標準誤差を算出すると以下になります。
グラフにすると、
このように、標準誤差は標準偏差を√nで割るために、必ず標準偏差より小さくなります。
そして標準偏差と標準誤差が表しているものを、再度まとめますと、
・標準偏差:個々のデータのばらつき
・標準誤差:データの平均値のばらつき
ここがポイントです。
標準偏差と標準誤差の使い分け
標準偏差と標準誤差の特徴は分かって頂けたと思います。
次に、どのようなシチュエーションで使い分けるのかを紹介します。
標準偏差が望ましい場合
サンプル一つ一つの”ばらつき”を捉えたい場合は標準偏差を使用します。
例えば、製造現場での良品の管理基準を設ける時などです。
標準偏差と平均値を併用する事で、正規分布に則った管理が出来るので、合理的に管理基準を設ける事が出来ます。
詳細は以前にアップしていますので、こちらをご覧ください。
標準誤差が望ましい場合
平均値は基本的に、実験データの代表値として使用されることが多いです。
故にその実験の代表値がどの程度ばらつくのかを知りたい場合は、標準誤差を利用した方が良いです。
また、標準誤差をエラーバーとして平均値同士を比較する場合、上限と相手の下限値が振れない場合は2σ分離れるために、簡易的な有意差検定として機能させることも出来ます。
そもそも平均値の有意差検定の検定統計量の式は
$$z=\frac{\overline{x}-μ}{σ/√n}$$
であり、以下の分布上で2σ離れるという事は、ほぼ5%以下の確率でしか同じ分布とはなり得ないという事。
つまり有意差ありとなるラインなのです。
だから標準誤差のエラーバーで上下限が接しないほど平均値が離れている場合は、有意差ありと一目で判断することが出来るのです。
この辺りの詳細については、以下の記事もご覧になってください。
まとめ
標準偏差と標準誤差は名前だけでなく、数式もかなり似通っていますが、示したい情報は全く異なります。
標準偏差は個々のばらつき
標準誤差は平均値のばらつき
をそれぞれ示します。
故に標準偏差を使うなら、現場管理の管理値を決めるのに有効です。
一方標準誤差を使うなら、実験データの平均値の範囲や有意差を知る時に有効になります。
この辺りをはっきり区別して、使い分けを行い、他より抜きんでたデータ分析を実施していきましょう。
今すぐ、あなたが統計学を勉強すべき理由
この世には、数多くのビジネススキルがあります。
その中でも、極めて汎用性の高いスキル。
それが統計学です。なぜそう言い切れるのか?
それはビジネスというのは、結局お金のやり取りであり、必ず数字が絡んできます。
そして数字を扱うスキルこそが統計学だからです。
故に一口に統計学といっても、
営業、マーケティング、研究開発、品質管理、工程管理、生産管理.etc
これら全てで使う事が出来るのです。
現に私は前職は品質管理、現職は研究開発職なのですが、面接のときに
「品質管理時に活用した、統計の知識を研究開発にも活かせます」
とアピールして職種をうまく切り替える事が出来ました。
そして、もし始めるなら今から勉強を始めましょう。
なんなら、今すぐこのページを閉じて本格的に勉強を開始するべきです。
なぜなら、このような『スキル』は20代でもっともキャリアアップに繋がるからです。
30代ならいざ知らず、40代になると求められるのはこれまでの業務を遂行してきた経験や人脈なのです。
これが無いとある一定以上のキャリアアップは望めませんし、40代以降のハイクラスの転職先も望めません。
20代のうちは成果を結び付けるためにこのスキルが大いに役立ちますが、年を経るごとに求められる働き方が変わるのでスキルの実績への寄与が減ってしまうのです。
なので、後からやればいいやと後回しにすると機を逸してしまう可能性が高いです。
ちなみにこれから統計学を学習をするというのであれば、ラーニングピラミッドというものを意識すると効率的です。
私自身、インプットだけでなく、youtubeや職場でアウトプットしながら活用する事で統計リテラシーを日々向上させていっています。
ぜひ、アナタも当ブログやyoutubeチャンネルで統計リテラシーを上げて、どこでも通用するビジネスパーソンになりましょう
コメント
[…] 標準誤差についてもっと知りたい場合はリンクなどを見てください […]