標準偏差と標準誤差を使い分けよう

バラツキ

統計における”ばらつき”の指標には、標準偏差とは別に標準誤差というものもあります。

同じような単語であり、また数式も似ているため、どのようなシチュエーションで使い分ければ良いのか分かりづらいです。

今回は、そんな標準偏差と標準誤差の使い分けに関して解説していきます。

スポンサーリンク

標準偏差と標準誤差の特徴

まずは、それぞれの統計量の特徴を示していきます。

標準偏差の特徴

標準偏差は以下の数式で表現される統計量です。

$$σ=\sqrt{\frac{\sum_{i=1}^{n}{(x_i-\overline{x})^2}}{n}}$$

詳しくは以下の記事を参照してください。

標準偏差の特徴は、個々のデータの”ばらつき”を表現しているという点です。

標準誤差の特徴

あるサンプルの標準偏差をσとした場合、標準誤差は以下の数式で表現されます。

$$SE=\frac{σ}{\sqrt{n}}$$

サンプルサイズnの平方根で標準偏差σを割った値が標準誤差なのです。

この標準誤差の特徴は、平均値の”ばらつき”を表しているという点です。

サンプルの平均値というものは、サンプルサイズが増えるほどに元の母集団の平均値に収束していきます。

これを中心極限定理といい、N(μ,(σ/√n)2)の分布をとります。

同じサンプルで比較してみよう

実際に以下のデータで、標準偏差と標準誤差を比較してみましょう。

平均値、標準偏差、標準誤差を算出すると以下になります。

グラフにすると、

このように、標準誤差は標準偏差を√nで割るために、必ず標準偏差より小さくなります。

スポンサーリンク

標準偏差と標準誤差の使い分け

標準偏差と標準誤差の特徴は分かって頂けたと思います。

次に、どのようなシチュエーションで使い分けるのかを紹介します。

標準偏差が望ましい場合

サンプル一つ一つの”ばらつき”を捉えたい場合は標準偏差を使用します。

例えば、製造現場での良品の管理基準を設ける時などです。

標準誤差が望ましい場合

平均値そのものの精度が知りたい場合は、標準誤差が適しています。

開発における製品スペックを知りたいときや、研究における実験によってデータを知りたい場合等が該当します。

論文では、このような理由から標準誤差の方が多く用いられているらしいです。

スポンサーリンク

サラリーマンが使うべきはどちらか

正直なところ、ビジネスにおいては標準偏差の方が使用頻度が大きくなると思います。

製造現場の管理だけでなく、開発においても標準偏差は確認しておくべきです。

なぜならば、我々はお客さんに不良品を届けてはいけないからです。

高スペックだけど不良品が多発する製品というものは、あってはならないのです。

それはです。

標準偏差を使ってスペック(平均値)の範囲を見誤ることはあってもいいのですが、その逆、標準誤差を使ってクレームリスクを見誤ることはあってはならないのです。

故にもし標準偏差と標準誤差のいずれを使うべきか悩んだら、とりあえず標準偏差を使いましょう

その方が、リスク的にまだマシなはずです。

コメント