このサイトを閲覧されているという事は、おそらくアナタは統計学を学習したいと思っているはず。
ただ、もしアナタが統計の初学者ならば、
「統計学の専門用語、よく分からん!」
という状態に陥っているはず。
サンプル数とサンプルサイズは同じ?違う?
母数って母集団の総数でしょ?
おそらく、こんな風に思っていたりするんじゃないですか?
これね、違うんですよ。
こんな風に統計学の専門用語って、自分が思っている意味合いと多少ずれたような、ややこしいものが非常に多いです。
という事で今回は、統計学のややこしい専門用語について、いくつか解説をしたいと思います。
とりあえず、今回は、
・母集団と標本
・母数
・サンプル数とサンプルサイズ
・標本統計量
この辺りを紹介いたします。
統計学の専門用語
母集団と標本
まずは、母集団と標本からです。
母集団とは、分析の対象となる集団を指します。
視聴率を考えた場合、母集団は日本国民全員になります。
生産ラインの場合、そのラインで作られた、設備が初めて稼働してから寿命が尽きて稼働が終了するまでに作った製品になります。
会社の財務の場合、その会社が立ち上がってから、倒産するまでの財務情報になります。
正にお母さんに位置する、全体の情報なわけです。
対して、標本とはその母集団から抜き取ってきた一部の情報なわけです。
視聴率なら、国民の一部の人数です。
生産ラインなら、日々のロットです。
会社の財務なら、四半期ごとのデータです。
このように標本は母集団の一部を指します。
当然、母集団を毎度調査出来れば、一番正確なのですが、何せ労力が物凄いので非常に非効率的です。
統計というモノは、標本から得られる情報から母集団を予測するためのテクニックとも言えるのです。
母数
勘違いされやすい用語その1です。
私は初め母数と言うのは、母集団の全数とか思ってました。
でも、違うんです。
母数とは、母集団の代表値です。
母集団の平均値、標準偏差、中央値、最頻値・・・
このような、母集団から計算された代表値が母数です。
標本から予測したい数値と言うのは、正にこの母数なわけです。
この辺りは、本当に勘違いしやすいところなので、よく押さえておきましょう。
教科書を読む時、解釈を間違える元になってしまいますよ?
サンプル数とサンプルサイズ
勘違いされやすい用語その2です。
サンプル数とサンプルサイズ、同じ意味とか思っていませんか?
実は違います。
例で考えてみましょう。
管理図を作るために、毎日5個のデータを30日間取り続けました。
さて、この場合のサンプル数とサンプルサイズは、それぞれいくらでしょうか?
どうです?分かりました?
正解は、
サンプル数:30
サンプルサイズ:5
です。
この違いを言葉で書くと、このようになります。
サンプル数:何回標本抽出を行ったか?
サンプルサイズ:1回の標本抽出において何個調べたか?
こういう違いがあるんです。
つまり先ほどの例で言うと、
1回の標本抽出で5個調べており、それを30回(日)行った
ので、サンプル数が30でサンプルサイズが5になるのです。
この辺りも母数と同じく非常に勘違いしやすいところなので、しっかり違いを区別するようにしましょう。
標本統計量と標本分布
標本統計量とは、標本、つまりサンプルから算出した平均値とか標準偏差とかを指します。
基本的に、算出した標本統計量が母数をうまく予測出来ているかをチェックする訳です。
そして、標本統計量はそれぞれ一定の分布を形成します。
それが、標本分布になります。
t分布、F分布、カイ二乗分布などが標本分布に該当します。
母集団はこのような分布を取らないので、しっかり区別する必要があります。
中央極限定理を、これらの単語で表現すると。
母集団の分布がどのような形であろうとも、標本から算出した標本統計量である平均値が描く標本分布は正規分布になる。
ちょいと、下手糞ではありますが、こんな感じです。
まとめ
今回は、統計において勘違いしやすそうな専門用語を解説しました。
これらの単語が正しく理解出来ていないと、勉強する際に間違った受け取り方をしてしまい、そりゃ大変な事になるわけです。。
今後もこの記事、ややこしそうな単語が浮かびましたら更新をしていこうと思っています。
コメントでその辺質問もらえるとありがたいです。
今すぐ、あなたが統計学を勉強すべき理由
この世には、数多くのビジネススキルがあります。
その中でも、極めて汎用性の高いスキル。
それが統計学です。なぜそう言い切れるのか?
それはビジネスというのは、結局お金のやり取りであり、必ず数字が絡んできます。
そして数字を扱うスキルこそが統計学だからです。
故に一口に統計学といっても、
営業、マーケティング、研究開発、品質管理、工程管理、生産管理.etc
これら全てで使う事が出来るのです。
現に私は前職は品質管理、現職は研究開発職なのですが、面接のときに
「品質管理時に活用した、統計の知識を研究開発にも活かせます」
とアピールして職種をうまく切り替える事が出来ました。
そして、もし始めるなら今から勉強を始めましょう。
なんなら、今すぐこのページを閉じて本格的に勉強を開始するべきです。
なぜなら、このような『スキル』は20代でもっともキャリアアップに繋がるからです。
30代ならいざ知らず、40代になると求められるのはこれまでの業務を遂行してきた経験や人脈なのです。
これが無いとある一定以上のキャリアアップは望めませんし、40代以降のハイクラスの転職先も望めません。
20代のうちは成果を結び付けるためにこのスキルが大いに役立ちますが、年を経るごとに求められる働き方が変わるのでスキルの実績への寄与が減ってしまうのです。
なので、後からやればいいやと後回しにすると機を逸してしまう可能性が高いです。
ちなみにこれから統計学を学習をするというのであれば、ラーニングピラミッドというものを意識すると効率的です。
私自身、インプットだけでなく、youtubeや職場でアウトプットしながら活用する事で統計リテラシーを日々向上させていっています。
ぜひ、アナタも当ブログやyoutubeチャンネルで統計リテラシーを上げて、どこでも通用するビジネスパーソンになりましょう
コメント