統計的解析を行う上で重要なこと②

コラム

前回の続きです。

統計的解析を行う上で目的を決めた後は、次の作業として解析する手法を選ぶことになります。

それでは早速見ていきましょう。

スポンサーリンク

目的別での手法の選択

例えば目的が

AクラスとBクラスの数学の学力を比較する、という場合は

・平均値の算出

・平均値の差の検定

という手法を使うことになりますし、

Aクラスの国語の成績と数学の成績の”ばらつき”具合の差を比較する、という場合は

標準偏差の算出

・分散の差の検定

という手法を使うことになります。

このように目的によって、当然扱うツールが異なるというわけです。

また対象とする統計量は同じでも目的が違えば、扱う分析手法は変わってきます。

例えば平均値を扱うにしても

・ある特定の値と等しいかを検定する⇒検定

・母集団の平均値が、どのような値を取り得るのか。⇒区間推定

というように、様々な手法があるのです。

また同じ分析目的でも、採取したサンプルサイズで扱う手法が変わってきます。

更に対象としている母集団が正規分布であるか否かでも、使用出来る分析手法が変わってきます。

一般的な書籍では、「この場合はこの手法を使おう!」という議論に対しての言及が軽いように私は感じます。

手法を選択ミスしてしまったら、誤った分析結果が導かれるのにも関わらずです。

一体私たちはどのようにして最適な手法を選べばいいのでしょうか?

スポンサーリンク

最適な手法を選択しよう

そんな「どうやって最適な分析手法を選べばいいのか分からない」となった場合は、

以下のように目的を分解してみてはいかがでしょうか。

まず、統計的分析手法で知りたい内容は、基本的に

・比較すること

・推測(推定)すること

・相関関係を把握すること

の3つになると思います。

ですのでまずは、

・最初に掲げた目的が比較、推定、相関のいずれに類推するのか、分類しましょう。

次に

・扱うデータが数値データ言語データかをしっかり認識しておきましょう(言語データの場合は数量化が必要になり、大分厄介です)。

次に

・数値データの場合、計量値計数値かを把握しておきましょう。

計量値とは量る数値のことで、重さや長さのように数値が連続するものを指します。

計数値とは数える数値のことで、ものの個数のように数値が不連続のものを指します。

計量値か計数値かで、取り扱う分布の形が変わるので、当然分析手法も変わってきます。

次に

・サンプルサイズがどれだけ採取できそうか把握しておきましょう。

先述したようにサンプルサイズの大小で扱える分析手法が変わってきます。

統計量を扱う場合は、サンプルサイズが大きいに越したことはないのですが、検定を行う場合は必ずしもそうではないので、注意が必要です。

 

ここまで分析対象に対して条件を詰めておけば後は、書籍やネットで適合しうる分析手法を調べて、計算や解析そのものはエクセルや統計ソフトに丸投げすれば、そこまで誤った結論にはならないはずです。

もし分析手法に迷ったら

・比較、推定、相関のいずれか

・データは数値か言語か

・数値の場合、計量値か計数値か

・採取可能なサンプルサイズはどれだけか

を一つずつ押さえていきましょう。

コラム
スポンサーリンク
シグマアイ-仕事で使える統計を-

コメント