統計学は、数字を分析する上でこの上なく便利な道具ですが、みなさん実際に使う時はどのようにして使いますか?
手計算・・・はしないですよね。
おそらく、エクセル関数か分析ソフトを使って計算そのものはPCにお任せしているものと思います。
普段使う上では、それでもいいと思うのですが、最初からソフト依存になると
自分が何をしているのか分からない状態
になってしまいます。自分の分析結果なのにブラックボックス化してしまうのです。
今回は、統計を扱う上でのブラックボックス化の危険と、そうならないための方法としての2つのアプローチを紹介いたします。
統計手法のブラックボックス化
エクセルに頼ると、プロセスが分からなくなる
統計を使う上で、最も陥りがちなのがブラックボックス化です。
つまり、データをそのまま解析ソフトにぶち込んで結果をアウトプットする事で、具体的にどのような分析が行われているかが分からない、というものです。
このブラックボックス化の何が危険かと言えば、その解析結果が正しいかどうか、数学的に検討する事が出来ないという事です。
例えば、主成分分析や因子分析などマーケティングでも多用される多変量分析は、その導出に行列を使っていたりして、非常に理解するのに難しい手法です。
統計にはこのように、数学的に難しい,かつ実践でも使用できる手法が多く揃っています。
また、数学的にはそれほど難しくない、標準偏差でも一度も自ら計算したことがなく、エクセル関数に依存している場合も、どこかで数学的にミスをしてしまっても気づくことが出来なくなる可能性があります。
その上、解析ソフトではデータを貼り付けて、分析手法を選択するだけで簡単に結果を返してくれるので、一層ソフトに依存しやすくなってしまいます。
このように、統計においては
・数学的にハードルが高め
・解析ソフトが便利すぎる
という事から、分析結果のブラックボックス化を誘発しやすいという問題点があるのです。
統計はPCの発展により、多用され始めた
ブラックボックス化の要因を、更に深堀してみます。
そもそも統計学というツールは、それ単体では非常に扱いづらいものです。
理由は、計算量が膨大になってしまうからです。
例えば標準偏差を考えてみます。
以下の表の標準偏差を手計算でやってみてください。
$$s=\sqrt{\frac{\sum_{i=1}^n{(x_i-\overline{x})^2}}{n}}$$
まず、各項目の偏差を出して、それをそれぞれ2乗して、すべてを足して、サンプルサイズで割って、平方根する。
データの数がたったの8個なんですが、とてつもなく面倒くさいです。
これが実際の現場では、データ数が数十、数百となることもよくあります。
とても手計算では追い付かないのです。
つまり、統計学はPCの計算能力があって初めて実用に耐えうるツールなわけです。
その証拠に、Xbar-R管理図のUCL/LCLの計算方法が範囲を使っていたり、GR&Rでも範囲を計算に使っている理由もPCが現場に無い状態でも電卓があれば計算出来るようにするための名残とも言われています。
統計的品質管理(SQC)が流行しだした頃はパーソナルコンピューターは普及していなかったのです。
このように、統計学はPCが無いと実用する事が難しい(つまり手計算では運用できない)ツールであって、そのためにブラックボックス化しやすいものだという事なのです。
統計を学ぶための2つのプロセス
実際に手計算しよう
基本的に統計学を学ぶときには、書籍を使うと思うのですが、その時に必ず練習問題がついていると思います。
この練習問題を手計算で解いてみましょう。
その計算の過程で、どのようにして数字が変化していくのかが良く分かると思います。
一度手に沁みつけば、ソフトによる解析を行っても、何か結果がおかしいとき、気づく力が身についていると思います。
生データと結果を触ってみよう
手法によっては、手計算出来ないものも存在します。
多変量解析なんかがいい例です。
あれは、とてもじゃないけど手計算は無理でしょう。
そのような場合どうすれば良いのでしょうか?
・どのような計算メカニズムなのか、文献を読む
・解析ソフトにデータを入力して、出力がどのような結果になるのか確認
・最初に入力したデータの一部を変えて、出力がどのように変化するのか確認
以上のように、入力データを少し変えて、都度出力されるデータを確認していくと、どのようにデータが変わると出力が変わってくるのか、規則性みたいなものが感覚として見えてきます。
これに更に、教科書とかも合間に読んでいくことで、徐々に手法の要点が掴めるようになってきます。
この方法を用いれば、ソフトの解析結果に違和感がある場合にどこがおかしいのかを素早く察知する事が出来るようになります。
まとめ
統計学を扱う上で、解析結果のブラックボックス化を防ぐ手立ては、
・習得時に手計算で体に覚えさせる
・解析ソフトの入力データを少しずつ変えながら、出力の変化を観察する
この2点の実施です。
統計学を始めとして、学問というものを理解し実用するためには、頭だけではなく、五感に覚えこませる必要があります。
結構感覚みたいなものが大事なんです。
小難しい理論とかも、実験を繰り返した上で文献を再度目を通すと、案外に頭にすんなり入ってくるものです。
物事を理解する上で、手を動かすことは必須です。
面倒くさがらず、地道にやってみてください。
その他おススメ書籍はコチラ
当サイトを閲覧下さる皆さまは、日々より良い仕事が出来るようになりたいと思われているビジネスパーソンがメインだと思います。 でも「時間が無い」、「セミナー行くの面倒くさい」といった理由で中々学べていない方も多いと思います。 このビジネス動画学習サービスでは、いつでも、どこでもスマホ一つでビジネススキルを隙間時間で学ぶことが出来ます。 youtube紹介はこちら
コメント