直交表って何?【分散分析と組み合わせて素早く結果を得よう!】

実験計画法

研究開発に限らず、品質保証、製造現場、生産技術などなど様々な部署において、問題を解決したり、課題を達成する上で実験という活動は避けて通れません

通常実験というものは、仮説があってそれを立証するために様々な条件を組んで実施されます。

故に実験の成否は、実験の組み方にあると言っても過言ではありません。

今回は実験の回数を効果的かつ最小限にする直交表の概念を紹介します。

スポンサーリンク

直交表って何?

実験の組み合わせは膨大

実験をする際、要求する性能の項目が出来るだけ最大化する数々の要因を様々な水準に振って検証します。

例えば、植物の生育具合を最大化する目的を達成するために、水、土、光という3つの要因が挙げられるとします。

更に各要因の水準を上げるとすると

水:硬水/軟水

土:粘土/腐葉土

光:光有り/光なし

というように上げることが出来ます。こうなるとすべての組み合わせを見るためには、実験回数は

$$実験回数=2^3=8回$$

となります。

まだ何とかなりそうな実験回数に見えますが、ここにもう一つ肥料という項目2水準を加えると

$$実験回数=2^4=16回$$

になります。このように基本的に実験の組み合わせの数は

$$実験回数=水準数^{要因数}$$

と要因が増える事で指数関数的に組み合わせの数が増加していきます。

そして、実際に実験する上で一つ二つの要因検証で足りるわけが無いというのが現実です。

そして、よく行われるのが、本命の1~2要因に対して水準数だけやたら増やして適切な水準が無いかどうかを繰り返す実験だと思います。

ですが、実際にその本命の要因が実は大して効果に寄与しないものであった場合、当然時間が無駄になるわけです。

故に水準を振る前にまずは、重要な要因を見つける事が必要なわけです。

そして効果的に要因を見定める手法が分散分析法であり、最小限の実験の組み合わせを提言するものが直交表になります。

直交表で実験回数を減らそう

以下が最もシンプルな直交表(22型直交表)になります。

例えば先ほどの植物の生育具合の場合、以下のように割りつけることが出来ます。

先述したように本来なら3要因2水準の実験は、総当たりで実施する場合実験を8回する必要があるのですが、この直交表を適用すると4回だけで十分という事になります。

8回から4回ではありがたみが湧きづらいですが、より拡張して7要因2水準で考えた場合は23型直交表を適用する事が出来ます。

本来なら27=128回の実験が必要なところ、直交表を使う事でたったの8回の実験で十分になります。

これは極めて劇的です。

この直交表における実験結果の分析には、分散分析を用います。

例えば、

このように各実験から4つの植物長さというアウトプットが得られるわけですが、

水の効果を知りたい場合

硬水の平均値(10+15)/2=12.5 vs 軟水の平均値(5+10)/2=7.5

を分析し、

土の効果を知りたい場合

粘土の平均値(10+5)/2=7.5 vs 腐葉土の平均値(15+10)/2=12.5

を分析する事になります。

これ以降の分析方法に関しては以下の記事を参照してください。

なぜ直交表で実験回数が減るの?

それではなぜ、直交表を使う事で実験回数が減るのでしょうか。

それは調べたい要因以外は全ての要因が含まれている為です。

少し分かりづらいので、以下の表をご覧ください。

要因1に注目して1,2の平均と3,4の平均を比較するとします。

これを実施するためには、他の要因2と要因3の条件は揃っていなければ正しく比較する事は出来ません。

この直交表では実験1,2で注目すると要因2,3には0と1が2つずつ配置されており、実験3,4で注目しても要因2,3には0と1が2つずつ配置されています。

つまり、要因1以外の条件は全て等しいのです。故に要因1の各水準の平均値を比較しても、他の要因で偏る事は無いのです。

これは要因2に注目した場合も同様です。

分かりやすいように実験No.を入れ替えています。やはり他の要因1,3においては全ての水準が含まれていることが見て取れると思います。

直交表はこのように、見たい要因以外は全ての同じ条件になるように組み立てられています。

そして、直交表は様々な要因数、水準数に対応するべく既に構築されたものが取り揃えられています。

スポンサーリンク

直交表を使う上で気を付けるべき点

直交表にはいくつか注意点があります。

水準数が限られる

用意されている直交表は2水準か3水準がほとんどです。

例外もありますし、複数の要因をつなげてより多くの水準数を割りつける事も出来ますが、実験回数が膨大になったり、試せる要因数が減るなど取り回しが悪くなります。

直交表での実験は飽くまで、効果的な要因を見つけるためのものとして捉えるべきです。

水準は出来るだけ大きく振りましょう。

例えば温度に注目するなら、10,20,30℃とするのではなく、0℃ vs 100℃として分散分析で有意差が出れば、温度は効果のある要因であると判断して、その後に10,20,30・・・とリニアに振って傾向を更に深堀するべきです。

そういった使い方をしましょう。

割り付けにルールがある

直交表をより正確に使うなら、実はすべての要因の列を埋めてはいけません。

先の22型直交表の場合、要因3の場所は交互作用もしくは誤差を見るために開けておくべきと言われています。

詳細は別の記事で書く予定ですが、実際のところそれほど気にしなくても、結果に大きな影響はありません

というより、何よりもスピードが重視される昨今、せっかく使えそうな実験枠をわざわざ誤差の為に空けるなんてもったいないのです。

要因3に要因を割りつけた場合、そこには1,2の交互作用が混じってきます。

また繰り返しがない実験をした場合、誤差も拾えなくなります。

しかしながら、本来交互作用というものは単要因の作用にくらべれば小さいことが一般的です(その証拠に運用法としても交互作用にするか誤差にするか選ぶことが出来ます)

ゆえに要因3に効果がありとなった場合、交互作用が上乗せされたから効果が出たという誤判定になる確率はあまり高くありません。

それに、もし心配なら寄与率から誤差を抜いてみたり、要因1,2の組み合わせに明らかに交互作用が無さそうな要因を選んだりやりようはいくらでもあります。

また、誤差に関して言えば、繰り返して測定すれば良いだけです。

実際には100種のパターンを1回ずつ測定するよりも、10種のパターンを10回繰り返し測定する方が精度は後者の方が極めて高いです。

ちなみに、交互作用や誤差の列を使って実験回数を増やす方法は交絡法混合法と呼ばれる立派に認められた手法ですので、ご安心ください。

とりあえず、直交表を使いたいならまずは、すべての列に要因を割りつけて繰り返し実験してデータを取ってみて下さい。

十分効果的であるという事がすぐに分かって頂けると思います。

スポンサーリンク

まとめ

直交表と分散分析を利用した実験は極めて効率的です。

しかしながら、文献を見ると割りつけ方法だとか、多変量解析がどうとかで正しく実行できるのか不安にさせる情報があふれています(私にはそう思えます)。

しかし実際に使ってみると、ものすごく便利だし、思ったよりは簡単です。

とりあえず、失敗してもいいやと思って使ってみて下さい。

様々な情報が得られると思います。

スポンサーリンク

今すぐ、あなたが統計学を勉強すべき理由

この世には、数多くのビジネススキルがあります。

その中でも、極めて汎用性の高いスキル。

それが統計学です。なぜそう言い切れるのか?

それはビジネスというのは、結局お金のやり取りであり、必ず数字が絡んできます。

そして数字を扱うスキルこそが統計学だからです。

故に一口に統計学といっても、

営業、マーケティング、研究開発、品質管理、工程管理、生産管理.etc

これら全てで使う事が出来るのです。

現に私は前職は品質管理、現職は研究開発職なのですが、面接のときに

「品質管理時に活用した、統計の知識を研究開発にも活かせます」

とアピールして職種をうまく切り替える事が出来ました。

そして、もし始めるなら今から勉強を始めましょう。

なんなら、今すぐこのページを閉じて本格的に勉強を開始するべきです。

なぜなら、このような『スキル』は20代でもっともキャリアアップに繋がるからです。

30代ならいざ知らず、40代になると求められるのはこれまでの業務を遂行してきた経験や人脈なのです。

これが無いとある一定以上のキャリアアップは望めませんし、40代以降のハイクラスの転職先も望めません。

20代のうちは成果を結び付けるためにこのスキルが大いに役立ちますが、年を経るごとに求められる働き方が変わるのでスキルの実績への寄与が減ってしまうのです。

なので、後からやればいいやと後回しにすると機を逸してしまう可能性が高いです。

ちなみにこれから統計学を学習をするというのであれば、ラーニングピラミッドというものを意識すると効率的です。

私自身、インプットだけでなく、youtubeや職場でアウトプットしながら活用する事で統計リテラシーを日々向上させていっています。

ぜひ、アナタも当ブログやyoutubeチャンネルで統計リテラシーを上げて、どこでも通用するビジネスパーソンになりましょう

スポンサーリンク
実験計画法 開発
スポンサーリンク
シグマアイ-仕事で使える統計を-

コメント