分散分析表は直交表とセットで使う事で、どの要因に効果があるのかを教えてくれる統計ツールです。
ですが、一般的な書籍には検定での有意差や寄与率といった表面的な見方しか書かれていません。
今回はそういった一般的な見方だけでなく、ウラワザ的な、というより実学に沿った見方をご紹介いたします。
分散分析表の一般的な見方
まずは一般的な見方を紹介します。
今回はこんな分散分析表で見ていきます(実際に直交表を使った場合、自由度的にはこうなることはありません。各要因の自由度は1か2になります)。
F検定による有意差検定
まず、最初に見るべき箇所はF値によるF検定です。
F分布の自由度に一致するF0値と実際の誤差との分散比F値を比較し、F値が大きければ有意差ありと判定します。
ここでは、要因3,4が誤差に対して有意差ありと判定されています。
しかしこれでは全体に対しての影響度は分かりません。影響度を知るためには寄与率を導く必要があります。
寄与率の導出と見方
寄与率は以下の式によって導かれます。
$$ρ=\frac{S_A-φ_AV_E}{S_T}$$
それぞれの値は
ρ:寄与率
SA:要因Aの平方和
φA:要因Aの自由度
VE:誤差分散
ST:全体の平方和
になります。例えば要因1の寄与率は
$$ρ=\frac{S_1-φ_1V_E}{S_T}=\frac{3000-10×125}{10000}=0.29$$
となります。つまり要因1は全体の変動の29%に寄与しているという事になります。
このようにしてみると、統計的に有意な要因は3と4であり、その影響度は要因3の方が要因4より大きく、重要であるようです。
ただ、要因1も29%と要因4より大きな寄与率を示しています。
このように、寄与率が大きければ有意差が出るというものではありません。
要因1の寄与率は飽くまで、自由度が大きいことで肥大化しているものです。
故に有意差あるものの寄与率のみに注目する方が、誤った判断にはなりづらいと思います。
優先順位:有意差判定⇒寄与率
です。
分散分析のウラワザ
ここからは、私が実際に使っている中で気づいた、実学に基づくウラワザを紹介していきます。
多重比較は必須?
よく『分散分析の後は、重要な要因について多重比較法で分析しましょう』と多重比較を推しているものを見かけます。
しかしながら、これは必ずしも正しいとは限りません。
なぜなら、分散分析ですでにF検定を実施している上、更に多重比較(つまり検定)を行う事は検定の多重性に引っ掛かり、誤った判断のもとになるからです。
また、分散分析が非常に重要な手法である理由は、効果のある要因を特定できる点にあり、その要因の中のどの水準が効果的かどうかはそれ程重要ではないのです。
直交表を利用する際には、水準は3程度までしか振ることが出来ないので、うまく活用するポイントは、
・大きく水準を振る
・効果のあった要因については、後で細かく水準を振る
とすることです。つまり分散分析を実施するタイミングでは、どの水準が効いているかを知る必要はなく、のちの細かく水準を振った実験の時に、最初から多重比較法を適用するのが正しい運用法になります。
つまり
大きく振ってアタリをつけて、後で照準を調整する
という方法が適切なのです。一度で細かい条件を知る必要はないのです。
効果が無い要因は無駄足?
直交表⇒分散分析の流れでは、複数の要因を同時に見る事が出来るので、本命の要因だけでなく、多分効果がないであろう要因を入れてしまえるのがミソです。
自分の知識で説明がつかない要因は、時間のムダと実験候補から外されがちですが、ついでに(ここ重要)見ることが出来るので、時間の無駄になりづらく、また意外なお宝を引き当てる可能性もあります。
また、例え予想通り効果が見られなかった場合もそれは無駄になりません。
そもそも、開発品をはじめとしたこの手の実験対象には、重要な特性が一つではない事が多いので、ある特性に効果がなくとも、ある特性には効果があるといったことも良くあるのです。
そして、この特定の効果を邪魔せずに別の特性には効果があるという要因は、排反事象を回避する上で非常に重要になってきます。
例えばLEDの明るさには、外側の白い樹脂の流動性は影響しないけど、加工性には非常に寄与するといった場合、
・明るさはそのままに
・加工性をコントロールする事が出来る
要因を見つけることが出来るのです。
メーカーというものは、とにかく頻繁に排反事象というものにぶつかってしまうものです。
そして、固定観念に囚われすぎて一つの要因にしか目が向かなかった為に、排反事象となる二つの特性が中途半端に妥協されてしまうというのが頻発してしまうのです。
固定観念を打ち破るには、とにかく実験してデータを取るしかありません!
そして、本命のついでに穴馬も試せる直交表⇒分散分析は、その固定観念を打破する強力なツールになり得ます!
ぜひ、穴馬要因のデータをうまく活用して、スペシャルなアウトプットを得て下さい!
まとめ
分散分析もですが、手法というものは実用して初めて分かる、見えてくるというものがあります。
実際に私も直交表を使い始めて2か月程度なのですが、
「なぜ、今まで使わなかったんだ!」
と後悔するほどに効果的な手法であり、また案外使ってみると簡単ということも初めて分かりました。
ただ、この直交表⇒分散分析は実際に使うには敷居が高いことも事実です。
次回はこの『なぜ直交表が使われにくいのか』解説しようと思います。
twitterとyoutubeやってます。良かったらフォローお願いします。
熊野コミチ(@gRDQJkozHInWFxI)(youtube)
コメント