実験計画法どうですか?
私は今まで2社で品質管理や製品開発を行っているのですが、私以外で実験計画法を活用している人を見たことがありません。中途採用で入ったベテラン技術者も含めてです。
確かに実験計画法で扱う直交表や分散分析は一見して分かりづらいものがあります。それが原因で扱われないというのも一因ではあるでしょう。
しかしながら、その手法への理解を深めた上でもうまく扱えない可能性があるのです。
私も実験計画法を扱いだしたのは4年前なのですが、その途中でその落とし穴にハマり挫折しかけました。
今回は、そんな実験計画法を扱う上で語られない障害とその解消法について解説いたします。
動画でも解説しています。
実験計画法とは
本題に入る前にひとまず実験計画法で大切な直交表と分散分析を簡単に説明いたします。
詳細は以下リンク参照ください。
直交表って何?【分散分析と組み合わせて素早く結果を得よう!】
分散分析とは何ですか?【分散で要因を特定します】
直交表
手法に詳しくない方でしたら、実験のやり方は大きく一因子実験と総当たり実験の二つの選択肢から選ぶと思います。
総当たり実験は言葉の通り総当たりです。例えば3因子、3水準の場合は27通りの実験を実施することになります。
規模が少ない場合は総当たりでやる方も多いでしょうが、測定時間と因子、水準が膨大な場合はまず実施されないでしょう。そんな時に一因子実験が実施されます。
一因子実験とは、例えば先ほどの3因子、3水準のうち2因子の水準は固定し、1因子だけ3水準振る。その3水準で良いものを次に固定し、残った2因子の3水準を振る。これを繰り返します。
これなら実験回数は9回で済みます。これでおしまい?
一因子で済んだら直交表はいらないんですよ。
上記の一因子実験の結果A2,B3,C2が最適条件らしいことが分かったとします。
ここでA2を選んだのはB1、C1の時でしたが今回選んだB3、C2の状況でもA2が最適と言えるでしょうか。
そうとは限らないのです。因子を動かして比較するには、動かした因子以外の条件が揃っている必要があります。どの土壌でも植物の育ち方が一定にはならないのと同じです。
直交表を使う事で実験回数を一因子実験なみにしつつ、総当たり実験のように見たい因子以外の条件を等しくすることが出来ます。
以下がL9直交表と呼ばれる3因子,3水準の直交表です。
直交表で実験条件を揃えられるメカニズムですが、実験No.1,2,3に注目してください。
BとCが1,2,3全て揃っています。そして実験No.4,5,6にも注目してください。こちらもBとCが1,2,3全てが揃っています。
つまり実験No.1,2,3の平均値と実験No.4,5,6の平均値を平均することでBとCの条件を同一にした状態でAの1,2を比較する事が出来ます。実験No.7,8,9に関しても同様です。
そしてBに注目した場合、実験No.1,4,7に注目するとAとCが1,2,3揃っています。実験2,5,8と実験3,6,9も同様です。AとCが1,2,3揃っています。
こんな感じで、因子の各水準を比較する場合、他の因子の水準が全て揃うので総当たり実験をせずとも実験することが可能になるのです。
分散分析
直交表で実験した結果は分散分析を行うことで、統計的に有意差の有無を確認することが出来ます。ここではイメージで解説します。
先ほどのL9を実施すると、こんなグラフを書くことが出来ます。
各因子の水準で平均値を取って並べたグラフです。要因効果図といいます。これに誤差の情報を追記してみます。
因子AとCは誤差の変動よりも水準を振ったことによる変動が大きそうです。
対してBは誤差の変動と因子の水準振りによる変動は似た風に見えます。
これは誤差の変動に対して因子の水準振りによる変動が数倍大きければ有意差がありそうという事も出来そうです。分散分析はざっくり言うと因子の変動/誤差の変動という比を取って何倍以上なら有意差がありそうと判断する手法です。
分散分析と言っていますが、「分散で平均値の有意差を確認する分析」という解釈をすると分かりやすくなります。
なぜかうまくいかない実験計画法
加法性が必要
さてここからが本題です。直交表も分散分析も理解出来た。さぁ実験やるぞ!!と意気込んでやってみたはいいもの
「どの因子も有意差無しってなる」
「再現実験しても再現しない」
となってしまうことがあります。原因は色々あります。
・そもそも想定していた因子に本当に有意差がない
・因子の有意差よりも測定誤差の大きさがでかすぎる。
このあたりは因子の再選定や測定環境の見直しが必要ですが、実はそこを直してもうまくいかない場合があります。それは
測定値に加法性がない
場合です。
加法性とは読んで字のごとく加えることが出来るか、つまり足し算や引き算が出来るかどうかです。足し算が出来なきゃ掛け算も出来ないので四則演算全てにかかわります。
先ほどの直交表の部分でも解説しましたが、複数の実験データを平均することから解析が始まります。平均という作業は数値を総和して足した数で割ることで算出されます。
そして総和をサンプルサイズで割るには数値の間隔が均等である必要があります。
実はこの世に存在している数値の全ての間隔が均等である訳ではありません。
例えばマラソンの順位。1位の人と5位の人の平均値は3位の人でしょうか。
順位だけで平均値を出すとそうなってしまいますが、そんなわけありませんよね。
それは1位と2位のタイム差と2位と3位のタイム差が異なる可能性があるからです。
この順位で加法性が成立するには、すべての順位の時間間隔が均等である必要があります。さてここでより実践的に考えるために私が勤めている製造業でありそうな事例で改めて解説いたします。
5段階評価や百分率
現場の外観検査で傷による不良が多発している。それを改善するための実験をしようとしているがそういう時に使っている指標が傷の5段階評価だったりすると、大抵その実験はうまくいきません。
傷の5段階評価とは、傷が無い場合を1、傷がひどい場合を5として傷の程度を1~5の5分割で仕分ける評価方法です。
不良サンプルを並べるだけで簡単に定量化出来るので多用される考え方です。
ですが、これでは改善のための実験検証をすることは難しいです。5段階評価ではマラソンの事例と同様に数値の間隔が一定では無いからです。たまたま見つかった5つの不良サンプルを順番に並べただけで間隔に裏付けが何も無いのです。
また5段階評価と同等以上に見られる事例で百分率があります。
特に製造業では歩留(良品率を指します)や不良率など品質の重要指標として百分率が多用されていますが、これを分析指標として使う実験計画法も大抵うまくいきません。
例えば歩留を50%⇒60%にするのは比較的容易に思えますが、80%⇒90%にするのは先ほどより難しそうじゃありませんか?
実は百分率は50%付近と末端付近(0% or 100%)では1%の重みが違うのです。そのため百分率は加法性が成り立たなくなる可能性が高いのです。(基準の値から±10%くらいだったら成立しますが)
これを解消するためにはロジット変換という処理をする必要があります。
このように一口に数値といっても、身の回りには加法性を持たない指標であふれています。
そもそも実験計画法をはじめとした統計学を職場で活用するためには、加法性を持った指標で表現する事が必要不可欠なのです。
外観検査であれば、簡単に5段階評価をするのではなく、その外観不良の本質を考えて加法性を持たせる工夫をするべきなんです。
私が過去アップしたnoteではこのようなダメな指標にいかにして加法性を持たせるかのノウハウを書いています。気になる方はぜひご覧ください。
まとめ
実験計画法は理解するのが難しい手法ですが、理解出来ればこれほど有用なものもありません。
しかしながら、あまり周りでは使われない。twitterでも実験計画法マスター出来ないと投げている人を良く見かけます。
様々な理由がありますが、その中でも分析する数値がそもそも加法性を持っていないというのはあまり語られません。
製造業をはじめビジネス環境ではこの加法性がない数値がかなり溢れています。
自分の扱っている指標が加法性を持っていないという事は、実は平均値もあてにならないという事です。一般的な数値処理すら実は出来ないという事なんです。ただそれに気づいていないだけ。
ぜひ今一度自分の扱っている指標を見直してみてください。
もしかしたら、えらい事になるかもですよ?
コンテンツ紹介
昨今機械学習やディープラーニングなど、データを扱うための知識の重要度は日々増していっています。
そんな最先端のスキルを使いこなすには、土台となる統計学の知識が必要不可欠です。
しかしながら、統計学は本で読んでも何とか理論は理解できてもそこからどのように実務に活かしたら良いのか分からない。そんな机上と現実のギャップが凄まじい学問です。
そんな机上と現実のギャップを埋めるために、私は当サイトをはじめ様々なコンテンツを展開しています。
youtubeでは登録者1万人の統計学のチャンネルを運用しています。
動画投稿だけでなく、週2回のコメントに来た質問への回答配信も行っているので気になる方はどしどし質問をお寄せください。
youtubeでは無料動画だけでなく、有料のメンバーシップ限定動画も運用しています。
メンバーシップ登録リンク(押しただけで登録はされないので、気軽にクリックしてください)
エクセルやJAMOVIといった無料で使える統計ツールの実際の使い方。そして無料動画では敷居の高い(というよりマニアックゆえに再生数が見込めない(笑))解説動画をアップしています。
本を読んで実際に分析してみようと思ったけど、どうもうまくいかなかった。本では見かけない、あるいは難しすぎて扱えない手法があったという方。ぜひ一度ご参加ください(動画のリクエストがあれば反映させます)
「そうは言われても、うちのデータは統計学じゃ分析出来ないよ」
そういう方もいらっしゃると思います。私の経験上、そういったデータ分析が出来ない状況の一つとして量的変数として目の前の現象を扱えていないというものがあります。
私のnoteでは、過去私が製品開発を行う上で実践した分析しやすい数値の測定方法を公開しています。
私が開発活動する上で創意工夫を凝らして編み出してきたアイデアの数々を公開しています(私の知見が増えたら更新していきます)。本やネットではまず載っていません。うまい測定方法のアイデアが浮かばないという方はぜひこちらをご覧ください。
「いや、その前に使える手法を体系的に学びたいんだけど」
そんな方には、udemyの講座を推奨します。
初歩的な標準偏差から、実験計画法、多変量解析まで、実際に私が実用する上で本当に使用したことがある手法に絞って順序立てて解説しています。
どの手法が結局使えますのん?という方はぜひこちらをお求めください。
こんな感じで、様々なコンテンツを展開しています。
今後は品質工学や品質管理に重点を絞ったコンテンツなども発信していきます。
ぜひリクエストがありましたら、それらも反映させていきますのでまずはお気軽にご意見くださいな。
コメント