管理図の管理限界値 係数による推定と3σの差異ってどのくらい?

エクセル

管理図は工程の日常管理や、現場の状況を分析するのに非常に使えるツールです。

この管理図ですが、作る時に最も重要と言えるのが管理限界値です。

この管理限界を外れるかどうかで異常かどうかを判断するためです。

この管理限界は3σを基準に線引きするという事になっていますが、様々な書籍では係数を用いた線引き方法がよく提示されているのです。

単純に3σを引いてはダメなのでしょうか?

という事で今回は係数で算出した場合と標準偏差×3(=3σ)で、管理限界値に差があるのかどうかを確認してみました。

結論としては、殆ど差がありません

スポンサーリンク

管理図の管理限界値について

管理図って何?

このようなページに検索でたどり着いた方には、必要ないかもしれませんが一応管理図について簡単に解説いたします。

管理図とは、工程の状態に異常が無いかを日々管理する為に作られたツールで、基本的には

・日々N=5程度製品を抜き取りデータを測定

・N=5の平均値や範囲をプロットする

・定めた管理限界値から外れていなかったらOK

とするシンプルながらタイムリーに工程管理を行う事が出来る素晴らしいツールです。

詳しくは以下の記事を参照してください。

3σを管理限界としている

管理図を作るうえで、最も重要なのは管理限界値です。

管理限界値の引き方で、日々のデータの解釈が変わってしまうからです。

この管理限界値ですが、原則としては規格の中心CLに対して平均値の標準偏差の3倍、つまり3σを上下に引きます。

±3σが上下限の管理限界値なのです。

この理由としては、この管理限界から外れる確率が極めて低い(0.3%)という事が正規分布の性質から言える為です。

元のデータの分布に関係なく、平均値の分布は必ず正規分布になります。

これを中心極限定理と呼びます。

管理図の強みは、この統計的な裏付けにあると言えます。

平均値のプロットなので、元のデータに関係なく正規分布を適用出来、その為3σで管理するという事を一義的に決める事が出来るのです。

係数を使った計算法

(不偏)標準偏差を求める式は

$$σ=\sqrt{\frac{\sum_{i=1}^{n}{(x_i-\overline{x})^2}}{(n-1)}}$$

なんですが、管理図では別途範囲Rと特殊な係数を使った管理限界値の算出方法が存在しています。

内容は

平均値のUCL/LCL

$$UCL=\overline{\overline{x}}+A_2\overline{R}$$

$$LCL=\overline{\overline{x}}-A_2\overline{R}$$

範囲RのUCL(抜き取り数が6以下の場合はLCLを算出しない)

$$UCL=D_4\overline{R}$$

ただし、

とA2やD4は採取したサンプルの数によります。N=5の場合は

A2=0.5770

D4=2.1140

になります。

なぜこんな方法をわざわざ取るのでしょうか。

それは、管理図が成立した時期を考える必要があります。

管理図を作ったシューハート博士は20世紀前半(1967年没)の人物です。

ゆえに当然現場にパソコン(もといコンピューター)などおいそれと置いてある時代ではないのです。

標準偏差はエクセルを使えば、簡単に算出出来ますが、手計算ではかなり手間がかかります。

各値を平均から引いて、それぞれ二乗して、全て足し合わせて、自由度で割って、平方根をとる。

こんなの日々の管理でやっていられないのです。

その点、係数を使ったこの方法であれば、算出するのは平均と範囲(最大-最小)だけになるので、現場でも簡単な電卓レベルで計算出来ます。

つまりコンピューターがない時代には、この方法で3σの計算を簡略化する必要があったという訳です。

スポンサーリンク

係数による推定と3σを比較しよう

係数で管理限界値を計算しよう

実際に係数を使った方法で3σを計算してみましょう。

数字は以下を使ってみます。

まず平均値のUCL/LCLです。

全体の平均値は20.00

範囲の平均は0.08

になります。なのでUCL/LCLは

$$UCL=\overline{\overline{x}}+A_2\overline{R}=20.00+0.5770×0.08=20.05$$

$$LCL=\overline{\overline{x}}-A_2\overline{R}=20.00-0.5770×0.08=19.95$$

になります。

そして、範囲のUCLは

$$UCL=D_4\overline{R}=2.1140×0.08=0.18$$

になります。

3σと比較しよう

この係数で算出した管理限界値を標準偏差×3と比較してみましょう。

というのも、

・本当に標準偏差×3に近い値なのか

・N>6のときの係数が分からないから係数法以外にも有効な手段を知っておきたい

というのが結構気になるのです。説としては係数による計算は3σの推定値とされていますが、実際に標準偏差×3と比較しないと自信が持てません。

という事で、標準偏差×3をそれぞれ出してみました。

標準偏差×3での平均値のUCL/LCLは

UCL

$$\overline{\overline{x}}+3σ=20.00+3×0.019=20.06$$

LCL

$$\overline{\overline{x}}-3σ=20.00-3×0.019=19.94$$

標準偏差×3でのRのUCLは

UCL

$$\overline{R}+3σ=0.08+3×0.029=0.17$$

一覧にすると、

ほぼ同じ値を示しました。この程度の差なら同じ工程でのデータばらつきで生じ得るでしょう。

今回初めて試みたのですが、ここまで一致するとは思いませんでした。

逆に係数と範囲の値で3σをここまで予測した昔の人がスゴい・・・

ですが、やはりここまで一致となると、PCが現場に当たり前に存在する今となっては係数を使うよりもエクセルで標準偏差を算出した方が、係数のN数の制限を受ける事も無いので簡便かつ実用的であると言えるでしょう。

3σを算出する時の注意点

管理限界値の3σはふつうにデータの標準偏差を使う事で何とかなりそうです。

ですが、1点注意点があります。

それは平均値の標準偏差を使うという事です。

というのも、管理図のClやUCL/LCLは平均値の正規分布を想定しています。

先述したように生データの分布とその平均値の分布は形状が違うのです。

つまり、生データの標準偏差と平均値の標準偏差は一致しないという事です。

実際に計算した値を並べるとこうなります。

生データのσ:0.038

平均値のσ:0.019

この値で管理限界値を求めると

このように、係数による推定値とも、平均値の3σともかけ離れた管理限界値になります。

これは日々の管理を誤る可能性が出てきます。

気を付けて下さい。

スポンサーリンク

まとめ

管理図の管理限界値は総平均の±3σです。

これは平均値の中心極限定理と正規分布の性質を利用しています。

そして、管理限界値を算出する方法には3×標準偏差係数による推定の2つが存在します。

どちらも同じような値を示しますが、エクセルが標準配備されている昨今は標準偏差から計算する方法の方が簡単で、幅広い状況にも対応できるのでオススメです。

今まで係数を使った方がいいのか、N>6だったらどうしようと迷っていた方はぜひこの方法を活用してみて下さい。

コメント