1.背景
Cp, Cpk, Pp 和 Ppk這幾個概念在工業制造領域的應用已經很普遍了,但是這些概念往往被混淆。網上的解釋各執其詞,而且錯誤百出(如下圖):
就連國外網站上的讨論也是衆說不一⑥。 當這些概念用中文解釋時,那就更複雜了。比如這些概念裡共有的'P' 是一個簡單的英語詞'process',可被翻譯成什麼的都有,比如'工藝,過程,工序,制程 …'等等。可想而知加了其他詞以後就更複雜了。為了方便起見,以下process均采用'工藝'。
筆者2003年在學校裡就學習了這些概念,而且在之後的十幾年的工作中也不斷地在應用這些概念。但始終覺得沒有完全理解其本質區别。多年下來一直都是在照貓畫虎,套公式,得出結果,做出判斷,完事。更有甚者,現在有現成的計算機軟件,點一點鼠标就可以得到結果。更不用知道其後台是如何計算的了。 一般來說,能做到此,也就可以了。所以下面的解析是為有意願深入了解這些概念的差别的讀者準備的。
CP, CPk, PP 和 PPk都是用來體現工藝能力的指标①②,它們是用來測量工藝能力的系數(process capability index),不是工藝能力本身。很多人隻知道計算這些系數,卻并不知道工藝的固有能力到底是什麼。 那什麼是工藝能力(process capability)?
2.工藝能力的定義
工藝能力是指工藝本身在沒有外因幹預、沒有漂移(drift)(即統計學意義上可控under statistical control)的情況下其産出品的均一程度 (uniformity of product)②③。 不難理解,我們不可能直接測量工藝本身,而隻能通過測量其産出品的某個特性來體現其能力③。通常用被測量的特性的離散程度, 即标準方差, (西格瑪),來表示工藝能力。而且工藝能力被量化為 ,即其總寬度為6個西格瑪。其中 是工藝的均值(mean), 是工藝的标準方差(西格瑪)。 例如A工藝的西格瑪=2,其工藝能力=6*2=12。B工藝的西格瑪=2.5,其工藝能力=6*2.5=15。 那麼問題來啦:A工藝和B工藝那個好呢? 答案是:視情況而定(it depends)。為什麼? 因為沒有判斷标準。
3.衡量工藝能力的指标的定義與計算公式
也許你已經注意到工藝能力的定義與産品的可接受标準(specifications)無關。可是抛開産品的可接受标準,單純地講工藝能力,又毫無意義。這就是為什麼人們要引入“工藝能力的指标(CP, CPk, PP 和 PPk )”這些概念。
CP, CPk, PP 和 PPk這些系數是工藝能力和可接受标準比較的結果,也被稱為工藝能力比率(process capability ratio)③。筆者更傾向于使用工藝能力比率,因為它直觀。另外這些概念的計算都引入了标準方差或西格瑪,因此它們都是統計學意義上的概念,也正是如此它們都沒有單位。
有趣的是,權威書籍中均沒有體現這幾個符号(CP, CPk, PP ,PPk)所代表的英文詞。 而在這個英文網站上⑥:/tools-templates/capability-indices-process-capability/ 有以下的定義:
這些定義很顯然是有問題的,因為這四個符号都是“index”或“ratio”。 筆者認為它們的定義是這樣的:
Cp= Process Capability Ratio可被譯為“工藝能力系數”
Cpk= Process Capability K Ratio 可被譯為“工藝能力K系數”
Pp= Process Performance Ratio可被譯為“工藝績效系數”
Ppk= Process Performance K Ratio 可被譯為“工藝績效K系數”
注:據有人說 這裡的‘k’ 是 ‘centralizing facteur’⑥,可能是法語,即“居中因子”。
據此,Cp和CPK被稱為工藝能力系數;而Pp和Ppk則被稱為工藝績效系數。我們權且将工藝能力系數和績效系數統稱為衡量工藝能力的指标。
以上是關于CP, CPk, PP 和 PPk這些指标的定義。下面我們讨論這些指标的計算方法。
了解了這些概念和計算公式,下面讓我們看看這些系數的共同點和區别。
4.CP, CPk, PP 和 PPk的異同點
4.1CP, CPk, PP 和 PPk的共同點
CP, CPk, PP 和 PPk都是用來測量工藝能力的指标。它們的共同點是:
·都被用來表示工藝能夠生産出達到可接受标準的産品的程度或能力
·都被用來表示工藝的産出品的離散程度和可接受标準的比率
·它們的值越大,工藝越能夠更好地生産出達到可接受标準的産品
當然它們也各有區别。
4.2 有k系數(CPk和PPk)和
沒k系數(Cp和PP)的區别
首先是有k系數(CPk和PPk)和沒k系數(Cp和PP)的區别:沒k系數(CP和PP)隻顯示工藝的産出品的離散程度和可接受标準的關系;而有k系數(CPK和PPK)除了顯示工藝的産出品的離散程度和可接受标準的關系外,還關注工藝的産出品的均值是否偏離可接受标準的中間值。其數學關系是:有k系數永遠不大于沒k系數,即:
·CPk≤CP(當工藝的産出品的均值和可接受标準的中間值重疊時,CPk=CP, 否則CPk<>
·PPk≤PP(當工藝的産出品的均值和可接受标準的中間值重疊時,PPk=PP, 否則PPk<>
我在工作中發現沒K系數(CP和PP)應用得較少,估計是因為很少有工藝的産出品的均值正好與可接受标準的中間值重疊。 但其實這是不對的:有k系數(CPk和PPk)和沒k系數(Cp和PP)應該一起使用才能準确體現工藝的能力①,詳情其後讨論。 現在讓我們先看看工藝能力系數(Cp和CPK)和工藝績效系數(Pp和Ppk)的區别。
4.3 工藝能力系數(Cp和CPK)和
工藝績效系數(Pp和Ppk)的區别
工藝能力系數(Cp和CPK)和工藝績效系數(Pp和Ppk)的區别,即CP和PP的區别,CPk和PPk的區别。
其中 R-bar是通過将被考量的工藝在某一時段(考察區間)的産出品的觀察樣本的某個性能的數值制成工藝控制圖(Control Chart)來得到的;而d2 則是一個統計學常數,與工藝控制圖的樣本亞組(subgroup)的樣品個數有關,其值可以參考下表⑤。
d2的值可以通過很多書籍查到①②③④,但常用的就是n小于10的值。其實超過5的話數據量就很大了。
現在我們了解了S和 西格瑪的區别,那麼我們是不是就理解了Cpk和Ppk的區别了呢?似乎沒那麼簡單。 相信大家還是弄不清它們的本質區别。下面我們用一個很容易理解的例子來說明一下它們的計算。
假設公司有班車接員工上班, 我們讓坐班車的同事記錄班車第一個站到公司的時間(分鐘),觀測了30天,得到下面表格的數據。。
使用标準方差公式計算,得出S=11.6。
假設公司要求司機每天要在從第一站到公司的時間要保持在55分鐘到70分鐘之間(時間太短司機可能超速,不安全,時間太長班車會晚點),則LSL=55,USL=70。 套用以上的公式可以得到以下Pp和Ppk的結果。
根據這個控制圖,得到 R-bar=12.7。運用上面的公式 可以得到 西格瑪=12.7/1.128=11.259。再運用Cp和Cpk的公式得到:
Cp = 0.222, Cpk= 0.138
綜上我們可以得到以下的結果:
PP = 0.216 PPk = 0.134; Cp = 0.222, Cpk = 0.138
大多數人可能都會得到這樣的結果并就此打住。 但是這裡關于Cp和Cpk的計算存在很明顯的錯誤,因為Cp和Cpk的計算是有兩個必要條件的③:
1.工藝是穩定的
2.所觀測的數據是呈正态分布的
沒有這兩個必要條件所計算出來的Cp和Cpk值是不具有統計學意義的①③,或者說所得到的CP和CPK不準确。
上圖很明顯地看出,這個工藝是處在“非穩定或非可控”(not stable or not under control)狀态,因為圖中有1個點超出了控制上限(UCL)。根據Cp和CPk的定義,該組數據中有特别原因造成的點,工藝不穩定,因此不能直接用此控制圖的數據來計算Cp和Cpk。 這也是為什麼不要用數學公式來直接計算 并計算Cp和Cpk的原因。 為了得到穩定的工藝控制圖,需要把這個點去掉,再重新制圖,得到下面的控制圖。
請注意這個圖還是有一個點是超出控制線的(R-圖中的虛線的點)(關于如何使用控制圖來判斷工藝是否穩定也不屬于本文的讨論範圍,可查看參考文獻③),這個點也應該被去掉。去掉這個點,可以得到下面的控制圖。
于是我們得到結果:
CP0.330
CPK 0.193
可以看出實際的Cp和CPK都有所增加。 也就是說如果工藝不穩定,計算出來的Cp和CPK值會偏低,這就會低估工藝的潛在能力。
根據定義,Pp和Ppk 的計算是不可以把這兩個點去掉的。因此Pp和Ppk 是不需要重新計算的。 這樣針對這個例子中的數據,我們可以得到:
PP0.216CP0.330
PPk0.134CPK 0.193
除了工藝穩定,工藝能力系數(Cp和CPK)的計算還需要數據呈正态分布。那麼這組數據是否符合正态分布呢?我們可以借助統計學工具來做分析,如下圖。 可以看出p>0.05,所以這組數據是成正态分布的。所以上面的計算是成立的。
值得注意的是數據是否成正态分布與工藝是否穩定沒有直接的關系。 不 穩定的工藝的數據也可能是成正态分布的。
至此,該組數據(去掉兩個點)通過了這兩個測試: 工藝穩定和正态分布。因此上面的關于Cp和Cpk的計算是正确的。而用于Pp和Ppk計算的數據則不必進行這兩個測試。
通過這個例子,可以将工藝能力系數(Cp和CPK)和工藝績效系數(Pp和Ppk)的區别總結如下:
1.工藝能力系數(Cp和CPK)表示的是工藝在穩定(即沒有任何特殊原因或漂移幹擾産出品的特性或者說是在可控(under control)的)狀态下能使其産出品達到可接受标準 的程度的指标,也可以理解為工藝的'潛在'能力③。(注:'潛在'是相對目前的工藝條件而言,改變工藝條件可以不斷提高Cp和CPK,這就是不斷改進(continuous improvement )的理念)。因此将Cp和CPK翻譯成'工藝潛能系數'和'工藝潛能K系數'更為貼切。因為CP和CPk體現的是穩定狀态下工藝的潛在能力,因此Cp和CPk可以用來預測該工藝将來在現有工藝條件下的最好的情況。
2.工藝績效系數(Pp和Ppk)則是工藝在過去某個觀察時段内的實際績效,即是該工藝的已經産生的産出品實際達到可接受标準的情況。它們不考慮工藝是否穩定③,即便可能包括特殊原因(special cause)幹擾産出品的特性或者說工藝不一定處在一個可控的狀态(out of control),同樣可以計算出PP和PPk。由于PP和PPk是體現工藝在過去的某個時段的績效,所以PP和PPk被稱為'工藝績效系數'。也正因如此,Pp和PPk 僅代表工藝過去的情況,并不能用來預測工藝将來的狀态③(将來可能更好也可能更壞,當然也可能一樣)。許多作者反對使用工藝績效系數,因為它們沒有統計學意義,而且認為是統計學在SPC--統計學工藝控制中應用的倒退③。有趣的是工藝績效系數(Pp和Ppk)是美國三大汽車公司為了對其供應商的績效進行标準化而産生的,并且被納入了美國ANSI标準③。
筆者認為工藝績效系數(Pp和Ppk)的産生與其計算簡單且沒有太多的統計學限制有關。因為它們始終不會大于工藝能力系數(Cp和CPK),作為工藝過去的業績指标還是可以的。 但是它們會低估工藝的實際潛在能力,可能誤導工藝改進的方向。
3.許多作者都認為工藝能力系數(Cp和CPK)是短期工藝能力指标,而工藝績效系數(Pp和Ppk)是長期工藝能力指标①②③⑥。但這個說法很容易被誤解為Cp和CPK是短時間收集的數據,而PP和PPk是長時間觀測收集的數據。而實際上這裡的'短期''長期'與采集數據的時間長短沒有任何關系①,因為短期測試結果也可能存在由特殊原因引起的離散(variability),而長期收集的數據也可能沒有特别原因引起的離散。其本質的區别是計算中是否允許有被特殊原因引起離散的數據:PP和PPk是将所有被觀測的樣本數據都用于标準方差的計算, 而用于計算Cp和CPK的西格瑪不應該包括由特殊原因引起離散的數據。
綜上,我們可以将工藝能力系數(Cp和CPK)及工藝績效系數(Pp和Ppk)的本質區别總結如下:工藝績效系數(Pp和Ppk)是工藝的過去或現實;而工藝能力系數(Cp和CPK)是工藝的潛能或将來。工藝能力系數的計算必須滿足'工藝穩定'和'數據正态分布'兩個必要條件;而用于Pp和Ppk計算的數據則不必進行這兩個測試。工藝能力系數及工藝績效系數的數學關系是:CP≥PP , CPk≥PPk。當工藝穩定(stable或under control)且數據呈正态分布時CP=PP,CPk=PPk(注意這裡的'='是統計學意義上的相同);隻要有特殊原因存在, CP>PP , CPk>PPk。 理解這一點對它們的應用很關鍵。
5.CP,PP ,CPk和PPk的應用
首先了解工藝能力系數和工藝績效系數的區别可以幫助理解在什麼情況下采用哪個指标。通常要知道工藝的實際績效情況,即工藝實際的産出品滿足可接受标準的情況,應該采用工藝績效系數。 如果想知道目前的工藝是否已經是達到了穩定的潛在狀态時,可以比較工藝能力系數和工藝績效系數的差别,即CP和PP, CPk和PPk的差别:二者差别越小,說明目前的工藝的績效越接近穩定狀态,即工藝不存在太多的特殊原因引起的偏離(variation)。 如果差異很大,則說明工藝不穩定,需要找出那些特别的原因,消除這些原因,工藝即可被改進。管理者也可以利用工藝能力系數和工藝績效系數的差别,制訂不斷改進的目标。例如上面的例子PPK=0.134, CPK=0.193。目标可以是讓PPK達到0.193.
了解了有K和沒K的區别可以幫助公司判斷工藝的産出品是否偏離可接受标準的中間值。如果PP和PPK比較,CP和CPK比較,相差不大,說明工藝的産出品的特性均值沒有偏離可接受标準的中間值太多。要提高PPK或CPK的值,隻能減少點間差或樣品亞組内最大和最小值的差異,即降低工藝的标準方差(S或 西格瑪)。如果PP和PPK比較,CP和CPK比較,相差很大,那麼将工藝的産出品的特性的均值調整到可接受标準的中間值,就會很有效地提高PPK和CPK值,使工藝能更好地滿足可接受标準的要求。當然這也可以通過計算樣本的均值,并和可接受标準的中間值比較來完成。
在制藥業中工藝能力系數和工藝績效系數的另一個方面的應用是持續工藝确認(CPV)。當選定的關鍵工藝參數CPP (Critical Process Parameter)或關鍵質量屬性CQA(Critical Quality Attribute)的數據經過計算得到工藝能力系數和工藝績效系數時,很容易看出工藝是否“能達标”,也可以看出工藝是否穩定。如果工藝穩定,而且能達标,則可以結論目前的工藝是處在可控的狀态下,即已驗證的狀态得以保持,再驗證就是不需要的。
另外,工藝能力系數和工藝績效系數可以被用來衡量供應商的業績。如果可接受标準是一樣的,當然系數越大的供應商越好。
值得注意的是經典的作者都沒有将工藝績效系數(PP和PPK)作為考量工藝是否能達标的指标①③,因為績效系數的計算沒有考慮工藝是否穩定,而沒有穩定性就沒有工藝能力可言①。
6.關于使用計算機統計軟件的讨論
目前市面上有許多計算機軟件可以計算工藝能力系數和工藝績效系數。 使用這些軟件時必須要理解軟件背後的設置,并且要了解數據是如何采集的,以及所采集的數據和所關注的工藝的關系。隻有這樣才能更好地解釋得到的結果。 運用同樣的例子,我們可以用Minitab來計算工藝能力系數。
首先我們把30天的數據都輸入Minitab,選擇'Process Capability Sixpack Report',得到下圖。
依圖可以得到以下結論:
·數據是呈正态分布的(p>0.05)
·工藝是不穩定的(有一個點超出UCL)。盡管數據中有超出UCL的點,Minitab還是給出了計算結果:
PP= 0.22CP= 0.22
PPk= 0.13CPK = 0.14
這個結果和4.3節中第一次計算的結果完全一樣(有效數字不同)。
而我們知道這個結果是不準确的,因為工藝能力系數是用不穩定工藝的數據計算出來的。準确的結果應該是4.3節中第二次計算出來的結果:
PP= 0.216CP= 0.330
PPk= 0.134CPK = 0.193
也就是說Minitab這個設計從科學的角度講是不嚴謹的。
當然如果我們将除去那兩個點以後的28個數據點輸入Minitab做同樣的計算,我們得到下圖。
這時隻有穩定的工藝的數據,工藝能力系數(Cp和CPK)的計算才是正确的。很不幸的是這裡Minitab也重新計算了績效系數(PP和PPK)。但原則上,這裡卻是不需要重新計算績效系數(PP和PPK)的。 同樣可以說Minitab這個設計從科學的角度講是不嚴謹的。
值得指出的是控制圖的制作和工藝能力系數的計算都是簡單的數學計算,沒有昂貴的計算機軟件同樣可以做到。 以上兩個Minitab圖中的計算和前面4.3節中筆者用Excel計算和做出來的圖是一樣的。
7.總結
工藝能力是指工藝離散度的6西格瑪寬度,與其産出品的可接受标準無關。如果工藝的産出品的數據是呈正态分布的,那麼99.73%的數據會落在這個6西格瑪的寬度内。
常用的衡量工藝能力的指标有工藝能力系數(CP和CPK)和工藝績效系數(PP和PPK)。沒k系數(CP和PP)隻顯示工藝的産出品的離散程度和可接受标準的關系;而有k系數(CPK和PPK)除了顯示工藝的産出品的離散程度和可接受标準的關系外,還關注工藝的産出品的均值是否偏離可接受标準的中間值,其數學關系是:CPk≤CP;PPk≤PP。
工藝能力系數(CP和CPK)和工藝績效系數(PP和PPK)的主要區别是:
1)工藝能力系數CP和CPK)的計算需要滿足兩個條件--工藝穩定且數據呈正态分布,而工藝績效系數(PP和PPK)的計算則不需要考慮這兩個條件
工藝能力系數(CP和CPK)是具有統計學意義的指數,表示的是工藝的“潛能”,可以用來預測工藝的将來,而工藝績效系數(PP和PPK)的統計學意義并不被專家們接受,并且不能被用來有效地預測工藝的未來。
8.後記
工藝能力系數是上個世紀後期才産生出來的概念。最早Cp是由Juran于1974年提出來的,而Cpk是Kane于1986年才提出來的⑦。而且用于衡量工藝能力的系數仍在不斷發展中,新的指标也不斷地被提出。本文僅僅探讨了4個最常用的指标。另一個較常用的指标是Cpm。由于篇幅和其應用的限制,這裡不做介紹,有興趣的讀者可以閱讀參考文獻⑦。
工藝能力系數(CP和CPK)可以被用來估計有多少産出品會落在可接受标準的外面(即不合格品)。當Cp= CPK =1時,而且數據是呈正态分布的話,99.73%的數據都會落在可接受标準的區間内。 具體的計算需要更深的統計學知識。這裡也不做介紹,有興趣的讀者可以參考文獻③。
另一個重要的理念是以上關于工藝能力系數(CP和CPK)的計算是“估計”值,因為工藝的西格瑪和均值都是通過樣本的值來估計的。因此工藝能力系數CP和CPK的準确性是可以通過統計學計算來建立“置信空間”(confidence interval)的。 同樣基于篇幅的原因,這裡不做詳細介紹,有興趣的讀者也可以參考文獻③。
9.參考文獻
①Manuel E. Peña-Rodríguez:Statistical Process Control for the FDA-Regulated Industry, ASQ2013
②Joseph M. Juran: Juran’s Quality Handbook, 5th Edition, McGraw-Hill, 1998
③Douglas C. Montgomery:Statistical Quality Control,Wiley,2012
④Roger Hoerl & Ronald D. Snee: Statistical Thinking, Duxbury, 2002
⑤Brain K. Nunnally & John McConnell: Six Sigma In The Pharmaceutical Industry, IRC Press 2007
⑥/tools-templates/capability-indices-process-capability/
⑦Samuel Kotz & Norman L. Johnson:Process Capability Indices-A Review, 1992-2000, Journal of Quality Technology, Vol. 34, No.1, 2002
有話要說...