当前位置:首页 > 综合 > 正文

衡量工艺能力的指标(Cp, Cpk, Pp 和 Ppk )

1.背景

Cp, Cpk, Pp 和 Ppk这几个概念在工业制造领域的应用已经很普遍了,但是这些概念往往被混淆。网上的解释各执其词,而且错误百出(如下图):

就连国外网站上的讨论也是众说不一⑥。 当这些概念用中文解释时,那就更复杂了。比如这些概念里共有的'P' 是一个简单的英语词'process',可被翻译成什么的都有,比如'工艺,过程,工序,制程 …'等等。可想而知加了其他词以后就更复杂了。为了方便起见,以下process均采用'工艺'。

笔者2003年在学校里就学习了这些概念,而且在之后的十几年的工作中也不断地在应用这些概念。但始终觉得没有完全理解其本质区别。多年下来一直都是在照猫画虎,套公式,得出结果,做出判断,完事。更有甚者,现在有现成的计算机软件,点一点鼠标就可以得到结果。更不用知道其后台是如何计算的了。 一般来说,能做到此,也就可以了。所以下面的解析是为有意愿深入了解这些概念的差别的读者准备的。

CP, CPk, PP 和 PPk都是用来体现工艺能力的指标①②,它们是用来测量工艺能力的系数(process capability index),不是工艺能力本身。很多人只知道计算这些系数,却并不知道工艺的固有能力到底是什么。 那什么是工艺能力(process capability)?

2.工艺能力的定义

工艺能力是指工艺本身在没有外因干预、没有漂移(drift)(即统计学意义上可控under statistical control)的情况下其产出品的均一程度 (uniformity of product)②③。 不难理解,我们不可能直接测量工艺本身,而只能通过测量其产出品的某个特性来体现其能力③。通常用被测量的特性的离散程度, 即标准方差, (西格玛),来表示工艺能力。而且工艺能力被量化为 ,即其总宽度为6个西格玛。其中 是工艺的均值(mean), 是工艺的标准方差(西格玛)。 例如A工艺的西格玛=2,其工艺能力=6*2=12。B工艺的西格玛=2.5,其工艺能力=6*2.5=15。 那么问题来啦:A工艺和B工艺那个好呢? 答案是:视情况而定(it depends)。为什么? 因为没有判断标准。

3.衡量工艺能力的指标的定义与计算公式

也许你已经注意到工艺能力的定义与产品的可接受标准(specifications)无关。可是抛开产品的可接受标准,单纯地讲工艺能力,又毫无意义。这就是为什么人们要引入“工艺能力的指标(CP, CPk, PP 和 PPk )”这些概念。

CP, CPk, PP 和 PPk这些系数是工艺能力和可接受标准比较的结果,也被称为工艺能力比率(process capability ratio)③。笔者更倾向于使用工艺能力比率,因为它直观。另外这些概念的计算都引入了标准方差或西格玛,因此它们都是统计学意义上的概念,也正是如此它们都没有单位。

有趣的是,权威书籍中均没有体现这几个符号(CP, CPk, PP ,PPk)所代表的英文词。 而在这个英文网站上⑥:/tools-templates/capability-indices-process-capability/ 有以下的定义:

这些定义很显然是有问题的,因为这四个符号都是“index”或“ratio”。 笔者认为它们的定义是这样的:

Cp= Process Capability Ratio可被译为“工艺能力系数”

Cpk= Process Capability K Ratio 可被译为“工艺能力K系数”

Pp= Process Performance Ratio可被译为“工艺绩效系数”

Ppk= Process Performance K Ratio 可被译为“工艺绩效K系数”

注:据有人说 这里的‘k’ 是 ‘centralizing facteur’⑥,可能是法语,即“居中因子”。

据此,Cp和CPK被称为工艺能力系数;而Pp和Ppk则被称为工艺绩效系数。我们权且将工艺能力系数和绩效系数统称为衡量工艺能力的指标。

以上是关于CP, CPk, PP 和 PPk这些指标的定义。下面我们讨论这些指标的计算方法。

了解了这些概念和计算公式,下面让我们看看这些系数的共同点和区别。

4.CP, CPk, PP 和 PPk的异同点

4.1CP, CPk, PP 和 PPk的共同点

CP, CPk, PP 和 PPk都是用来测量工艺能力的指标。它们的共同点是:

·都被用来表示工艺能够生产出达到可接受标准的产品的程度或能力

·都被用来表示工艺的产出品的离散程度和可接受标准的比率

·它们的值越大,工艺越能够更好地生产出达到可接受标准的产品

当然它们也各有区别。

4.2 有k系数(CPk和PPk)和

没k系数(Cp和PP)的区别

首先是有k系数(CPk和PPk)和没k系数(Cp和PP)的区别:没k系数(CP和PP)只显示工艺的产出品的离散程度和可接受标准的关系;而有k系数(CPK和PPK)除了显示工艺的产出品的离散程度和可接受标准的关系外,还关注工艺的产出品的均值是否偏离可接受标准的中间值。其数学关系是:有k系数永远不大于没k系数,即:

·CPk≤CP(当工艺的产出品的均值和可接受标准的中间值重叠时,CPk=CP, 否则CPk<>

·PPk≤PP(当工艺的产出品的均值和可接受标准的中间值重叠时,PPk=PP, 否则PPk<>

我在工作中发现没K系数(CP和PP)应用得较少,估计是因为很少有工艺的产出品的均值正好与可接受标准的中间值重叠。 但其实这是不对的:有k系数(CPk和PPk)和没k系数(Cp和PP)应该一起使用才能准确体现工艺的能力①,详情其后讨论。 现在让我们先看看工艺能力系数(Cp和CPK)和工艺绩效系数(Pp和Ppk)的区别。

4.3 工艺能力系数(Cp和CPK)和

工艺绩效系数(Pp和Ppk)的区别

工艺能力系数(Cp和CPK)和工艺绩效系数(Pp和Ppk)的区别,即CP和PP的区别,CPk和PPk的区别。

其中 R-bar是通过将被考量的工艺在某一时段(考察区间)的产出品的观察样本的某个性能的数值制成工艺控制图(Control Chart)来得到的;而d2 则是一个统计学常数,与工艺控制图的样本亚组(subgroup)的样品个数有关,其值可以参考下表⑤。

d2的值可以通过很多书籍查到①②③④,但常用的就是n小于10的值。其实超过5的话数据量就很大了。

现在我们了解了S和 西格玛的区别,那么我们是不是就理解了Cpk和Ppk的区别了呢?似乎没那么简单。 相信大家还是弄不清它们的本质区别。下面我们用一个很容易理解的例子来说明一下它们的计算。

假设公司有班车接员工上班, 我们让坐班车的同事记录班车第一个站到公司的时间(分钟),观测了30天,得到下面表格的数据。。

使用标准方差公式计算,得出S=11.6。

假设公司要求司机每天要在从第一站到公司的时间要保持在55分钟到70分钟之间(时间太短司机可能超速,不安全,时间太长班车会晚点),则LSL=55,USL=70。 套用以上的公式可以得到以下Pp和Ppk的结果。

根据这个控制图,得到 R-bar=12.7。运用上面的公式 可以得到 西格玛=12.7/1.128=11.259。再运用Cp和Cpk的公式得到:

Cp = 0.222, Cpk= 0.138

综上我们可以得到以下的结果:

PP = 0.216 PPk = 0.134; Cp = 0.222, Cpk = 0.138

大多数人可能都会得到这样的结果并就此打住。 但是这里关于Cp和Cpk的计算存在很明显的错误,因为Cp和Cpk的计算是有两个必要条件的③:

1.工艺是稳定的

2.所观测的数据是呈正态分布的

没有这两个必要条件所计算出来的Cp和Cpk值是不具有统计学意义的①③,或者说所得到的CP和CPK不准确。

上图很明显地看出,这个工艺是处在“非稳定或非可控”(not stable or not under control)状态,因为图中有1个点超出了控制上限(UCL)。根据Cp和CPk的定义,该组数据中有特别原因造成的点,工艺不稳定,因此不能直接用此控制图的数据来计算Cp和Cpk。 这也是为什么不要用数学公式来直接计算 并计算Cp和Cpk的原因。 为了得到稳定的工艺控制图,需要把这个点去掉,再重新制图,得到下面的控制图。

请注意这个图还是有一个点是超出控制线的(R-图中的虚线的点)(关于如何使用控制图来判断工艺是否稳定也不属于本文的讨论范围,可查看参考文献③),这个点也应该被去掉。去掉这个点,可以得到下面的控制图。

于是我们得到结果:

CP0.330

CPK 0.193

可以看出实际的Cp和CPK都有所增加。 也就是说如果工艺不稳定,计算出来的Cp和CPK值会偏低,这就会低估工艺的潜在能力。

根据定义,Pp和Ppk 的计算是不可以把这两个点去掉的。因此Pp和Ppk 是不需要重新计算的。 这样针对这个例子中的数据,我们可以得到:

PP0.216CP0.330

PPk0.134CPK 0.193

除了工艺稳定,工艺能力系数(Cp和CPK)的计算还需要数据呈正态分布。那么这组数据是否符合正态分布呢?我们可以借助统计学工具来做分析,如下图。 可以看出p>0.05,所以这组数据是成正态分布的。所以上面的计算是成立的。

值得注意的是数据是否成正态分布与工艺是否稳定没有直接的关系。 不 稳定的工艺的数据也可能是成正态分布的。

至此,该组数据(去掉两个点)通过了这两个测试: 工艺稳定和正态分布。因此上面的关于Cp和Cpk的计算是正确的。而用于Pp和Ppk计算的数据则不必进行这两个测试。

通过这个例子,可以将工艺能力系数(Cp和CPK)和工艺绩效系数(Pp和Ppk)的区别总结如下:

1.工艺能力系数(Cp和CPK)表示的是工艺在稳定(即没有任何特殊原因或漂移干扰产出品的特性或者说是在可控(under control)的)状态下能使其产出品达到可接受标准 的程度的指标,也可以理解为工艺的'潜在'能力③。(注:'潜在'是相对目前的工艺条件而言,改变工艺条件可以不断提高Cp和CPK,这就是不断改进(continuous improvement )的理念)。因此将Cp和CPK翻译成'工艺潜能系数'和'工艺潜能K系数'更为贴切。因为CP和CPk体现的是稳定状态下工艺的潜在能力,因此Cp和CPk可以用来预测该工艺将来在现有工艺条件下的最好的情况。

2.工艺绩效系数(Pp和Ppk)则是工艺在过去某个观察时段内的实际绩效,即是该工艺的已经产生的产出品实际达到可接受标准的情况。它们不考虑工艺是否稳定③,即便可能包括特殊原因(special cause)干扰产出品的特性或者说工艺不一定处在一个可控的状态(out of control),同样可以计算出PP和PPk。由于PP和PPk是体现工艺在过去的某个时段的绩效,所以PP和PPk被称为'工艺绩效系数'。也正因如此,Pp和PPk 仅代表工艺过去的情况,并不能用来预测工艺将来的状态③(将来可能更好也可能更坏,当然也可能一样)。许多作者反对使用工艺绩效系数,因为它们没有统计学意义,而且认为是统计学在SPC--统计学工艺控制中应用的倒退③。有趣的是工艺绩效系数(Pp和Ppk)是美国三大汽车公司为了对其供应商的绩效进行标准化而产生的,并且被纳入了美国ANSI标准③。

笔者认为工艺绩效系数(Pp和Ppk)的产生与其计算简单且没有太多的统计学限制有关。因为它们始终不会大于工艺能力系数(Cp和CPK),作为工艺过去的业绩指标还是可以的。 但是它们会低估工艺的实际潜在能力,可能误导工艺改进的方向。

3.许多作者都认为工艺能力系数(Cp和CPK)是短期工艺能力指标,而工艺绩效系数(Pp和Ppk)是长期工艺能力指标①②③⑥。但这个说法很容易被误解为Cp和CPK是短时间收集的数据,而PP和PPk是长时间观测收集的数据。而实际上这里的'短期''长期'与采集数据的时间长短没有任何关系①,因为短期测试结果也可能存在由特殊原因引起的离散(variability),而长期收集的数据也可能没有特别原因引起的离散。其本质的区别是计算中是否允许有被特殊原因引起离散的数据:PP和PPk是将所有被观测的样本数据都用于标准方差的计算, 而用于计算Cp和CPK的西格玛不应该包括由特殊原因引起离散的数据。

综上,我们可以将工艺能力系数(Cp和CPK)及工艺绩效系数(Pp和Ppk)的本质区别总结如下:工艺绩效系数(Pp和Ppk)是工艺的过去或现实;而工艺能力系数(Cp和CPK)是工艺的潜能或将来。工艺能力系数的计算必须满足'工艺稳定'和'数据正态分布'两个必要条件;而用于Pp和Ppk计算的数据则不必进行这两个测试。工艺能力系数及工艺绩效系数的数学关系是:CP≥PP , CPk≥PPk。当工艺稳定(stable或under control)且数据呈正态分布时CP=PP,CPk=PPk(注意这里的'='是统计学意义上的相同);只要有特殊原因存在, CP>PP , CPk>PPk。 理解这一点对它们的应用很关键。

5.CP,PP ,CPk和PPk的应用

首先了解工艺能力系数和工艺绩效系数的区别可以帮助理解在什么情况下采用哪个指标。通常要知道工艺的实际绩效情况,即工艺实际的产出品满足可接受标准的情况,应该采用工艺绩效系数。 如果想知道目前的工艺是否已经是达到了稳定的潜在状态时,可以比较工艺能力系数和工艺绩效系数的差别,即CP和PP, CPk和PPk的差别:二者差别越小,说明目前的工艺的绩效越接近稳定状态,即工艺不存在太多的特殊原因引起的偏离(variation)。 如果差异很大,则说明工艺不稳定,需要找出那些特别的原因,消除这些原因,工艺即可被改进。管理者也可以利用工艺能力系数和工艺绩效系数的差别,制订不断改进的目标。例如上面的例子PPK=0.134, CPK=0.193。目标可以是让PPK达到0.193.

了解了有K和没K的区别可以帮助公司判断工艺的产出品是否偏离可接受标准的中间值。如果PP和PPK比较,CP和CPK比较,相差不大,说明工艺的产出品的特性均值没有偏离可接受标准的中间值太多。要提高PPK或CPK的值,只能减少点间差或样品亚组内最大和最小值的差异,即降低工艺的标准方差(S或 西格玛)。如果PP和PPK比较,CP和CPK比较,相差很大,那么将工艺的产出品的特性的均值调整到可接受标准的中间值,就会很有效地提高PPK和CPK值,使工艺能更好地满足可接受标准的要求。当然这也可以通过计算样本的均值,并和可接受标准的中间值比较来完成。

在制药业中工艺能力系数和工艺绩效系数的另一个方面的应用是持续工艺确认(CPV)。当选定的关键工艺参数CPP (Critical Process Parameter)或关键质量属性CQA(Critical Quality Attribute)的数据经过计算得到工艺能力系数和工艺绩效系数时,很容易看出工艺是否“能达标”,也可以看出工艺是否稳定。如果工艺稳定,而且能达标,则可以结论目前的工艺是处在可控的状态下,即已验证的状态得以保持,再验证就是不需要的。

另外,工艺能力系数和工艺绩效系数可以被用来衡量供应商的业绩。如果可接受标准是一样的,当然系数越大的供应商越好。

值得注意的是经典的作者都没有将工艺绩效系数(PP和PPK)作为考量工艺是否能达标的指标①③,因为绩效系数的计算没有考虑工艺是否稳定,而没有稳定性就没有工艺能力可言①。

6.关于使用计算机统计软件的讨论

目前市面上有许多计算机软件可以计算工艺能力系数和工艺绩效系数。 使用这些软件时必须要理解软件背后的设置,并且要了解数据是如何采集的,以及所采集的数据和所关注的工艺的关系。只有这样才能更好地解释得到的结果。 运用同样的例子,我们可以用Minitab来计算工艺能力系数。

首先我们把30天的数据都输入Minitab,选择'Process Capability Sixpack Report',得到下图。

依图可以得到以下结论:

·数据是呈正态分布的(p>0.05)

·工艺是不稳定的(有一个点超出UCL)。尽管数据中有超出UCL的点,Minitab还是给出了计算结果:

PP= 0.22CP= 0.22

PPk= 0.13CPK = 0.14

这个结果和4.3节中第一次计算的结果完全一样(有效数字不同)。

而我们知道这个结果是不准确的,因为工艺能力系数是用不稳定工艺的数据计算出来的。准确的结果应该是4.3节中第二次计算出来的结果:

PP= 0.216CP= 0.330

PPk= 0.134CPK = 0.193

也就是说Minitab这个设计从科学的角度讲是不严谨的。

当然如果我们将除去那两个点以后的28个数据点输入Minitab做同样的计算,我们得到下图。

这时只有稳定的工艺的数据,工艺能力系数(Cp和CPK)的计算才是正确的。很不幸的是这里Minitab也重新计算了绩效系数(PP和PPK)。但原则上,这里却是不需要重新计算绩效系数(PP和PPK)的。 同样可以说Minitab这个设计从科学的角度讲是不严谨的。

值得指出的是控制图的制作和工艺能力系数的计算都是简单的数学计算,没有昂贵的计算机软件同样可以做到。 以上两个Minitab图中的计算和前面4.3节中笔者用Excel计算和做出来的图是一样的。

7.总结

工艺能力是指工艺离散度的6西格玛宽度,与其产出品的可接受标准无关。如果工艺的产出品的数据是呈正态分布的,那么99.73%的数据会落在这个6西格玛的宽度内。

常用的衡量工艺能力的指标有工艺能力系数(CP和CPK)和工艺绩效系数(PP和PPK)。没k系数(CP和PP)只显示工艺的产出品的离散程度和可接受标准的关系;而有k系数(CPK和PPK)除了显示工艺的产出品的离散程度和可接受标准的关系外,还关注工艺的产出品的均值是否偏离可接受标准的中间值,其数学关系是:CPk≤CP;PPk≤PP。

工艺能力系数(CP和CPK)和工艺绩效系数(PP和PPK)的主要区别是:

1)工艺能力系数CP和CPK)的计算需要满足两个条件--工艺稳定且数据呈正态分布,而工艺绩效系数(PP和PPK)的计算则不需要考虑这两个条件

工艺能力系数(CP和CPK)是具有统计学意义的指数,表示的是工艺的“潜能”,可以用来预测工艺的将来,而工艺绩效系数(PP和PPK)的统计学意义并不被专家们接受,并且不能被用来有效地预测工艺的未来。

8.后记

工艺能力系数是上个世纪后期才产生出来的概念。最早Cp是由Juran于1974年提出来的,而Cpk是Kane于1986年才提出来的⑦。而且用于衡量工艺能力的系数仍在不断发展中,新的指标也不断地被提出。本文仅仅探讨了4个最常用的指标。另一个较常用的指标是Cpm。由于篇幅和其应用的限制,这里不做介绍,有兴趣的读者可以阅读参考文献⑦。

工艺能力系数(CP和CPK)可以被用来估计有多少产出品会落在可接受标准的外面(即不合格品)。当Cp= CPK =1时,而且数据是呈正态分布的话,99.73%的数据都会落在可接受标准的区间内。 具体的计算需要更深的统计学知识。这里也不做介绍,有兴趣的读者可以参考文献③。

另一个重要的理念是以上关于工艺能力系数(CP和CPK)的计算是“估计”值,因为工艺的西格玛和均值都是通过样本的值来估计的。因此工艺能力系数CP和CPK的准确性是可以通过统计学计算来建立“置信空间”(confidence interval)的。 同样基于篇幅的原因,这里不做详细介绍,有兴趣的读者也可以参考文献③。

9.参考文献

①Manuel E. Peña-Rodríguez:Statistical Process Control for the FDA-Regulated Industry, ASQ2013

②Joseph M. Juran: Juran’s Quality Handbook, 5th Edition, McGraw-Hill, 1998

③Douglas C. Montgomery:Statistical Quality Control,Wiley,2012

④Roger Hoerl & Ronald D. Snee: Statistical Thinking, Duxbury, 2002

⑤Brain K. Nunnally & John McConnell: Six Sigma In The Pharmaceutical Industry, IRC Press 2007

⑥/tools-templates/capability-indices-process-capability/

⑦Samuel Kotz & Norman L. Johnson:Process Capability Indices-A Review, 1992-2000, Journal of Quality Technology, Vol. 34, No.1, 2002

你可能想看:

有话要说...

取消
扫码支持 支付码