统计过程能力:Cpk与Ppk
统计过程能力:Cpk与Ppk

回想我曾经在Minitab做技术支持的时候,客户经常问我“Cpk和Ppk的区别是什么?“这是一个很好的问题,尤其是许
多从业者默认采用Cpk而忽视了Ppk。就像80年代流行音乐组合威猛!Cpk就像是乔治·迈克尔,而Ppk是其他成员。
合理分组
合理分组是在同一条件下产生的一组测量结果。子组的意思是代表你的过程的快照。因此,组成一个子组的测量应
该从一个近似的时间点采取。例如,如果你每小时抽取5个样本,你的子组的大小将是5。
公式、定义等
能力分析的目的是确保过程能力满足顾客的要求,我们利用统计能力指标如Cpk和Ppk进行评估。如果我们看正态
(分布)的过程能力Cpk和Ppk的计算公式,我们可以发现他们几乎是一样的:

唯一的区别在于上下统计的分母:Cpk的计算使用的是组内标准偏差,而Ppk使用总体标准偏差。你不必为标准偏差
公式的细节而烦恼,组内标准偏差是子组标准偏差的平均值,而整体标准偏差代表所有数据的变化。这意味着:
Cpk:
只描述组内的变化
不考虑子组间的偏移和漂移
有时被称为潜在的能力,因为它代表着你的过程在规格内生产零件的潜力,假设子组之间没有变化(即随时间推移)
Ppk:
描述所有测量的整体变化
理论上讲包括组内的变化以及组间的偏移和漂移
无需按子组取样
CPK和Ppk之间差异的例子
为了说明,让我们考虑一个数据集,每天测量5个,一共测了10天。
- 近似的Cpk和Ppk

正如左边的图所示,与组内的变化相比,在子组之间没有很大的偏移和漂移。因此,组内与总体标准偏差是近似
的,这意味着CPK和Ppk也近似,(分别为1.13和1.07,)。
- 有区别的Cpk和Ppk

在这个例子中,我使用了相同的数据和子组大小,但我改变了周围的数据,将其移动到不同的子组。(当然,在实
践中我们永远不想把数据移动到不同的子组,我仅仅是拿它来说明一下问题)。
由于我们使用相同的数据,总体标准差和Ppk没有改变。但这是相似的结束。
看看Cpk统计,这里是3.69,比我们以前得到的1.13的好得多。看着这组图,你能说出为什么Cpk增高吗?该图显
示,在每个子组内的点是比以前更密切。早先我提到,我们可以认为组内标准偏差是子组标准偏差的平均值。因
此,在每个子组内的变异相当于一个较小的标准偏差,这给了我们一个更高的Cpk。
- Ppk或不存在
这里就是危险在于只报告Cpk而忘记Ppk,就像乔治·迈克尔鲜为人知的队友(他可能是没有冒犯谁)。从上面的例
子我们可以看到,Cpk只告诉我们故事的一部分,所以下次你检查过程能力,同时考虑你的Cpk和Ppk。如果这个过
程是稳定的,随着时间的推移变化不大,这两个统计量应该总是一样的。