为什么在计量型特征值的控制图中,通常建议子组容量n等于5?

为什么在计量型特征值的控制图中,通常建议子组容量n等于5?

问:为什么在计量型特征值的控制图中,通常建议子组容量n等于5?

答:经过精心策划的取样方案是成功运用控制图控制过程的关健因素。子组样本容量n等于5是多方面综合考虑的结果,它也不是强制的,建议大家考虑子组容量时,能结合控制图的功效曲线来看。

1、 为什么进行统计过程控制时,通常建议子组容量n等于5?

为什么在计量型特征值的控制图中,通常建议子组容量n等于5?

精心策划取样方案,是成功运用控制图的关健。通常在取样时要求按照“合理子组”的原则来取样,那么什么是合理子组呢?

合理子组是指在取样时,尽可能确保:

子组内的变差几乎全是由普通原因导致;

子组内的变差能准确代表普通原因的影响;

对有可能发生的特殊原因,应尽可能限制在组与组之间的时间间隔里,满足这样的取样,称为"合理的子组"。

在这篇短文里,我们只谈论为什么通常在很多理论参考书上要求样本容量n等于5?

对于样本容量的选择,通常我们希望

样本容量越大越好,因为:

样本容量越大,通过样本估计总体会估计得越准确;

样本容量越大,尽管单值可能不符合正态分布,基于中心极限定律,均值会趋近为正态分布,则可以用均值的正态分布模型构建控制限。

样本容量越小越好,因为:

样本容量越小,子组内不会包含特殊原因;

样本容量越小,现场执行spc的成本越低。

样本容量需要一个综合的考虑,使用控制图的目的是探测过程的变化,样本容量对于探测过程的变化应该是“适宜的”。

在初始能力研究时,假设ppk等于1.67,则过程的中心距离规格限有5个标准差,此时如果过程的中心发生偏移,如下图所示,过程中心偏移了2个标准偏差(此时单个值会有0.135%的点超过规格界限),如若用样本容量为1的控制图控制过程,则此时绝大部份数据还处于控制界限内,样本容量越大,基于中心极限定律,均值的控制界限会比单值控制界限窄,基于超控制界限的判异原则,均值控制图越有可能探测出过程的变化。

当过程中心偏移了2倍标准偏差,则用n=5的均值控制图时,能有90%以上的概率探测出该偏移。

为什么在计量型特征值的控制图中,通常建议子组容量n等于5?

如果我们用横坐标表示过程中心的偏移量,纵坐标表示控制图能探测出过程发生改变的概率(即检出力,在这里,我们仅考虑统计量超过控制界限的情况),则可以制作控制图的操作特性曲线,如下图所示

为什么在计量型特征值的控制图中,通常建议子组容量n等于5?

控制图的作用是用来监控过程是否发生改变,对于不同类型的控制图而言(这里主要指休哈特控制图和扩展休哈特控制图),最大的不同在于其功效曲线。同时,功效曲线协助我们基于工程上需要探测的偏移量和检出力来考虑子组的样本容量。

2、总结

为什么在计量型特征值的控制图中,通常建议子组容量n等于5?

在这篇短文中,我们介绍了为什么通常在计量型的控制图取样时,样本容量通常建议等于5。对于现场运用控制图的人员,为保证控制的及时性和经济性,通常较短时间测量样本容量为3, 5,7; 对于目前运用控制图的情形,样本量n等于5综合考虑以下因素:均值符合正态分布,用样本代表总体(通常n<4的样本,统计上无效),合理子组,经济性等方面,更重要的是样本容量的选择对于探测过程的偏移应该是合适的。

从控制图的历史来看,特别是在现场运用控制图时,希望能减少现场操作者复杂的计算过程,在手工计算时,奇数个数据计算统计量(中位数)时更简单。但中位数对异常值反应不灵敏,如若计算平均值,5个数据计算平均值有其优势,即将5个数值相加后乖以2,然后将小数点往左移一位,即可以得到五个数值的平均值。这也是控制图子组的样本容量n等于5的原因之一。

当然,在大数据时代,随着测量成本的下降和计算机自动处理能力的提高,基于需要探测的偏移量和检出力,我们可以更合理的去定义子组容量。


分享到:


相關文章: