為什麼在計量型特徵值的控制圖中,通常建議子組容量n等於5?

為什麼在計量型特徵值的控制圖中,通常建議子組容量n等於5?

問:為什麼在計量型特徵值的控制圖中,通常建議子組容量n等於5?

答:經過精心策劃的取樣方案是成功運用控制圖控制過程的關健因素。子組樣本容量n等於5是多方面綜合考慮的結果,它也不是強制的,建議大家考慮子組容量時,能結合控制圖的功效曲線來看。

1、 為什麼進行統計過程控制時,通常建議子組容量n等於5?

為什麼在計量型特徵值的控制圖中,通常建議子組容量n等於5?

精心策劃取樣方案,是成功運用控制圖的關健。通常在取樣時要求按照“合理子組”的原則來取樣,那麼什麼是合理子組呢?

合理子組是指在取樣時,儘可能確保:

子組內的變差幾乎全是由普通原因導致;

子組內的變差能準確代表普通原因的影響;

對有可能發生的特殊原因,應儘可能限制在組與組之間的時間間隔裡,滿足這樣的取樣,稱為"合理的子組"。

在這篇短文裡,我們只談論為什麼通常在很多理論參考書上要求樣本容量n等於5?

對於樣本容量的選擇,通常我們希望

樣本容量越大越好,因為:

樣本容量越大,通過樣本估計總體會估計得越準確;

樣本容量越大,儘管單值可能不符合正態分佈,基於中心極限定律,均值會趨近為正態分佈,則可以用均值的正態分佈模型構建控制限。

樣本容量越小越好,因為:

樣本容量越小,子組內不會包含特殊原因;

樣本容量越小,現場執行spc的成本越低。

樣本容量需要一個綜合的考慮,使用控制圖的目的是探測過程的變化,樣本容量對於探測過程的變化應該是“適宜的”。

在初始能力研究時,假設ppk等於1.67,則過程的中心距離規格限有5個標準差,此時如果過程的中心發生偏移,如下圖所示,過程中心偏移了2個標準偏差(此時單個值會有0.135%的點超過規格界限),如若用樣本容量為1的控制圖控制過程,則此時絕大部份數據還處於控制界限內,樣本容量越大,基於中心極限定律,均值的控制界限會比單值控制界限窄,基於超控制界限的判異原則,均值控制圖越有可能探測出過程的變化。

當過程中心偏移了2倍標準偏差,則用n=5的均值控制圖時,能有90%以上的概率探測出該偏移。

為什麼在計量型特徵值的控制圖中,通常建議子組容量n等於5?

如果我們用橫座標表示過程中心的偏移量,縱座標表示控制圖能探測出過程發生改變的概率(即檢出力,在這裡,我們僅考慮統計量超過控制界限的情況),則可以製作控制圖的操作特性曲線,如下圖所示

為什麼在計量型特徵值的控制圖中,通常建議子組容量n等於5?

控制圖的作用是用來監控過程是否發生改變,對於不同類型的控制圖而言(這裡主要指休哈特控制圖和擴展休哈特控制圖),最大的不同在於其功效曲線。同時,功效曲線協助我們基於工程上需要探測的偏移量和檢出力來考慮子組的樣本容量。

2、總結

為什麼在計量型特徵值的控制圖中,通常建議子組容量n等於5?

在這篇短文中,我們介紹了為什麼通常在計量型的控制圖取樣時,樣本容量通常建議等於5。對於現場運用控制圖的人員,為保證控制的及時性和經濟性,通常較短時間測量樣本容量為3, 5,7; 對於目前運用控制圖的情形,樣本量n等於5綜合考慮以下因素:均值符合正態分佈,用樣本代表總體(通常n<4的樣本,統計上無效),合理子組,經濟性等方面,更重要的是樣本容量的選擇對於探測過程的偏移應該是合適的。

從控制圖的歷史來看,特別是在現場運用控制圖時,希望能減少現場操作者複雜的計算過程,在手工計算時,奇數個數據計算統計量(中位數)時更簡單。但中位數對異常值反應不靈敏,如若計算平均值,5個數據計算平均值有其優勢,即將5個數值相加後乖以2,然後將小數點往左移一位,即可以得到五個數值的平均值。這也是控制圖子組的樣本容量n等於5的原因之一。

當然,在大數據時代,隨著測量成本的下降和計算機自動處理能力的提高,基於需要探測的偏移量和檢出力,我們可以更合理的去定義子組容量。


分享到:


相關文章: