正態分佈:從一條曼妙的曲線說起

正態分佈:從一條曼妙的曲線說起


這個世界變差(Variation)無處不在,且因變差而生美

試想:如果所有人都長得一樣,所有的花兒只有一種顏色,所有山峰高度一樣,沒有季節變換……該是何等恐怖!

然而在質量管理領域,我們常聽聽說,變差(Variation)是質量管理的大敵。

但事實上,“消除變差”只能說是質量管裡中一個理想化的、不可實現的目標,因為就像世界上沒有兩片完全相同的樹葉,變差是永遠存在並且是不可絕對消除的。


正態分佈:從一條曼妙的曲線說起


因此我們只能儘量去“減少變差”。

那麼如何減少變差呢?

通過理解概率分佈,我們對“變差”會有更深刻的認識;掌握變差之規律,我們才能利用規律,順勢而為。

什麼是概率分佈?

我們身邊每時每刻都有各種事件正在發生:骰子擲出、雨滴落下、巴士到站。

事件發生之後,特定的結果便確定了:擲出3點加4點,今日的降雨量是半英寸,巴士3分鐘到站。在事件發生之前,我們只能討論結果的可能性。

概率分佈就是描述的每種結果出現的可能性,所有的可能性加在一起形成“必然”,也就是概率分佈的概率之和恆等於1。

然而概率分佈有數百種,好在實踐中經常出現的概率分佈只有15種(且都是鄉里鄉親關係密切,如下圖),今天我們只重點介紹最重要的一種分佈:

正態分佈。


正態分佈:從一條曼妙的曲線說起


什麼是正態分佈?

正態分佈,也稱“常態分佈”,又名“高斯分佈”,英文名有Normal distribution,Gaussian distribution,Law of Errors, 是一個在數學、物理及工程等領域都非常重要的概率分佈,在統計學的許多方面有著重大的影響力。


正態分佈:從一條曼妙的曲線說起


正態分佈曲線呈兩頭低,中間高,左右對稱;因其呈優雅的鐘形,因此人們又經常稱之為鐘形曲線(Bell curve)。


正態分佈:從一條曼妙的曲線說起


若隨機變量X服從一個數學期望為μ、方差為σ^2的正態分佈,記為N(μ,σ^2)。其概率密度函數為正態分佈的期望值μ決定了其位置,其標準差σ決定了分佈的幅度。當μ = 0,σ = 1時的正態分佈是標準正態分佈。

正太分佈函數包含了最重要的兩個常數:

自然對數 e, 以及圓周率 π,曲線因此呈現出一種和諧的美感。


正態分佈:從一條曼妙的曲線說起


正態分佈之歷史

正態分佈跟許多大咖都有關係,其中就包括法裔英國數學家棣莫弗、德國數學家高斯、法國數學家拉普拉斯等等。


正態分佈:從一條曼妙的曲線說起


正態分佈最早由棣莫弗在求二項分佈的漸近公式中得到,但因當時只是一個雛形並沒有引起大家的注意也沒有被正式命名.

後來高斯在研究天文觀測的測量誤差時從另一個角度導出了它,並正式冠以 Normal Distribution .

再後來法國數學家拉普拉斯進一步發展了正態分佈,他提出的中心極限定理,使得正態分佈的應用變得極其強大從而佔據了統計學的中心位置。

正態分佈為何重要?

首先,正太分佈揭示這個世界非常多非常多變量的分佈規律,比如:

§ 人的身高

§ 汽車零件尺寸

§ 測量誤差

§ 血壓

§ 考試成績……

其次,在統計理論中,正態分佈極其重要。

如果把統計學看作一座大樓,那麼正態分佈就是大廈下最重要的基石 :

t分佈、F分佈、卡方分佈都是在正態分佈的基礎上推導出來的;此外,t分佈、二項分佈、Poisson分佈的極限為正態分佈,在一定條件下,可以按正態分佈原理來處理。

68-95-99.7 經驗法則

由正態分佈引申出來的“68-95-99.7”法則又叫又叫 3-sigma 法則,對質量人而言記住上面的函數公式可能有點難也沒有太大必要,但理解並記住這個經驗法則必大大受益。


正態分佈:從一條曼妙的曲線說起


法則告訴我們,對於正態分佈,如上圖所示,幾乎所有數據都將落在均值的三倍標準差內:

§ 68%的數據將分佈在均值的(正負)一個標準偏差之內

§ 95%的數據將分佈在均值的(正負)兩個標準偏差之內

§ 99.7%的數據將分佈在均值的(正負)三個標準偏差之內

不得不說的中心極限定理

說到正態分佈就不得不說中心極限定理,如前文已經提到 “國數學家拉普拉斯進一步發展了正態分佈,他提出的中心極限定理,使得正態分佈的應用變得極其強大從而佔據了統計學的中心位置”。

心極限定理是概率論中最著名的結果之一,它指出:不管總體是什麼分佈,任意一個總體的樣本平均值都會圍繞在總體的整體平均值周圍,並且呈正態分佈。


正態分佈:從一條曼妙的曲線說起


中心極限定理不僅提供了計算獨立隨機變量之和的近似概率的簡單方法,而且有助於解釋為什麼有很多自然群體的經驗頻率呈現出鐘形(即正態)曲線這一事實,因此中心極限定理這個結論使正態分佈在數理統計中具有很重要的地位,也使正態分佈有了廣泛的應用。

正態分佈與SPC控制圖

SPC的一個前提是數據要穩定受控,即服從正太分佈,否則SPC就不能發揮其預測功能。


正態分佈:從一條曼妙的曲線說起


前面介紹的 64-95-97.3 經驗法則可以解釋SPC中的各種判異原則,比如最常見最基本的就是,如果某個值落在了三個標準差之外,那麼這個值就極可能是特殊原因導致的異常(導致非正態):

正常情況下一個值落在三個西格瑪以外的概率只有0.3%(小概率事件),但是卻100%發生了,因此我們推斷這是異常導致。

正態曲線蘊含的人生哲學

對於那條美麗的鐘形曲線可能大多習以為常,你可曾瞥到其蘊藏著的人生智慧?

對於這一點,就留個白,大家自己悟吧。


分享到:


相關文章: