來來來, 和統計交朋友 : 開題篇 | Basic Statistics

來來來, 和統計交朋友 : 開題篇 | Basic Statistics

“統計很關鍵,不懂點統計你還真不好意思說懂點六西格瑪。”

“統計很討厭,各種數學公式,各種概念理論讓人心煩意亂!“

從今天開始的未來幾篇推文,給大家分享一些統計基礎知識,畢竟”六西格瑪“ 是本號的一大主題,如有謬誤之處望多指正包涵。

一、你逃不脫的統計

OK,先從一位老專家同事的”等級論“說起,他說他在汽車行業工作有近30年了,遇到過無數工程師, 如要從專業性角度進行概括,可以分為三個層次:

“三流的工程師只做公差對比”

“二流的工程師能做過程能力”

“一流的工程師能做假設檢驗”

這麼劃分是否科學先姑且不論,先來看看如何理解。

打個比方說明:

假設你有個關鍵產品的某個關鍵尺寸超差,於是你進行了尺寸改進,那麼如何證明結果OK了呢?對應上述三個層次:

1)測量一組產品數據,計算出均值,然後和公差做對比,確認結果在公差範圍之內,於是你覺得OK了;

2)測量一組產品數據,除了對比公差,你還計算了過程能力PPK,發現PPK>1.67, 於是你覺得結果令人滿意;

3)收集改善前後的各一組數據,用箱型圖Box-plot分析對比,同時通過假設檢驗,以證明你對此改進的信心度。

那麼你可能會怎麼做呢?

其實不管你選擇哪一種方式,都是在對統計知識加以運用,只是應用的程度不同罷了。

所以作為質量或工程人員,學習統計的基礎知識是必要的,因為你根本躲不了。

二、理解”統計“

那麼統計是什麼呢?

我們來看看比較官方的解釋:

“統計學是研究如何蒐集、整理、 分析反映事物總體信息的數字資料,並以此為依據,對總體特徵進行推斷的原理和方法。”

--


在質量管理中常用的統計工具有兩類,一是描述性統計,一是推論統計。

上面的定義其實把這兩類統計都說到了:描述性統計就是對已有數據從不同角度進行“描述”,以便更好地認識它;推論統計就是基於現有數據去做“推斷”,通過局部以求認識整體。

這聽起來可能有些抽象,我們來看一個三歲小朋友“應用“統計知識的例子:

媽媽給哥哥吃了3口冰淇凌,給弟弟吃了1口,這時候弟弟不樂意了,他覺得媽媽愛自己比愛哥哥少--因為哥哥獲得的冰淇凌要多(描述性統計),所以媽媽愛哥哥更多(推論統計)。

來來來, 和統計交朋友 : 開題篇 | Basic Statistics

顯然,這不是一個”成功“運用統計分析的案例,因為弟弟做出了不正確的推論--媽媽給他吃更少的冰淇凌其實是因為擔心吃多了肚子會不舒服,而不是不愛他。

三、小心陷阱!

所以這就引到另外一個話題,統計的危險性!

查閱一些資料後發現,看似枯燥的統計其實有很多話題,比如馬克吐溫就說過這樣的話:

”世界上有三種謊言:謊言,該死的謊言,統計。“

來來來, 和統計交朋友 : 開題篇 | Basic Statistics

還有這樣的幽默:

“三個人在沙漠裡迷了路,一個地理學家,一個長跑運動員,一個統計學家,請問哪個生存下來的幾率大?

答案是統計學家,因為統計水分多!”

統計之所以被這樣批評和調侃,是因為統計這個東西,用得不好確實會誤導觀眾,甚至有很大的欺騙性。

但這並不是統計本身是否科學的問題,而是統計是否被科學使用的問題。

這大概回答了為什麼很多公司推行六西格瑪效果不佳,不是六西格瑪方法本身的問題,而是公司的”基礎設施“的問題。實施六西格瑪是有成熟度要求的,沒有達到一定的標準就貿然推行是不行的。

來來來, 和統計交朋友 : 開題篇 | Basic Statistics

統計的危險性還在於在需要基於數據做出重大戰略決策時,如果統計結果結論謬誤,後果將不堪設想;錯誤的數字帶來的決策風險比扔硬幣還要高。

因此,我想學習統計的意義還在於,它能幫我們識破並避開一些大坑。

五、小結

Statistics=Make Sense of Data !

統計的意義在於對數據進行提煉 refine,創造價值。

原始數據就像從地理開採出來的原油,剛開始並沒有什麼直接用途,但通過恰當的工藝進行加工提煉,原油就可以變成很有用的燃料、潤滑劑,甚至變成食品、藥品等。

是的,統計暗藏著危險,也蘊藏著美好。

正是如此,讓我們學習統計,和統計交朋友吧。


分享到:


相關文章: