統計的藝術:給你30萬,調查15個國家的國民誠信水平,怎麼做

統計是一門古老的學科,以前很多統計方法受限於計算水平而無法驗證或者實現不了,近些年由於計算機的飛速發展,很多以前不能實現的統計算法得以實現,統計煥發了新的聲明,在機器學習、人工智能中得到廣泛運用。

那麼,統計是什麼呢?


統計的藝術:給你30萬,調查15個國家的國民誠信水平,怎麼做

統計的一種定義是:它是收集數據和分析數據的一門科學和藝術。統計是一門科學這很容易理解,為什麼說統計是藝術呢?統計還真是一門藝術,在美歐的很多大學裡,統計都在藝術系裡,現在說說為什麼統計是一門藝術,我們從收集數據的角度來分析一下。要先收集準確的數據,其實需要很好的實驗設計,統計系的學生有一門專業課就是實驗設計。下面來看看這個例子,給你30萬,如何調查15個目標國的國民誠信水平。


統計的藝術:給你30萬,調查15個國家的國民誠信水平,怎麼做

這是國外真實發生的例子,這裡的調查者給出了非常漂亮的實驗設計,直接問是不可能得到準確的調查結果,說謊者不介意再說一次謊,那怎麼做呢?調查人員首先做了這樣一個實驗,15個目標國每個國家隨機選1000個人進行調查,要求被實驗者在家扔一次硬幣,如果正面朝上則可以獲得10美元,如果反面朝上什麼也沒有,沒有任何監督,被調查者只需要將實驗結果告訴調查人員就可以。實驗人員只需要通過最後的結果就可以獲得這個國家的誠信水平,因為我們知道,正常的話,1000個人當中正面朝上和反面朝上的人差不多都是500左右,如果某個國家正面朝上的人特別多,比如800人,那說明其中有不少人為了獲得10美元說謊了,反之,如果一個國家正面朝上的人在500左右,則說明這個國家的國民誠信水平很高!

統計的藝術:給你30萬,調查15個國家的國民誠信水平,怎麼做

這個實驗是不是很漂亮!為了實驗的可靠性,實驗人員又設計了一個實驗,讓被調查人員回答5個問題,如果回答正確的問題大於等於4個就可以獲得10美元,要求被調查者獨立完成,不能查資料,不能上網查,不能問其他人。5個問題中有三個問題非常簡單,一般人都可以回答出來,比如如果你是中國人,問題可以這樣,中國的首都是?中國哪個民族人口最多?中國的國歌是?剩餘的兩個問題則非常難,難到一般人如果不查資料根本無法回答,比如世界第33高峰是?


統計的藝術:給你30萬,調查15個國家的國民誠信水平,怎麼做

通過最後獲得獎勵的人數同樣可以得到這個國家的國民誠信水平,這兩個實驗都非常漂亮,完美的體現了統計的藝術性,這說明即使在今天有海量數據的情況下,實驗設計也是非常重要的,離不開統計的藝術。如果沒有好好進行實驗設計,只憑想當然,則很可能會受到懲罰。感興趣的讀者可以搜搜羅斯福第二次連任時當時發生的事情:讀者文摘收集了240萬份調查問卷卻作出了失敗的預測,當時的年輕人蓋洛普只調查了5000人卻作出了正確的預測,原因就在於一個沒有實驗設計或者說錯誤的實驗設計,而另一個有很好的實驗設計!

統計是一門藝術,首先從收集數據開始!


分享到:


相關文章: