數據,你最為堅信的可能都是謊言


數據,你最為堅信的可能都是謊言


3月2日,大家都應該已經進入了正式復工的生活節奏當中。

回想疫情從爆發到蔓延的這兩個多月的時間,我們大概從未有過跟一樣事物如此頻繁的接觸與渴求,那就是數據。

每個人,其實對於周遭世界的感知都是非常朦朧和模糊的,因為我們日常的行動半徑以及親身接觸的信息都太少了,20公里與150人的社交圈只夠我們在腦海中構建自己的生活大概是什麼模樣。

那麼世界在發生什麼呢?於是媒體完全充當起我們外延的眼睛與耳朵,去展現更大範圍的圖景,而數據則成為最好衡量對比的標尺,就像三維建模中各種座標數據,才逐漸豐滿起世界在我們心中的模樣。


中國有960萬平方公里 VS 日本37.8萬平方公里

2019年天貓雙十一單日成交額2684億 VS 2019年上半年王府 井營收134.22億

某一線明星微博粉絲數 VS 某一線企業家微博粉絲數

某一線端遊年營收 VS 某一線手遊年營收

你的月收入 VS 你好閨蜜的月收入

......


你不必真的親身瞭解這個世界,也可以拿著數字的標尺給這個世界打上大大小小的橫縱座標,再接著塗抹色彩去構建你認為世界的模樣,以及它們跟你有什麼關係。

但,關鍵問題是,在這個後真相時代裡,如果你所知道的數據都是騙局的話,都無法還原這個世界本來面貌的話,你對這個世界的理解就可能出現偏差甚至剛好相反,你的行為就極有可能被錯誤的數字所操控。換句話說,你就有可能成為“數據捏造者”有心引導的“傀儡”——數據傀儡。

所以,每個人都有必要了解一些統計學的缺陷以及數據本身的悖論,而不是任由本能把持、觀念作祟,我們都應該有一雙洞察真相的眼睛。


01、倖存者偏差


1940年,第二次世界大戰,英德兩國的空戰讓雙方都損失慘重。英方研究專家決心提高飛機的裝甲厚度來增加飛機的防禦力,但由於重量所限,不能全機覆蓋,只能按照被攻擊的幾率大小來決定。於是,英方專家研究了從空戰歸來的戰鬥機狀況,發現飛機上被攻擊的彈孔大多集中在機身中央以及極機翼部分,於是給出了加厚這兩處的裝甲的提議


請問,這樣的提議有問題嗎?

當然有問題,它被美國軍隊統計研究部直接否決了!

那麼問題出在哪裡?問題就在於被研究的飛機全部是戰場上的倖存者,它們身上雖然彈孔密佈,但正是沒有被擊中要害才得以返回,也就是說加強這些部位的裝甲是沒用的!

正確的研究應該以沒有著彈的部位來進行,正是因為這些地方沒有被擊中,飛機才得以倖存!


數據,你最為堅信的可能都是謊言


遺憾的是,這種選擇了倖存者而導致的數據統計樣本偏差,是目前統計數據“統計偏倚”的普遍問題,它忽略了統計樣本的全面性與隨機性,拋棄掉了那些沒能被收錄進選擇樣本的隱藏樣本。

更為嚴重的是,這個本可以通過樣本篩選來儘量減輕誤差的現象,也正在被很多數據統計主體,有意圖地利用著。


比如,有一個網課機構的廣告上顯示,網課的好評率為97%。當你看到這個數據時,很自然會聯想到這門網課的質量應該不錯,絕大多數人都給予了好的評價。

然而現實是,這個97%的數據是來源於給予網課反饋的人來計算的,網課不同於網購商品,有退換貨的售後需求,願意在學完以後再次打開頁面撰寫反饋的人,絕大多數都是認可網課的受眾,而學完網課覺得沒有幫助的人群是大概率不會費這個周折的。

也就是說,這個97%僅僅可以看作是“

願意給這門課反饋用戶的好評比例”,而“並非所有網課學員的好評比例

如果將所有學員樣本都統計進去再進行計算,那個比例值得不值得拿來宣傳,就是另一回事了。


此外,倖存者偏差還會影響到企業和個人無意識的信息收集出現錯誤。

比如最經典的辯論題“是順境出人才還是逆境出人才?”

絕大部分人的第一反應應該是“逆境出人才”,畢竟見過了太多寒門學子一朝成名的新聞,從小也被教育吃得苦中苦方為人上人之類的話,而事實卻正好相反——的確順境更容易出人才,足夠的財富、環境、人脈支持更容易造就高等級的人才,想想收入財富的“馬太效應”也可以明白,肯定是優越的人更優越。那為什麼人會產生“逆境出人才”的錯覺呢?

1、順境出人才的事情理所當然,它成不了大眾媒體的新聞素材,它成為了隱藏樣本。

2、逆境出人才太難得了,它必須被當作典範。

每一個順境的人才都是飛機上沒有被子彈擊中的部分,它才是真理所在。

所以,數據雖然真切如斯,但你在你全盤接受之前,是不是值得問一句:這個數據背後的樣本是什麼呢?


02、數據立場


數據,的確中立且精準,用數據組合成的公式被各種學科框定成解釋世界的真理。

所以我們對數據,有天然且魔幻的信任感。

但殊不知數據雖然中立,但公佈數據的人或者機構是有立場的,這種立場被有心人拿來迎合我們的心理慣性,讓我們對同一樣事物產生截然不同的相反認知,甚至動搖我們的價值觀。

(以下是我多年廣告及品牌策劃的經驗所得,它們有些已經成為了營銷技巧的潛規則)


大數拆分


數據,你最為堅信的可能都是謊言

一架名牌鋼琴的售價為12萬人民幣,這對於大多數家庭來說都不算個小數目。一下子需要付出一年甚至更多收入才能買到的東西,人往往是謹慎且剋制的,不僅需要多家對比,還對細節苛求到無以復加,這當然是商家所不樂見的,所以商家給出了這樣的廣告語:

“每天一杯咖啡的花費,為你孩子的整個適齡做最有價值的藝術投資。”

是不是看到那個昂貴价格的心理壓力瞬間就沒有了?誰每天還不花上一杯咖啡的錢?而且這是什麼,這是對孩子最有價值最值得的投資!還有比這個更不用考慮現在就應該行動的消費?

然而這個數據是假的嗎?也不是,商家是用12萬平均到從5歲到15歲這學習鋼琴的十年中來計算的,你找不出它的邏輯漏洞。商家就是讀懂了人心的損失厭惡,既然你心疼花掉這麼一大筆錢,那就只給你看小錢就好啦!

從房產到汽車,從奢侈品到珠寶,但凡是高定價商品,你一定會看到這樣的數據策略,這時候中立的數據站在了商家這邊。

這個方法還有反例,也可以將實際很小的數據變得巨大,從而引起你的恐懼和重視。


細節真理

數據,你最為堅信的可能都是謊言

有這麼兩句廣告語,看看你會更相信哪一個?

1、有80%的用戶都成為了我們的回頭客

2、有79.32%的用戶都成為了我們的回頭客

絕大多數人都會選第二個!你選對了嗎?

人總是相信,具體的數據比規整的數據更真實可信,那些細緻到小數點後面好幾位的才像是真正統計出來的,而完全是整數的數據?哪有這麼巧的事情,一定是假的!但是真實情況是,以上這個兩個都不是真的。同樣是數字,卻有了不同的立場!


目標趨近

數據,你最為堅信的可能都是謊言

最近隨著拼多多APP的流行,社交裂變式的紅包被開發到了極致。

中間有一種紅包是這樣的:它會以一個超大的數額引起你的注意,比如“你有90元的紅包尚未領取”,見慣了幾塊錢紅包優惠券的大家當然毫不猶豫點了進去,發現居然真的是90多元,那還不趕緊提現?接著系統跳出來提醒你,需要100元才能提,就差10元了,讓你的朋友幫你點一下,百元紅包唾手可得啊!

一旦開始分享,你就跳進了系統的分享裂變陷阱,別看只有10元的差距,基本上你需要邀請三十位以上的朋友幫你點你才有可能得到提現機會。

先不算2020年的今天一個真實客源的引流成本高到百元這個機制有多划算,換一個思路來看,如果當初你收到的是一個沒有額度的分享機會,你拉來三十個好友也能收到100元回報,你有多大的動力會把這個事情做下去?

是的,90就是推向你去100的充沛動力,就像是賽跑時橫亙在眼前的終點線,你儘管已經精疲力竭,還是會咬咬牙衝刺抵達。


以前,總覺得白紙黑字是真理

後來覺得眼見為實是真理

再後來我也篤信數字

現在我才漸漸明白,我該堅信的不是某樣方式、某樣工具,而是洞悉事物的視野與思考。

大腦是懶惰的壞孩子,它喜好悠閒,討厭思索。

於是,我們有了標籤,去忽略人與事物的多樣性,簡單定型一種價值;我們也有了KOL,只要跟著走就不會在紛雜中迷失方向;我們還有數據,我們擁抱數據彷彿擁抱真理。

獨立思考,請至少學會這個。

它能幫你,更能救你!


參考書目:

得到APP 萬維剛《精英日課4》

萊爾·哈夫《統計數據會說謊》

赫克託·麥克唐納《後真相時代》

加里·史密斯《簡單統計學》


分享到:


相關文章: