得數據者得天下:這三個故事,揭示“數”的威力

講述者:塗子沛,整理:復旦大學DMG實驗室


得數據者得天下:這三個故事,揭示“數”的威力


“不用多久……當上總經理、出任CEO、迎娶白富美、走上人生巔峰,想想還有點小激動哪!”

曾幾何時,這只是《萬萬沒想到》中一句魔幻現實主義流行語。

可是,在未來的大數據時代,獲取財富,尋找愛情,改善社會治理都將被大數據重新賦能

目標“黃金屋”、“顏如玉”、“烏托邦”又或者是“走上人生巔峰”?

你可以心裡沒譜,但必須做到心中有數。


“數”中自有黃金屋

第一個故事,是關於錢的故事。

1860年代,中國的圓明園剛剛被燒,美國南北戰爭爆發。歐洲賈格爾,是一名機械工程師。1860年代全球紡織革命,棉花被稱為白金,由美國運到歐洲,被加工成紡織品。他把自己畢生的積蓄都投入棉花產業,開工廠、買機器,後來美國南北戰爭爆發,棉花禁運,賈格爾的工廠因為沒有原材料停辦最終破產揹負債務。

後來他去賭場碰運氣,創造了賭博界的傳奇。

賭場裡有很多輪盤,他相信一個輪盤轉久了就會失衡,轉久了有些數字被轉到的幾率就會變高。他僱了6個人分別記錄賭場六個輪盤每次停留的數字,當天晚上對數據進行分析。終於,他發現某個輪盤和他預料一致,有三個數字出現的概率是明顯高於1/37。於是賈格爾出手,一個上午賭場的錢就被贏完了,第二天賭場的錢很快又被贏完了。賭場覺得蹊蹺,發現輪盤有問題,就連夜把六個大輪盤移位。

而賈格爾很聰明,提前在有問題的輪盤上做了記號,第三個上午賭場的現金又被贏完了。

他成為歷史上不出千贏賭場錢的人,用科學的方法使賭場破產。

如果六個人把收集的數據給其他的工程師,其他工程師也可以分析數據,但只有他演繹了這樣的傳奇,因為他相信數據;同時,也有人相信數據,但只是在一旁看是沒有辦法看出來的,必須把數據記錄下來。

數據第一件事是記錄,文字也是數據,圖片、視頻也是數據。數據不是一切,但一切都在變成數據。

新時代基本矛盾是,人類產生的數據已經超出了人腦甚至機器可以處理的界限,很多數據擱置在政府、企業,長期沒有得到分析。善數者為什麼能成?記錄的作用,數據分析的作用以及對數據的信仰是第一個我想要告訴大家的故事。為什麼會收集數據,是對數據有信仰,相信數據能幫他解決問題,洞察事務的真相。

“數”中自有顏如玉

第二個故事,是關於愛的故事。

杭州寶石山有很多老頭老太太聚集在相親角,北京也有,廣州天河公園也有,越是處在一線的城市,剩男剩女就越多,找個對象很難。為什麼?信息成本太高了。每個人都有朋友圈,未來的對象就在朋友圈圈層能觸達的地方,每個人的圈子是非常有限的。

找對象首先是個大數據的問題。當信息不對,就會付出信息成本,時間成本、金錢成本甚至生命成本。

2012年,一個美國加州大學的博士,麥金利,35歲。他在哈佛學生創立了一款用來找對象的社交軟件平臺。新用戶在這個平臺要回答三百到五百個問題,如你喜歡政治問題嗎?你現在想結婚嗎?在回答完之後開始匹配,通過這些問題,人和人之間開始匹配。如果認為某些問題重要,可以調整問題的權重。他發現了一個問題,跟他匹配的人特別少,回應他的人更少。

他意識到,這是因為他不知道他喜歡的女孩子回答了哪些問題。他要用數據分析,哪些女孩回答了哪些問題,如何回答,才能增加匹配的可能性。

他做了個爬蟲,爬了兩萬個女性的回答,用算法把他們分為七類,挑出兩類他喜歡的,她們怎麼回答相關問題。他針對兩類女性分別註冊了兩個賬戶,不同的回答,不同的照片,不同的自我介紹。結果這次,平臺跟他匹配了上萬名女性。他每天都要見兩到三個女性,用數據化方法管理約會,每次約會後進行記錄哪些可以約第二次,第三次。真愛出現在第88次,中國女孩王婷。這個博士畢業後和女孩結婚。

有人說,我什麼都不會,還能成功嗎?我有個讀藝術的朋友叫麥曉佳,他告訴我了一件事。

他說,沛公,告訴你一件事。上週我女朋友告訴我,她媽媽要來廣州見我。我收集了她們家能蒐集到的全部的信息進行大數據分析,得出她媽媽一定很愛錢,覺得絕望沮喪。但他突然想到,他媽媽當了梨花社的社長,他的大數據漏了這一點。於是通過女朋友瞭解到她媽媽是業餘的票友。他通過再次大數據分析發現喜歡唱戲的人都喜歡上臺、聽掌聲……總結來說,喜歡聽奉承。於是他當天裝作不經意提到了她媽媽的偶像。媽媽當時態度就變了,飯沒吃完已經獲得媽媽的喜愛,把他當成一家人。大數據改變了他的生活。

每個人獲得信息和數據的能力是不一樣的,所有的信息都在互聯網上,有些人找得到,有些人找不到。這是我們這個社會基本的生存技巧。智商是對信息進行處理,而數商是在處理之前必須要找到信息,找不到信息就無法處理,巧婦難為無米之炊。麥金利本科是學中文的,也學會了寫腳本。這是這個時代大家都應該具備的基本技能,寫腳本、數據分析,必須具備統計學、機器學習、人工智能的基本常識。

“數”中自有烏托邦

第三個故事,是關於大數據如何改變社會的。

故事主角克里斯汀是女記者,在佛羅里達州一小報當記者。一次偶然間看到一則新聞警察開快車將人撞死,她發現印象中不止一次看到這種新聞,於是她去查數據,發現近十年有幾十則警察將人撞死撞傷的新聞,但只有一人被判刑。於是她推測警察習慣開快車。

為了證明這個猜測,需要數據作為證據。她最開始抱著測速器在高速公路上等,這很難獲得數據。後來她想了個辦法,她收集了佛羅里達州所有收費站幾千輛警車通過的數據。然後她選取兩個收費站,用距離除以時間之差,得出警車的平均速度,發現本州五分之一的警車都存在超速行駛。

數據還表明,很多超速都發生在下班時間,是急著回家而非處理公務。她把這一發現刊登在報紙上,受到社會廣泛關注。2014年,她做了同樣的事情,把全州警車過消費站的數據再次收集分析,發現開快車的現象下降了80%,一名警察被開除,數百名警察被處分、沒收警車。說明她做的這件事是有意義的。

得數據者得天下:這三個故事,揭示“數”的威力

《善數者成:大數據改變中國》,作者:塗子沛,鄭磊

在今天這個時代,要想獲得更好的成長,你不僅需要智商、情商,你還需要提高你的數商。智商是對信息進行處理,而數商是在處理之前找到信息。賈格爾,用科學的方法擊敗賭場,三天共賺1200萬英鎊。他對數據有極強的信仰,相信數據,收集數據,所以他能成功。麥金利的故事說明,數據就在互聯網上,他能發現別人沒有注意到的數據,這給我們的提示是,我們要掌握新的工具。只有新的工具才能獲得數據,提高競爭優勢。克里斯汀的故事說明數據的外部性。此數據可能發生彼作用。

世界是一個整體,這個整體就是大數據。個人的數據是散的,如何巧妙利用數據,利用數據需要創新,需要發掘數據的外部性。通過這三個故事告訴大家,善數者成。善數者,可以獲得財富,可以找到愛情,可以改變世界。


得數據者得天下:這三個故事,揭示“數”的威力

塗子沛,江西吉安人,信息管理專家,著有《大數據》《數據之巔》《數文明》。2014年從硅谷回國,出任阿里巴巴集團副總裁,後創辦數文明科技並擔任CEO,同時擔任人民網獨立董事等職務。

本文整理自《面對大數據時代的深刻分析與思考》論壇(復旦大學DMG實驗室主辦,人民郵電出版社協辦),信息管理專家塗子沛老師的演講部分。


分享到:


相關文章: