塗子沛新書解讀「數」文明

涂子沛新书解读“数”文明

數據讀心術

被“操控的選舉”

2018年3月,全球最大的社交網站Facebook 被曝出負面新聞: 一個名不見經傳的小公司,通過不正當的手段,在Facebook 網站上 獲取了8 700 萬用戶的數據。這些數據隨後被用於多個國家選舉中的選民分析,2016 年當選的美國總統特朗普就曾經僱用這家公司,這引發了關於數據操縱選舉的批評,直逼特朗普當選的合法性,觸目驚心。

涂子沛新书解读“数”文明

在選舉中大量使用數據的做法,起源於美國第44 任總統奧巴馬。2008年,他第一次代表民主黨參選期間,建立了專門的個人競選網站,收集了1300 萬人的個人信息和郵箱地址。在此之前,大規模的營銷和宣傳活動一般使用“信息群發”的方式,但奧巴馬放棄了這種方式。他僱用了一批數據科學家,嘗試通過數據對選民進行分類,向不同類別的選民推送不一樣的定製信息。到2012年,奧巴馬競選連任,這時候Facebook 已經聚集了8億用戶,奧巴馬的個 人競選網站實現了和Facebook 聯動。

這兩屆總統選舉都以民主黨大獲全勝告終,奧巴馬使用的大數據分析方法也成為教科書級別的經典案例。在此之後,共和黨痛定思痛,決心迎頭趕上。個別共和黨“大佬”開始和技術極客交朋友,出資參與他們成立的數據公司,其中有一家就是Facebook 風波的主角劍橋分析公司,它於 2014 年成立。

這家公司之所以叫劍橋分析,和它的團隊和數據來源有關。劍橋大學心理系有一名年輕的研究員科根以學術研究的名義在Facebook 上推出了一個小小的程序,它宣稱可以免費提供性格測試, 參與者還可以得到一個 5 美元左右的現金紅包。這也是今天一個奇怪的現象,一毛錢掉在地上,很多人都懶得彎腰去撿,但對互聯網上的一毛錢,大眾趨之若鶩,搶得不亦樂乎,最終 32 萬人參與了科根的調查。

是時候揭下互聯網的“免費”外衣了:幾乎所有的互聯網服務都是免費的,但使用者其實付出了對價—我們交出了“數據”。

32 萬人如何突變成8 700 萬人呢?這是因為Facebook 精心設置的“缺省”隱私政策,即如果用戶沒有特別表態,他的個人信息就對他所有的朋友開放。放到科根爬蟲的工作場景中,這意味著除非一個人的朋友已經特別聲明自己不願分享信息,否則科根的爬蟲在扒取某人信息的同時,也可以把他朋友的信息一併 扒取。於是,雖然參與科根測試的用戶只有區區32 萬,但憑藉缺省許 可,這些“種子”最終開枝散葉,科根裂變式地收集到了 8700萬用戶的信息。

科根之後轉手,8700萬人的數據在雲端悄無聲息地歸到了劍橋分析公司的名下。出乎人們意料的是,劍橋分析公司用這些看似不起眼的公開數據,玩出了大花樣。他們把 8 700 萬人的社交數據和美國商業市場上2.2億人的消費數據進行匹配、組合和串聯,找出誰是誰,然後就性別、年齡、興趣愛好、性格特點、職業專長、政治立場、觀點傾向等上百個維度給選民一一打上標籤,進行心理畫像,建立心理檔案,再通過這些心理檔案開展分析,總結出不同人群的希望點、恐懼點、共鳴點、興奮點、煽情點以及“心魔”所在。

當代大數據“讀心術”

就此誕生

掌握了一個人的“心魔”,就可以評估一個人最容易受哪種信息的影響,就可以知道信息該如何包裝、如何推送,才能搔到接收者的癢處,潛移默化地影響一個人的選擇和判斷。

相同的配方,熟悉的味道,這些精準投放的宣傳資料,就好像一顆顆用數據調配的藥丸,被推送給選民反覆服用,之後慢慢地發生作 用,最終引導選民做出藥丸配製方預設的政治行動。 從本質看,這是互聯網的精準廣告投放技術在選舉中的應用。

大數據不僅僅是科學,還是技術,它是科學和技術的混合體。

涂子沛新书解读“数”文明

劍橋分析公司的主頁

在劍橋分析公司的主頁上,這個公司號稱服務過世界五大洲的100 多場選舉,其中還包括2016 年英國的脫歐公投。這是2016 年度全球最大的“黑天鵝事件”,脫歐派以52% 對 48% 的微弱優勢最終勝出,全世界為之感到意外。雖然“數據藥丸”對選舉的作用大小很難量化,但有一點可以肯定:在一場勢均力敵的、差距很小的選舉中,它會起到關鍵的作用。

在 Facebook 最後的道歉聲明中,公司並不承認這是一場“數據失竊”事故,而是強調“沒有保護好用戶的數據”。事實上,這起風波連“洩露”都談不上,因為“點贊”數據幾乎是公開的,數據在整個過程中都是經過用戶同意才被扒取的。如果真要說這是隱私侵犯,也是合理侵犯,但真正的問題卻比隱私侵犯還要嚴重。

真正的問題在於,即使通過公開的數據,互聯網也可以成為影響、操縱、控制他人心理和觀點的媒介工具,這不是隱私侵犯,而是心理入侵、思想入侵、意識入侵。

Facebook 風波發生在美國,無獨有偶,2018 年初,中國的大數據公司也被曝出了一系列的負面新聞。它們的問題既不是傳統的隱私問題,也不同於劍橋分析公司的“數據藥丸”和意識操縱,它們侵犯了消費者的錢袋子。

2017 年 12 月,一名中國網友在微博上講述了自己遭遇大數據“宰客”的經歷。他經常通過某旅行網站預訂某酒店的房間,價格常年為 380~400 元。偶然一次,酒店前臺告訴他淡季價格為 300 元上下。他用 朋友的賬號查詢後發現,果然是300 元,但用自己的賬號去查,還是 380 元。

涂子沛新书解读“数”文明

這條微博引發了網上的“大吐槽”,媒體打出了“大數據殺熟”的標題。所謂“熟”,就是通過消費者的數據掌握了消費者的底細。

據中國電子商務研究中心的不完全統計,包括滴滴出行、攜程、飛豬、京東、美團、淘票票在內的多家互聯網平臺均被曝光存有“殺熟”的情況,特別是在線差旅平臺更為嚴重。對此,各家平臺反應不一,有些聲明“堅決沒有”,有些不予回應,還有的“委婉默認”。

“殺熟”的淵源可以追溯到5年前開始興起的“千人千面” 。當然,“ 千人千面”的實現基礎就是“數據識人”。“千人千面”的硬件基礎是移動互聯帶來的“一人一屏”。如果幾個人共用一部手機,算法的準確性就無從談起,但就是因為“一人一屏”,一個新的可能出現了,價格也可以變得個性化—千人千價。簡單地說,就是通過數據可以區分窮人和富人、新人和舊人、價格敏感人群和價格不敏感人群、蘋果手機用戶和安卓手機用戶。

“一人一屏”和“數據識人”深刻地改變了商家和消費者的關係。在傳統的商超,價格一經公開,所有的消費者都享受一樣的價格,如果價格不合理,商家會受到眾人的挑戰,商家和消費者是一對多的關係,因為眾怒難犯,商家不敢輕易打歪主意;但在“一人一屏”的時代,商家和消費者變成了一對一的關係,價格是隱秘的、單行的,價格合不合理,消費者只能靠自己判斷,而消費者的認知空間已經被手機和數據割裂了。

數據驅動,新文明的興起

隨著大數據的興起,“言必稱數據”逐漸成了我們這個時代一個顯著的特徵,但問題是,此數據非彼數據。

今天,所有“記錄”的結果,甚至包括文字,都被統稱為數據。這其中暗含的邏輯是,數據作為一個概念,它的內涵擴大了。傳統意義上的數據是人類對事物進行測量的結果,是作為“量”而存在的數據,可以稱為“量數”;今天的照片、視頻、音頻不是源於測量而是源於對周圍環境的記錄,是作為一種證據、根據而存在的,可以稱為“據數”。

幾乎人類的一切行為,今天都可能、可以被記錄,並被轉化為據數。如果說量數的核心要義是“精確”,那據數的關鍵就在於“清晰”地留據。

因為智能手機的普及,據數已經無處不在。迄今為止,以據數為中心的大數據討論主要停留在以下三個層面。

一是精準營銷,即互聯網廣告業。和傳統的廣告業相比,今天的互聯網和智能手機通過記錄消費者不斷產生的數據,可以向終端用戶推送個性化的廣告,這大大提高了行業效率。這是大數據革命在商業領域的起源。這也是目前互聯網企業,無論是中國的 BAT(百度、阿里巴巴、騰訊),還是美國的谷歌、Facebook(臉譜網)、亞馬遜最主要的贏利途徑。

二是商業和社會信用,其主體是金融機構。除了精準營銷,這是利用大數據賺錢的第二個法門,也是我們看到諸多互聯網企業陸續進入金融領域的原因。其商業模式是,通過消費者的消費記錄評估消費者的信用,從後續的金融服務中贏利。例如阿里巴巴旗下的“芝麻信用”和騰訊旗下的“微粒貸”,它們在給消費者打“信用分”的基礎上,向單個消費者提供貸款等金融服務。

這兩種商業模式,都需要通過數據監控消費者在互聯網上的一舉一動,消費者個體因此成為被觀察、被分析、被監測的對象,這就帶出了第三個層面的問題—隱私。這兩種商業模式的副作用是,我們幾乎每天都能聽到數據洩露的新聞,時不時還會看到因為它而導致的悲劇。

這就是大眾眼中的大數據,前兩者為商業利潤而生,而隱私問題屢屢成為社會公共話題。可是,這三個層面僅僅揭開了冰山的一角,難道大數據就是養了幾家大公司,方便了公眾生活,改善了信用評級體系,讓生活更美好或者多了點麻煩這麼簡單?遠不止於此。

在商業層面,大數據還在進一步深化變革,它所催生的互聯網應用仍在不斷更新迭代。當大數據完全發揮出它的潛力時,其最終形態將是全自動商業,或稱智能商業,商業文明將會被重塑和再造。

據數的商業化應用帶動了大數據的興起,但商業只是故事的一個邊角,革命是社會化的,未來我們還會看到智能製造業,它所依靠的還是數據,數據引發的變化還在向社會治理和個人生活領域全面拓進,它涉及社會生活的方方面面,將會推動整個社會進入文明新狀態,改變社會的全貌,被稱之為“數文明”。

數文明

社會和個人如何被賦能?

在國家和社會的層面之上,我們將會看到更大的變化。越來越多的個人行為在被記錄,對國家而言,這意味著每一個國民個體、每一輛車甚至每一個其他物體都可以被追蹤。如果懂得使用數據,那麼站在官僚層級的金字塔上,我們的社會將呈現出一種現在就非常清晰而且會越來越清晰的狀態,據數就是這個高清社會的紋理。清晰性是有效治理的前提。

和量數相比,據數為國家治理提供了新的工具和手段。就此而言,用好大數據是通向國家治理現代化的最佳路徑。今天中國要建設法治社會已經是共識,《數文明》要提出的是數治。數治就是憑藉對數據的有效收集、處理數文明和分析來治理國家以及與之對應的數據治理,數據治理將是國家治理的重要內容。

對國家而言,以大數據為結果的互聯網代表的是新生的力量,它正在重塑傳統社會,數治正在有效地解決人類對安全的根本性需要。另一方面,大數據、互聯網又帶來挑戰。。國家力量已經不可能完全左右互聯網連接起來的有機社會了,相反,越來越多的公共功能在向私人公司、社會機構轉移。如何利用這股力量,又約束住這股力量?這股力量可能會重塑整個社會的結構,催生新的政治文明,數治因此是一個具有挑戰性的話題。

數文明不僅和國家、社會相關,也直接關係到個人。

對個人來說,掌握未來發展、演進的方向,知道哪些行業將消失,哪些行業又將興起,這當然非常重要。一個在黑夜中行走的人是走不快、走不遠的,他也無法領略到沿途的風景之美。

在數文明的時代,通過記錄賦能,個人會成為高能個體,一個具備數據意識、數據頭腦和數據技能的數據公民當然更容易獲得成功。新的時代會改變個人的命運,我們也應該調整我們的價值觀。

個人的成功和一個民族的文明自有相通之處,這個相通之處就是記錄。因為普適記錄,個人更容易獲得成功,而推動文明發展的最終動力則是無數國民源源不斷的創新。正因如此,數文明的能量和潛力有可能超越歷史上所有的文明。

新文明的悖論

一類新的隱私觀

當然,新文明本身也問題纏身。

當我們撥開大數據表面上的浮雲,立刻就可以看到一個商業逐利和社會控制的世界。個人向互聯網企業讓渡的數據反過來為互聯網企業的“殺熟”行為提供了便利,無數人的個人生活被圈在一個固定的小天地裡,看個性化推薦的新聞,閱讀個性化定製的消費指南,他們感覺很舒服,事實上,我們出讓的數據正在成為我們的電子腳鐐和枷鎖。

這是新文明的兩個悖論。一方面,數據越清晰、越全面、越真實,就越有利於個性化生產,避免資源浪費,比如精準營銷、個性化頁面、私人定製服務;另一方面,數據又帶來了信息繭房、信息窄化的風險。 一方面,大數據要求更加開放甚至是無限制的聯接,另一方面這又將傷害個人的隱私和權利。

那該如何看待新文明的問題?文明從來都是在衝突中成長的,沒有哪種文明一開始就很完美。今天信息技術的發展提供了新的可能,但數文明最終的形態是需要大家一起創造的。

事實上,上述悖論也可能很快被破解。比如,通證經濟來臨,區塊鏈技術正日臻完善,未來一個人的數據很可能並不保存在 Facebook、阿里巴巴、騰訊這些大型互聯網公司,而是保存在一個公共的區塊鏈上,這些企業使用我們的數據都必須經過我們的同意,被區塊鏈記錄。只能說,我們目前所見證的數據革命,還遠遠沒有結束,如果真要說結束,那也只是一個序曲的結束。

即使是隱私問題,隨著人工智能的普及,它也在出現新的態勢,我認為整個人類,無論東方或西方,亟須建立一種新的隱私觀。

例如,被中國大眾頻繁詬病的“大數據殺熟”和“千人千價”,它們是通過算法對數據的自動處理實現的,主觀上它沒有洩露任何人的數據。可是處理這些信息的並不是某個具體的人,而是算法和機器,它們自動運行,自行匹配,人為干預的程度很低。那麼,這種情況該不該簡單地被認定為侵犯個人隱私呢?

這就是新的情況:你的數據都是算法和機器在處理,並沒有被洩露給“人”,在一定程度上,你的隱私並沒有受到“人為”的侵犯。人為洩露個人數據的案例和情況當然還會出現,但我相信會越來越少。我們的數據需不需要對算法和機器保密?這才是一個新的問題。

我們不會介意自然環境在注視或監視我們,那我們是否介意算法和機器注視著我們?或者說,我們應該介意嗎?未來,算法和機器就是我們生活環境的一部分,讓機器瞭解我們,向機器開放我們的數據,這恐怕是通向智能時代、機器人時代、人機協同時代唯一的選擇。

人類新的隱私觀,其核心是要為商業和公共領域的算法劃定一個使用個人數據的邊界。

數文明的發展和延續,我相信是以百年、千年的時間為單位的,探討數文明,就是思考人類的百年大計、千年大計。不管是國家還是個人,我們需要跟上新文明的演進步伐,否則就可能被新文明所淘汰。

本文整理自《數文明:大數據如重塑人類文明、商業形態和個人世界》

涂子沛新书解读“数”文明

End

涂子沛新书解读“数”文明涂子沛新书解读“数”文明
涂子沛新书解读“数”文明

本文來源於數文明,作者/塗子沛,編輯/方茶雲,轉載請注來源。欲瞭解更多大數據丨區塊鏈丨人工智能行業相關資訊丨乾貨丨報告等,可搜索數據觀微信公眾號(ID:cbdioreview)進入查看。


分享到:


相關文章: