大數據的概念、來源,以及帶來的變化和威脅

大數據的概念、來源,以及帶來的變化和威脅

大數據的概念起源於天文學,最初指信息量已經大到超過通常電腦內存所能存儲的數據量。現在概念已經發生了變化,大數據指一種現象,數據量多到引起質變,能夠做到“小數據”不可能完成的事情。

例如,谷歌的研究人員完全不瞭解感冒病人搜索什麼,但他們用海量的搜索數據做出的流感爆發預測和官方數據相關性高達97%,並且時效性接近實時。

這反映出兩個信息,第一,大數據可以給公共衛生和商業領域帶來革命性的變化。第二,大數據顛覆了人們通常的因果思維方式,不需要知道原因就能做出預測。

改變世界的前提是瞭解世界。測量工具的改善,讓人積累了更多關於世界的知識,並且知識以數據的形式保存下來。不同於以前的書籍,壁畫,現在是數字化的圖像、電影,人們對信息和數據的認知範圍也在擴大。只有互聯網時代才可能大規模產生和利用大數據。飛速增長的數據,對處理數據的技術提出了要求,而處理技術的突破,讓人類能更好地利用數據的價值,數據成為了最有價值的礦產。

大數據的優勢在於“量變引起質變”,讓人類從上帝視角,以宏觀的統計學角度看待問題,就像高空俯視大地一樣,平時繁雜的城市,一覽無餘。大數據的核心作用是預測,它屬於人工智能(AI)的一個二級分支,上一級是機器學習(ML)。只要是需要人類做出判斷的領域都會被計算機系統所影響甚至取代,未來的趨勢一定是人機結合,各取所長。

大數據給生活帶來的三個轉變:第一,大數據採用的數據量甚至可以包含全部樣本,使人們不再依賴隨機採樣,不僅提高了精確度,而且提供了隨機採樣無法提供的細節信息。

第二,數據本身的精確度不再重要。因為擁有足夠多的數據,微觀上的偏差不影響整體評估,具有更強的歸納能力。

第三,不再依賴因果關係。以前人們需要知道原因才能預測,但是現在不瞭解原因也同樣能預測,大數據更多的是關注如何解決,而不是知道為什麼能解決。

但是大數據也給個人帶來了不利影響。收集和利用大數據都需要機器,導致決策更多的依賴機器而不是人。同時大數據使以前制定的保護隱私規則失效,社會監控個人的能力極大加強,給個人帶來嚴重威脅。這也是人工智能時代最需要考慮的事情,沒有人的尊嚴和幸福,技術的進步毫無意義。


分享到:


相關文章: