數據、信息、知識和智慧——啤酒和尿布的內幕故事


數據、信息、知識和智慧——啤酒和尿布的內幕故事

啤酒和尿布的故事

在一家超市裡,有一個有趣的現象:尿布和啤酒赫然擺在一起出售。但是這個奇怪的舉措卻使尿布和啤酒的銷量雙雙增加了。這不是一個笑話,而是發生在美國沃爾瑪連鎖店超市的真實案例。沃爾瑪擁有世界上最大的數據倉庫系統,為了能夠準確瞭解顧客在其門店的購買習慣,沃爾瑪對其顧客的購物行為進行購物籃分析,想知道顧客經常一起購買的商品有哪些。沃爾瑪數據倉庫裡集中了其各門店的詳細原始交易數據。在這些原始交易數據的基礎上,沃爾瑪利用數據挖掘方法對這些數據進行分析和挖掘。一個意外的發現是:"跟尿布一起購買最多的商品竟是啤酒!經過大量實際調查和分析,揭示了一個隱藏在"尿布與啤酒"背後的美國人的一種行為模式:在美國,一些年輕的父親下班後經常要到超市去買嬰兒尿布,而他們中有30%~40%的人同時也為自己買一些啤酒。產生這一現象的原因是:美國的太太們常叮囑她們的丈夫下班後為小孩買尿布,而丈夫們在買尿布後又隨手帶回了他們喜歡的啤酒。   

沃爾瑪從數據當中挖掘出了寶貴的“啤酒和尿布”的知識,那麼如何區分數據、信息以及知識,達文波特認為知識既不等於數據,也不等於信息,它們是無法互換的概念,但這三者息息相關。彼得.德魯克曾說“信息是包括關聯性與目標的數據”,這說明數據本身並不具有關聯性和目的。簡單地說,知識不是數據的簡單累積,也不同於信息,信息只是知識的原料。某種程度上,信息和知識的區別有點象字典和語言,如何利用信息獲得知識,很大程度上是一種創造性的藝術。

1998年,世界銀行推出了《1998年世界發展報告一一知識促進發展》對數據、信息和知識之間的區別進行了闡述,報告指出:數據是未經組織的數字、詞語、聲音、圖像等;信息是以有意義的形式加以排列和處理的數據(有意義的數據);知識是用於生產的信息(有意義的信息),信息經過加工處理、應用於生產,才能轉變成知識。

微軟曾經這樣理解數據、信息和知識之間的關係和區別,它認為:

  • “數據”的一般特徵是關於事件和關於世界的一組獨立的事實,圍繞著數據建立活動,其核心價值在於分析、合成,並把這些數據轉化成信息和知識。
  • “信息”是捕捉了來龍去脈的內容並加以經驗和想法後的產出物,它是以半結構化的內容存儲的,像文件資料、電子郵件、聲音郵件以及多媒體等,圍繞信息建立活動,其核心價值在於管理內容的方法,這種方法要易於找到內容,反覆使用它們,並方便從經驗中學習,這樣就不會重複錯誤,工作也不會被複制。
  • “知識”是由個人的隱式經驗、想法、洞察力、價值、以及判斷等組成的,它是動態的,需要通過與有知識的專家直接合作與交流才能拿得到。

又有研究者在更高程度上解釋了信息、知識以及智慧這三個不同的概念,認為信息是過去知識的編碼,是靜態的概念;知識是認識世界的顯性和隱性知識的總和,是一種產品又是一個過程;智慧是把知識應用於活動併產生新的知識的一個動態過程,即創新能力,一個真正的知識型企業不僅需要組織的知識,更需要組織的智慧。

數據、信息、知識和智慧——啤酒和尿布的內幕故事

數據、信息、分析、知識和智慧

在一個組織的信息系統和數據庫裡蘊藏著巨大的機會,組織可以利用特定技術對數據和信息進行挖掘,使組織從由其形成的競爭優勢中獲益。這種從數據中挖掘競爭優勢的做法實際上就是一種由數據到知識及智慧的過程,分為數據、信息、分析、知識以及智慧這五個層次:

  • 數據,由於數據庫管理系統以及數據存儲技術的產生和發展,很多企業和組織中都已收集、處理、存儲了大量的有關人、交易、事件等類型的數據,這些數據和組織的業務過程息息相關。例如,一個雜貨店收集和存儲了有關顧客購物的交易數據,包括如下的數據元素:貨物名稱、數量、價格、日期等。交易處理系統存儲了大量的相關數據,為更高層次的理解奠定了基礎。
數據、信息、知識和智慧——啤酒和尿布的內幕故事

數據

  • 信息,在交易數據不斷得以處理和收集的同時,該雜貨店實際上在收集著潛在的數據財富。交易數據中的每個數據元素個體並不能夠提供任何有價值的意義,但是數據元素都處於一定的上下文結構中,它們在這種結構中就提供了信息,報表系統具有從數據庫中提取和轉化數據為信息的功能。例如,不同貨物名稱、數量和價格就提供了被購貨物的信息,包括貨物種類、數量和價格等。通過計算每種貨物的銷售額,就可以進行貨物銷售額排序。
數據、信息、知識和智慧——啤酒和尿布的內幕故事

信息

  • 分析,將不同的數據元素積聚形成信息是很有用的,同時,將數據分離和重新組織將能夠提升信息的價值,這就是進行信息分析的意義。經營分析系統就具有類似的信息分析功能,它能夠從信息中發現關聯、模式、趨勢、例外等更有價值的信息。例如,可以對雜貨店中存儲的信息按照特定的時間週期進行分析,可以得到有價值的分析結果,尿布和啤酒的銷售受到時間週期的影響,而穀物、麵包和牛奶則保持穩定的銷售態勢。通過上述的信息分析,得到了這樣的一種銷售趨勢和模式信息,這將給決策提供支持。
數據、信息、知識和智慧——啤酒和尿布的內幕故事

分析

  • 知識,知識不同於數據、信息及分析,它可以來源於數據、信息和分析的任一層次,同時也可以從現有知識中通過一定的邏輯推理而得到。BI應用具有數據挖掘能力,能夠從數據中發現隱藏的趨勢以及不尋常的模式。通過對雜貨店的數據進行稱為規則歸納的數據挖掘,可以得到如下一條結論:買尿布的顧客通常有一半時候也買啤酒。尿布和啤酒初看起來毫無關聯,但是通過數據挖掘得到了這種隱含的模式,這就是知識。
  • 智慧,智慧可以說是基於知識基礎上的一種判斷、謀略或行動。通過對雜貨店數據的挖掘分析,得到了一種隱含的顧客購買模式。通過這個知識,雜貨店主就可以對數據集合進行調查分析,從而開發一系列的銷售模式。在時期1、2、3,啤酒的銷售除了遵循顧客購買模式—買尿布的顧客通常有一半時候也買啤酒—的銷售量外,還有額外銷售,但在時期4卻沒有額外銷售。這樣可以通過分析時期4相對於時期3的啤酒銷售情況,制定特定的銷售策略來提高時期4的啤酒銷售量,同時也通過分析時期2的尿布和啤酒的購買情況,以發現是什麼導致了額外啤酒銷售的產生。這樣,通過利用知識,對於數據的更高層次的理解就被創造出來了,形成了一種智慧並轉化為了價值。
數據、信息、知識和智慧——啤酒和尿布的內幕故事

從知識到智慧

在實際應用中,對應於上述的五個理解層次,分別有相應的技術對不同層次提供支持。目前很多企業都具有了一定的分析數據的能力,但是隻有那些能夠充分從數據裡發現“金子”—知識、並進而上升為智慧的企業才能夠獲得真正的競爭優勢。另外,我們決不能忽視人類思維的作用,當人工智能企圖模仿人類的思維過程時,事實上還一直都沒有研究出真正可以代替人類思維的技術,人機智能共生將是未來工作的常態。

數據、信息、知識和智慧——啤酒和尿布的內幕故事

五個層次對應的技術支撐

數據、信息、知識和智慧——啤酒和尿布的內幕故事

知識圖譜支撐大數據到大知識

由此,可以這樣給出數據、信息、知識以及智慧之間的辨證關係。數據、信息及知識是處於一個平面上的三元關係,分別從語法、語義以及效用三個層面反映了人們認知的深化過程,即信息是基於數據進行上下文解釋和分析得到的有規律的數據,知識則是在信息基礎上進行行為解釋而得到的有價值的信息。目前有很多計算機輔助工具可以幫助人們完成從從語法、語義以及效用的認知過程。而智慧則超越了這個平面,它是人們在數據、信息以及知識基礎之上的獨創性活動,並主要以已有的知識存量為基礎,可以說是一種更高層次的知識創造過程。

數據、信息、知識和智慧——啤酒和尿布的內幕故事


分享到:


相關文章: