數據挖掘是潛在有用的信息和知識的過程

數據挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。這個定義包括好幾層含義:①數據源必須是真實的、大量的、含噪聲的;②發現的是用戶感興趣的知識;③發現的知識要可接受、可理解、可運用;④並不要求發現放之四海皆準的知識,僅支持特定的發現問題。

數據挖掘是潛在有用的信息和知識的過程

從商業上看,數據挖掘是一種新的商業信息處理技術,其主要特點是對商業數據庫中的大量業務數據進行抽取、轉換、分析和其他模型化處理,從中提取輔助商業決策的關鍵性信息。簡而言之,數據挖掘其實是一類深層次的數據分析方法,它是按企業既定業務目標,對大量的企業數據進行探索和分析,揭示隱藏的、未知的或驗證已知的規律性,並進一步將其模型化的先進有效的方法。

數據挖掘是潛在有用的信息和知識的過程

但是,數據挖掘只是一個工具,不是萬能的,它可以發現一些潛在的用戶,但是不會告訴你為什麼,也不能保證這些潛在的用戶成為現實。數據挖掘的成功要求對期望解決問題的領域有深刻的瞭解,理解數據,瞭解其過程,才能對數據挖掘的結果找出合理的解釋。例如曾經用數據挖掘找出的啤酒和尿布的例子,如何去解釋這種現象?是應該將兩者放在一起還是分開銷售?這還需要對消費心理學有所研究才能做出決定,這不是數據挖掘能力所及的了。

數據挖掘是潛在有用的信息和知識的過程


分享到:


相關文章: