數據挖掘與統計學習、機器學習、OLAP,具體有什麼關聯?

數據挖掘與統計學習、機器學習、OLAP,具體有什麼關聯?

數據挖掘、機器學習、深度學習之間的概念,還是有很大區別的,數據挖掘,也可以叫數據深層採集,數據勘探,利用各種技術與統計方法,將大量的歷史數據,進行整理分析,歸納與整合。

數據挖掘為找尋隱藏在數據中的有用信息,如趨勢、特徵及相關的一種過程,也是從數據當中挖掘出知識。

數據挖掘並不屬於一個單一領域,而是許多學科綜合而成,其包括機器學習、統計學習、數據庫、領域知識及模式識別等領域,接下來我們一起聊聊它們彼此間的差別、關係和影響。

數據挖掘與統計學習、機器學習、OLAP,具體有什麼關聯?

數據挖掘與統計學

統計學,蒐集、展示、分析及解釋數據的科學,統計分不是方法的集合,而是處理數據的科學。

數據挖掘,大部分核心功能的實現都以計量和統計方法作為支撐。這些核心功能包括聚類、估計、預測、關聯分組以及分類等。統計學、數據庫和人工智能共同構成數據挖掘技術的三大支柱。許多成熟的統計方法構成了數據挖掘的核心內容。如迴歸分析、判別分析、聚類分析、探索性數據分析、列聯分析等統計方法,一直在數據挖掘領域發揮著巨大的作用。

因此,若是硬要去區分數據挖掘和統計學的差異其實是沒有太大意義的。數據挖掘技術中的CART、CHAID或模糊計算等等理論方法,也都是由統計學者根據統計理論所發展衍生,換另一個角度看,數據挖掘有相當大的比重,是由高等統計學中的多變量分析所支撐。但是為什麼數據挖掘的出現會引發各領域的廣泛注意呢?主要原因在相較於傳統統計分析而主,數據挖掘有以下幾項特性:

1.處理大量實際數據更強,且無須太專業的統計背景去使用數據挖掘的工具。

2.數據分析的趨勢是從大型數據庫抓取所需數據並使用專屬計算機分析軟件,數據挖掘的工具更符合企業需求。

3.數據挖掘和統計分析應用上的差別,畢竟數據挖掘目的是方便企業終端用戶使用而非給統計學家檢測用的。

數據挖掘與統計學習、機器學習、OLAP,具體有什麼關聯?

數據挖掘與機器學習

機器學習算法是一類從數據中自動分析獲得規律,並利用規律對未知數據進行預測的算法,因為學習算法中涉及了大量的統計學理集結,機器學習與統計推斷學聯繫尤為密切,也被稱為統計學習理論。算法設計方面,機器學習理論關注可以實現的、行之有效的學習算法。很多推論問題屬於無程序可循難度,所以部分的機器學習研究是開發容易處理的近似算法。

機器學習已經有了十分廣泛的應用,例如:數據挖掘、計算機視覺、自然語言處理、生物特徵識別、語音、手寫識別和機器人運用。

數據挖掘與統計學習、機器學習、OLAP,具體有什麼關聯?

數據挖掘與數據庫聯機分析處理(OLAP)

OLAP是對制式化、關聯性低的數據進行分析,以供決策人員參考。數據挖掘本質上與統計分析及OLAP有所不同。統計分析僅能針對較少量的數據,就數據的關聯性或統計學上不同的目標加以分析,而OLAP,則是一般數據倉庫所採用的分析報告,可以針對制式化以及關聯性較低的數據加以分析。OLAP工具是從過去數據中得知結果,但無法像數據挖掘一樣告訴你結果發生的原因。

數據挖掘為DT時代,獲取大數據的重要一環,具體牽涉的一些基本概念,夥伴們還是一定要知道的,有興趣的朋友,可以關注多智時代,及時查閱相關知識,如有不足,請批評指正。


分享到:


相關文章: