國內真正的大數據分析產品


今天大數據已經越來越流行,今天給大家簡單介紹幾款比較有代表性的大數據分析平臺:


1、 Cloudera


作為全球認知度最高的大數據平臺公司,國內90%的版本基本都是在CDH的基礎上封裝的,對社區的掌控力最大。與國際軟件供應商聯手,產品涵蓋大數據平臺、ETL、高級分析、數據可視化等各個方面。Cloudera提供一個可擴展、靈活、集成的平臺,可用來方便的管理您的企業中快速增長的多種多樣的數據,從而部署和管理Hadoop和相關項目、操作和分析您的數據以及保護數據的安全。Cloudera Manager是一個複雜的應用程序,用於部署、管理、監控CDH部署並診斷問題,Cloudera Manager提供Admin Console,這是一種基於Web的用戶界面,是您的企業數據管理簡單而直接,它還包括Cloudera Manager API,可用來獲取集群運行狀況信息和度量以及配置Cloudera Manager。


還有比如像Statistica,一個整合數據分析、圖表繪製、數據庫管理與自訂應用發展系統環境的專業軟件,不僅提供使用者統計、繪圖與數據管理程序等一般目的的需求,更提供特定需求所需的數據分析方法;Actian分析平臺具備高可用性能,可自由部署在私有云或者混合雲平臺,授權模式靈活、即席查詢分析等特定,特別大大的擴展了hadoop的性能限制,幫助企業將大數據轉換為商業價值;Informatics平臺是一套完善的技術,可支持多項複雜的企業級數據集成計劃,包括企業數據集成、大數據、數據質量控制、主數據管理、B2B Data Exchange、應用程序信息生命週期管理、複雜事件處理、超級消息和雲數據集成等。


2、 星環Transwarp


基於hadoop生態系統的大數據平臺公司,國內唯一入選過Gartner魔力象限的大數據平臺公司,對hadoop不穩定的部分進行了優化,功能上進行了細化,為企業提供hadoop大數據引擎及數據庫工具。底層基於spark,支持sql on hadoop,支持sql2003標準語法,支持oracle,DB2,Teradata的存儲過程,支持ACID分佈式事務處理,支持高效內存、SSD計算,以及支持可視化權限管理,計算資源配置,用戶安全授權管理以及行級安全控制。放上一張Transwarp Data Hub的架構圖:


【思唯網絡學院】盤點|國內真正的大數據分析產品


3、 阿里數加


阿里雲發佈的一站式大數據平臺,覆蓋了企業數倉、商業智能、機器學習、數據可視化等領域,可以提供數據採集、數據深度融合、計算和挖掘服務,將計算的幾個通過可視化工具進行個性化的數據分析和展現,圖形展示和客戶感知良好,但是需要捆綁阿里雲才能使用,部分體驗功能一般,需要有一定的知識基礎。maxcompute(原名ODPS)是數加底層的計算引擎,有兩個維度可以看這個計算引擎的性能,一個是6小時處理100PB的數據,相當於1億部高清電影,另外一個是單集群規模過萬臺,並支持多集群聯合計算。


數加平臺由三部分組成,開發套件、解決方案以及數據市場。開發套件包括數據開發套件和應用開發套件。在數據開發套件中,主要包含,大數據開發:集成可視化開發環境,可實現數據開發、調度、部署、運維及數倉設計、數據質量管理等功能;BI報表工具:海量數據的實時在線分析、豐富的可視化效果;機器學習工具:集數據處理、特徵工程、建模、離線預測為一體的機器學習平臺。解決方案:數加針對不同的業務場景,基於平臺提供的開發套件與行業服務商的能力,將多方產品串聯,提供行業解決方案。放上一張基於MaxCompute的生態系統圖:


【思唯網絡學院】盤點|國內真正的大數據分析產品


4、 華為FusionInsight


基於Apache進行功能增強的企業級大數據存儲、查詢和分析的統一平臺。完全開放的大數據平臺,可運行在開放的x86架構服務器上,它以海量數據處理引擎和實時數據處理引擎為核心,針對金融、運營商等數據密集型行業的運行維護、應用開發等需求,打造了敏捷、智慧、可信的平臺軟件。


包含了開放社區的主要軟件及其生態圈中的主流組件,並進行了大量優化,FusionInsight Stream是FusionInsight大數據分析平臺中的實時數據處理引擎,以實踐驅動模式處理實時數據的大數據技術,解決高速事件流的實時計算問題,可以在金融、通信、交通、公共安全等領域發揮流式事件實時處理優勢,提供實時分析、實時決策能力。附上一張該平臺的架構圖:


【思唯網絡學院】盤點|國內真正的大數據分析產品


其一大特點是智慧,具備百萬的建模框架,精準洞察用戶行為與特徵,支持用戶數據進行超百萬維度的數據建模,深刻洞察用戶的行為和特徵,為企業的商業決策,以及新業務商機的挖掘,提供更加科學、全面的業務支持。


5、網易猛獁


網易猛獁大數據平臺是一站式的大數據應用開發和數據管理平臺,包括大數據開發套件和hadoop發行版兩部分。大數據開發套件主要包含數據開發、任務運維、自助分析、數據管理、項目管理及多租戶管理等。大數據開發套件將數據開發、數據分析、數據ETL等數據科學工作通過工作流的方式有效地串聯起來,提高了數據開發工程師和數據分析工程師的工作效率。Hadoop發行版涵蓋了網易大數據所有底層平臺組件,包括自研組件、基於開源改造的組件。豐富而全面的組件,提供完善的平臺能力,使其能輕易地構建不同領域的解決方案,滿足不同類型的業務需求。

附上該平臺架構圖:


【思唯網絡學院】盤點|國內真正的大數據分析產品


猛獁平臺提供多租戶支持,不同租戶之間相互隔離。底層使用Kerberos認證,實現了數據的安全性和隔離性。除了認證系統,利用Ranger實現了細粒度權限控制,保證了各個租戶只能查看授權訪問的庫、表或字段。此外,平臺提供審計功能,通過對用戶平臺行為的記錄、分析和彙報,用來幫助事後生成合規報告、事故追根溯源,提高平臺安全性。


平臺基於業務場景設計的用戶操作面提高了系統的易用性,結束了平臺命令行運維的繁瑣狀態。數據開發工程師和數據分析師通過簡單拖拽和表單填寫即可完成數據科學相關工作。


在大數據開發套件的數據開發模塊,提供數據庫傳輸、SQL、Spark、OLAP Cube、MapReduce及Script各種類型任務的敏捷開發界面,任務開發者通過拖拽創建任務,方便地進行數據集成、數據ETL、數據分析等數據科學工作。以數據庫傳輸為例,用戶只需將“數據庫傳輸”組件拖拽到畫布上並雙擊,通過下拉框選擇和手動輸入填寫表單,快速完成數據傳輸的任務開發。


【思唯網絡學院】盤點|國內真正的大數據分析產品


此外,企業還能根據自身業務場景按需進行任務調度管理,用戶可以設置任務的執行順序、優先級以及執行週期。針對任務失敗的情況,設置重試次數、重試間隔及報警規則。最後,任務產生的結果可以對接主流BI系統進行數據可視化分析,或者直接回流到線上系統支撐輔助線上業務。


在對數據的分析處理過程中,數據的安全重要性不言而喻。網易猛獁大數據平臺底層使用Kerberos認證,實現了數據的安全性和隔離性。除了認證系統,利用Ranger實現了細粒度的權限控制,保證了各個租戶只能查看授權訪問的表、庫和字段。不僅如此,平臺還提供審計功能,通過對用戶平臺行為進行記錄、分析和彙報,用來幫助對事故追根溯源,提高了平臺的安全性。



分享到:


相關文章: