Hadoop:
在Apache的Hadoop的軟件庫是一個大數據框架。它允許跨計算機集群分佈式處理大型數據集。它旨在從單個服務器擴展到數千臺計算機。
特徵:
使用HTTP代理服務器時的身份驗證改進
Hadoop兼容文件系統工作規範
支持POSIX樣式的文件系統擴展屬性
它提供了強大的生態系統,非常適合滿足開發人員的分析需求
它帶來了數據處理的靈活性
它允許更快的數據處理
億信BI:
億信BI是一種大數據分析工具。深耕大數據應用每個環節,專為中國式複雜報表量身打造。億信BI內置數十種可視化元素和圖形,還原事件場景掌握動態數據信息。能夠快速發現問題,解決問題,找到原因,發現內在關係。真正釋放企業數據力量,輔導領導決策,驅使企業不斷進步
特徵:
基於B/S架構、零安裝,友好的WEB操作界面、零編程交互式分析,一鍵更換報表皮膚,異構數據庫一鍵遷移。
廣泛的數據源支持,輕鬆應對中國式複雜報表,純WEB打印、多語言切換、報表訂閱、計劃任務。
智能分析引擎、多線程並行計算、路徑自動規劃、支持大數據、支持集群部署。
豐富的自定義拓展,開放的集成接口,二次開發平臺,靈活兼容多種數據模型,輕鬆構建更多應用。
Cloudera:
Cloudera是最快,最簡單,最安全的現代大數據平臺。它允許任何人在單個可擴展平臺內的任何環境中獲取任何數據。
特徵:
高性能分析
· 它提供多雲服務
跨AWS,Microsoft Azure和Google Cloud Platform部署和管理Cloudera Enterprise
啟動和終止集群,只需在需要時支付所需的費用
開發和培訓數據模型
報告,探索和自助服務商業智能
提供監控和檢測的實時洞察
進行準確的模型評分和服務
Rapidminer:
Rapidminer是一個開源的大數據工具。它用於數據準備,機器學習和模型部署。它提供了一套產品來構建新的數據挖掘流程和設置預測分析。
特徵:
允許多種數據管理方法
GUI或批處理
與內部數據庫集成
交互式,可共享的儀表板
大數據預測分析
遠程分析處理
數據過濾,合併,加入和聚合
構建,培訓和驗證預測模型
將流數據存儲到眾多數據庫中
報告和觸發的通知
蜂巢:
Hive也是一個開源軟件大數據。它允許程序員在Hadoop上分析大型數據集。它有助於快速查詢和管理大型數據集。
特徵:
它支持SQL,如用於交互和數據建模的查詢語言
它使用兩個主要任務map和reducer編譯語言
它允許使用Java或Python定義這些任務
Hive專為管理和查詢結構化數據而設計
Hive的SQL語言將用戶與Map Reduce編程的複雜性區分開來
它提供Java數據庫連接(JDBC)接口
閱讀更多 數據一點通 的文章