主任,我們可能做了個假的大數據臺

自大數據納入國家發展戰略以後,湧現了各種各樣的大數據平臺,大到全國性的行業大數據平臺,小到縣、鄉鎮的“大數據”平臺,眾多的系統平臺進一步推動國家信息化的水平,但是,很多項目打著大數據的名義,做出了一些非大數據功能的傳統數據管理系統,這不僅浪費了資金,還有可能擾亂當地的數據治理體系,給後續數據整合帶來困難。

為什麼大數據項目那麼火熱:多方推動是原因一,原因二因為大數據的很多組件都是開源的,成本低,只要稍作封裝,即可產生一定功能,項目利潤較大。如數據可視化,最常見的:各種餅圖、柱圖,

主任,我們可能做了個假的大數據臺


EXCEL表示不服,這是我多年前就有了的功能:

主任,我們可能做了個假的大數據臺


那麼怎樣才算大數據平臺?聯盟君的四個觀點如下:

1、 有基於大數據體系的架構

即有完整的數據採集、數據治理、數據存儲管理、數據數據分析、數據可視化體系。每個體系均有多個可用工具,並可進行模塊化添加刪除。如數據採集,支持ETL、kafka、接口等多種方式。數據存儲管理應具備數據倉庫功能,並能在數據維度、數據關聯度、數據體量等方面可以按需靈活擴充等。

2、 數據源應是多維度、數據更新有持續性、體量較大

參照如公安、銀行、交通、電力、通信、工廠等行業,人或機器在運動或運營中產生著大量的數據,不斷填充進數據倉庫,才能有充足的分析依據。

3、 有分析模型,並能按需調整、增加模型

目前很多的大數據平臺,“數據查詢”、“數據比對”佔據了主要的功能,這僅僅是大數據的雕蟲小技。經構建多維度的數據標籤,加上基於行業應用的算法體系,實現預測、預警,關聯分析、模糊查詢等功能才是大數據最有價值的意義所在(也是最值錢的地方)

4、 大數據平臺獨立存在,對業務平臺不產生影響

業務平臺就像自來水公司,生產水,提供用水服務;大數據平臺可以抽象為水質監測公司,對自來水公司的各類水質、用戶數據抽取,用作分析他用,但不影響自來水公司的正常運營。



分享到:


相關文章: