數據分析工具那麼多,其實掌握這個BI就夠了!

常常有人問我,數據分析用什麼工具?

其實我在很多文章裡面都提到過:Excel、BI、R、Python...具體看大家的需求

非要說哪一個好,其中BI工具個人覺得“老少皆宜”。

BI工具,Business Intelligence 商業智能,這就是為了數據分析而生的,而且它誕生的起點就非常高,目標是把從業務數據到經營決策的時間縮短,如何利用數據來影響決策。

數據分析工具那麼多,其實掌握這個BI就夠了!

有人會說,這類圖網上用Excel作的也有很多。但是不一樣,Excel做表格有一套,也可以做課程表,做調查問卷,作計算器來算數。術業有專攻,BI是專攻數據分析的。

比如說FineBI,當你用FineBI的時候,你會發現他是完全按照數據分析的流程來設計的,先是數據準備,做一些基礎的數據處理和模型準備;再到自助數據集,對拿到的數據進行過濾、增加計算指標、合併數據關聯分析;然後數據分析挖掘,通過拖拽操作,以圖表、表格的形式進行多維分析,發現有價值的出具結果;最後搭建數據駕駛艙,出數據報告。

這些是數據分析的必經之路,同時這個流程裡也存在著從業者的一些痛點:

1、比如清洗數據這種重複性,低附加值的工作,可以用自助數據集來解決,裡面提供了很多現成的操作,比如新增列,分組統計,過濾,排序,上下合併,左右合併等功能。且每一步都有就記錄,方便回顧思考過程。

2、比如做可視化展現,用Excel之類的工具可能會花費很多時間在美化上,甚至大家經常看到一些Excel技巧類的文章,實現一些精美的圖表需要花很多偏門的小技巧才能夠完成。這在BI(FineBI)裡面都是一鍵生成。

這些痛點都是BI工具能夠給我們帶來改變和增值的地方。

為什麼推薦這個工具呢,BI工具有很多呀,Power BI、Tableau…就是這些都被推薦爛了。哈哈,開玩笑,推薦它一定是有它的獨到之處——完善的數據處理方案和數據管控。

自己近一年也在公司裡開發一些數據產品。發現面向個人的產品很標準,就是按照一套模子做出來,迎合大部分人的大部分需求。可面向部門/企業應用的產品,有千奇百怪種狀況,比方說性能,還有複雜流程的管控,數據流轉那一套,都是大家很重視的。而這樣做往往就有可能走定製化的路線。

後來我們就看有哪些在這方面做得比較好的工具,就遇上了FineBI。

好了,說了那麼多,FineBI究竟是一個怎樣的BI工具,用幾個關鍵詞來總結,數據分析挖掘、數據處理/可視化ETL、大數據高性能、企業級數據管控。

數據分析挖掘

1、探索性分析,瞭解數據

數據分析不可能一開始就有思路的,拿到數據時,一般都是嘗試性的分析,看一下數據的趨勢,看出苗頭了,比方說某一處的數據突然降低很多,分析相關的可能性是什麼,逐漸一步一步地去深入分析。每一步操作圖表都會響應,告訴你結果。

另外,這期間很多過程有可能是錯誤的,有些指標是需要再計算的。對於這些“探索性”的操作,FineBI提供增加、修改、刪除歷史操作功能,及時修正,每一個步驟都可以預覽數據,都可以回退到之前的狀態。

2、分析思維主導的可視化

大家做圖表,普遍都是看數據——選擇圖表——分類、系列——美化。其實這背後隱含的前提是你已經瞭解數據了,知道用什麼圖表。那如果是一些數據,你毫無瞭解,需要深度挖掘。這時候可能用到你不知道的組合性圖表,在Excel裡自然而然想到用VBA,太麻煩了。如果用FineBI的話,可以解決這樣的思路。

5.0的可視化分析,取消了傳統圖表類型的概念,取代以'形狀'和形狀對應的'顏色','大小','提示',‘標籤’等屬性;取消了'分類'、'系列'等概念,取代以'橫軸'、 '縱軸'兩個方向。當你分析兩個數據字段的相關性時,會自動選擇最合適的圖表(也可手動調整)。這樣的思維更符合大家拿到數據不知如何分析,先初步瞭解數據情況的探索式分析場景。

數據分析工具那麼多,其實掌握這個BI就夠了!

每種圖表背後都有很強的數據分析算法,能支持百萬級別的數據。

一些FineBI 5.0實現的可視化效果:

數據分析工具那麼多,其實掌握這個BI就夠了!

數據分析工具那麼多,其實掌握這個BI就夠了!

數據分析工具那麼多,其實掌握這個BI就夠了!

3、數據挖掘

挖掘算法自然而然用R啊,多強大多專業,不過呵呵,有一定的上手難度,還需要動背後的統計原理,自己設計模型。

一直期待有傻瓜式的數據挖掘工具,只要瞭解比如“聚類”,點一下就給自動的分割數據分好類。

FineBI裡面目前瞭解到有五類自動化的挖掘算法:時間序列、聚類、分類、迴歸和關聯規則。

也就是說,如果你想預測未來的銷售額,你想智能地給用戶群分類,或者你想知道短信發給哪個用戶獲得的反饋可能性比較大,不用寫任何算法代碼只需要簡單的拖拖拽著就可以立馬看到預測和聚類的結果。

數據分析工具那麼多,其實掌握這個BI就夠了!

如果算法很特殊需要自己寫,那用他集成R語言做吧,一手寫法,一手用FineBI出可視化報告。是可以直接在FineBI中進行R語言編譯的。

數據處理

做數據分析,數據處理是最煩的,往往要佔據50%~70%的時間。

有一次,從IT部那兒要來數據,分析公司產品銷售明細數據分析購買用戶的特徵,並調整相應的銷售策略。這個時候需要基於銷售清單數據,計算一些相應的分析指標,如每個人的消費頻次,單筆消費最大金額,最近一次消費時間間隔(也就是RFM模型)。比如我還拿到了一些行業競爭數據,還需要根據同類型產品,做關聯分析和橫向對比分析。我又不能把這些數據放到數據源裡處理,只得另建數據源,將表合併處理。

ETL處理能力是考量一個BI工具好壞的指標之一 ,FineBI的自助數據集,提供了新增列,分組統計,過濾,排序,上下合併,左右合併等功能,可視化操作。

大數據高性能

重點之一:大數據性能

BI的數據處理性能很重要,這也是優勢於Excel之類的工具的因素之一。

5.0將直接對接數據庫的實時數據引擎與抽取數據的引擎整合統一為Spider計算引擎。用戶可以根據數據量、實時性要求、使用頻次等,自由選擇實時或抽取的方式。實時數據與抽取數據方式的無縫切換,將更加靈活高效支撐前端的高性能分析。

Spider數據引擎可靈活支撐不同數據量級的分析,在數據量激增之後,可橫向擴展機器節點,利用Spider引擎專為支撐海量大數據分析而生的分佈式方案。

數據分析工具那麼多,其實掌握這個BI就夠了!

spider數據引擎可靈活支撐不同數據量級的分析,在數據量激增之後,可橫向擴展機器節點,利用spider引擎專為支撐海量大數據分析而生的分佈式方案。

spider引擎分佈式方式,結合Hadoop大數據處理思路,以最輕量級的架構實現大數據量高性能分析。此分佈式方案集成了Alluxio 、Spark、 HDFS、zookeerer等大數據組件,結合自研高性能算法,列式存儲、並行內存計算、計算本地化加上高性能算法,解決大數據量分析問題與在FineBI中快速展示的問題。同時從架構上保證了計算引擎系統全年可正常使用。

優勢:

(1)引擎支撐前端快速地展示分析,真正實現億級數據,秒級展示。

(2)用戶可以根據數據量、實時性要求、使用頻次等,自由選擇實時或抽取的方式,靈活滿足實時數據分析與大數據量歷史數據分析的需求。

(3)抽取數據的高性能增量更新功能,可滿足多種數據更新場景,減少數據更新時間,減少數據庫服務器壓力。

(4)合理的引擎系統架構設計可保證全年無故障,全年可正常使用。

最打動痛點的數據管控。

企業級數據分析往往有不同層級的人,管理數據的,分析數據的,看數據的。每類人又有不同的需求。

初級分析用戶,他們的需求往往是Dashboard即席分析,結合可視化有主題的展示業務數據,實時監控,預警分析。

一些查看數據的用戶,比如領導boss們,他們的訴求就是看報告,瞭解業務狀況,輔助業務決策。BI要做到報告可讀美觀,讓用戶聚焦於理解儀表板要表達的數據含義。

為什麼經常性的要個數據要半天,要個報告要一週,因為需求太多,流程又有問題。

數據的管理是阻礙企業數據分析推行的很大原因。科技部門擔心風險,導致業務部門很簡單的需求不能得到及時響應;很多數據的需求本身時效性很高,一旦過了這個數據再拿到也已經沒有價值了;還有部分是數據給的不完整,髒數據很多,導致業務想進行的分析做到一半進行不下去,逐漸放棄…

FineBI 5.0提供了精準的企業級數據權限管控方案,管理員可以高效便捷的進行權限配置,放心大膽的交付給分析人員相關數據,無需擔心隱私數據洩露。

(1)權限統一配置。平臺統一控制權限,如業務包權限、數據錶行權限、數據表列權限等,權限控制的粒度更細緻,更科學。通過配置主表權限,所有關聯的業務表權限也會生效。

數據分析工具那麼多,其實掌握這個BI就夠了!

(2)權限智能繼承。分析人員所做的分析表默認繼承基礎數據的權限,管理員無需再擔心這些數據表的權限分配,每個閱讀用戶自動看到自己權限範圍內的數據,這有利於促進分析人員之間的分享和交流。

(3)滿足不同場景。不同場景對數據權限的要求是不同的,每個用戶有權將自己權限範圍的數據,在有需要的情況下開放給其他用戶。比如總部製作的各大區的彙總銷售額,想要讓每個用戶都可以看到,權限繼承的情況下,各大區是沒有權限看到其他大區的數據的,但是總部的分析表製作用戶有權不繼承權限,將數據開放給各大區用戶。

個人感悟

數據分析工具有很多,但能上升到幫助管控企業數據,整合、分析、分發的BI工具,FineBI值得推薦,尤其是新版FineBI 5.0,不僅是數據分析挖掘工具、數據可視化工具、更是適合多數企業複雜流程下的數據分析平臺。

關於工具,大家若感興趣,可以戳↓↓↓體驗


分享到:


相關文章: