能製作可視化報告的方式有千千萬。
Excel控若能輕車熟路駕馭VBA,能玩出各種花來,再不濟藉助圖表插件外援也能秒殺一眾小白選手。
會編程的,Echarts幾十行代碼,分分鐘出秀;R語言玩得一手數據挖掘,可視化自不在話下;Python爬數據達人,手握matplotlib包打天下。
這麼多工具,從哪個入手較好?這也是很多人犯難的。
其實,數據分析大家大可不必垂涎於工具。對於絕大多數的我們,需求在於從萬千數據中統計出一些規律,或者某些業務問題想通過分析數據的方法得到求證。
分析工具更多的價值在於輔助分析過程中數據的處理,能夠將結論以可視化的方式直觀展,最終解決問題。如果在功能上能做到避免寫公式寫代碼,易上手易用,那就更好了
筆者一直主張用BI分析,於數據分析師,節省時間提高效率。於入門,BI也是最簡單最好上手的可視化分析工具。
之前分享了《 》,講解了FineBI的主要功能、特點和基本使用方法。
今天想著重於數據分析的過程,使用FineBI來打造數據分析師的Dashboard報表。
為了更好的幫助大家嘗試和實踐,文尾公開了數據源及報告展現地址,供大家學習和練習。
一、數據分析的操作思路
數據分析通常是這樣切入的,比方說業務上發生了變化,流量下降20%,那麼我們就要分析可能的原因,需要多方數據去驗證假設。又或者拿到一份數據,思考可以分析的規律點。無論哪種情況,一個完整的數據分析都需要經歷數據獲取、數據預處理、數據分析與建模、可視化分析及報告撰寫的過程。
FineBI的功能模塊也是依據這樣的分析流程來分的,分為數據連接、數據準備、可視化分析、儀表板駕駛艙、分享儀表板等。
二、認識這個工具——FineBI的工作區
![實戰秘籍|教你10分鐘搞定一份可視化報告!](http://p2.ttnews.xyz/loading.gif)
官網安裝好合適的版本,成功激活,設置初始賬號密碼後,會跳轉到這個web頁面。
左側是導航欄,類似於菜單欄。目錄類似首頁,展現已完成的分析報告,這裡默認展現官方的內置demo。
數據準備是連接數據、準備數據,以及對數據進行再加工處理的地方,可進行業務包、數據表、關聯、多路徑、數據更新、自助數據集等管理。
儀表板即創建可視化分析。管理系統即對整個數據決策系統進行管理的地方,包括目錄的設置、外觀設置、數據、報表、分享權限等管理配置。
創建是提供給用戶快捷新建數據連接、添加數據庫表、添加SQL數據集、添加EXCEL數據集、添加自助數據集、新建儀表板的地方。
三、連接/導入數據
製作數據報告,第一步是導入數據,FineBI能從很多種數據源導入數據:如Excel,CSV,XML,以及各類數據庫(SQL Server,Oracle,My SQL等),兩大主流開源平臺(Hadoop,Spark)等等。最常用的方式是連接數據庫和導入excel數據。兩種方式因為最常用,所以這裡都演示操作一遍。
1、數據庫連接舉例:連接mysql
![實戰秘籍|教你10分鐘搞定一份可視化報告!](http://p2.ttnews.xyz/loading.gif)
2、導入excel數據
同樣的數據,用一份excel導入。
第一步:數據準備—添加業務包,業務包是用來統一整理數據表的。這裡創建一個颱風數據包。點擊添加表,新建excel數據集。
就得到如下的數據明細。這裡可以自動識別數據的字段類型,也可以修改字段類型。(舉例:有些情況下將時間識別成文本類型,需要手動切換成時間類型,不然會影響後續操作)
至此,數據就導入成功。
四、數據塑性—自助數據集
自助數據集其實是數據加工的環節。一般我們拿到的數據往往是有空缺值有重複,所謂髒數據,髒數據需要清理,關於數據清洗的處理可以寫5000字篇,這裡就不多講了。更常見的情況是分析中需要新建一些字段,這是源數據所沒有的。這時候就可以根據需求對原數據進行再加工處理,新建一個用於分析的數據集。再處理的操作包括:選擇字段、過濾、分組彙總、新增列、字段設置、排序、左右合併、上下合併、挖掘。
這裡因為分析的比較簡單,且原始數據已經很規範,所以暫時還不需要對源數據表進行這些操作,且一些過濾操作可以放到後面創建分析圖表的過程中去做。
其實,在自助數據集之前,有個功能沒講到。FineBI有個管理員的說法,這在企業部署中會涉及。管理員可以給不用人分配不同權限下的數據,比如財務的只能看財務和銷售的數據,或者一部分財務人員只能看到特定的業務包裡的數據,或者部分數據表,這些都是出於數據安全以及流程管理考慮。在管理員準備好數據後,就可以分配給不同人員賬號,以及部分權限的數據。如果是個人使用,比如本文所要介紹的分析,BI系統是部署在自己本地的,那自己就是管理員,擁有最高權限。本文的分析暫時不需要用到權限功能,這裡只做簡單介紹。
五、可視化分析
到這裡數據準備好了,接下來開始正式分析。
先來觀察這份數據,這份數據是我從網上當下來的,展示了1945年——2015年登陸我國的颱風信息,包括時間、登陸省市以及颱風強度。
那麼我們可以彙總統計下歷年來颱風最常光顧的省份和城市有哪些,一年中哪個時間段是颱風頻發日,以及颱風強度分佈。
1、 新建儀表板,即我們說的可視化報告、dashboard,叫法很多。
2、 新建可視化組件,添加剛剛導入的數據集。(圖表、查詢篩選框等都叫組件,是finebi儀表板的組成元素。)
分析1:各年度登陸我國的颱風數量
添加完數據集會進入到這個分析界面。拖拽要分析的字段(記錄數—統計颱風數量的指標,登陸時間——這裡只展示年份這個維度)
這裡要注意,源數據表中一個颱風有多行記錄,那是因為颱風可能同時登陸兩個區域,記錄了兩條信息,所以記錄數要依賴CMA編號統計(記錄數右側小三角下拉),以免重複。
其次,這裡又添加了一個統計每年臺風平均數的指標。
最後再對次圖表稍加美化,通常在圖形屬性和組件樣式中:
① 修改線條顏色:圖形屬性—顏色
② 修改連線為平滑曲線,並且可調整有無標記點
③ 修改該組件標題:組件樣式—標題,可調整字體樣式
最終得到如下成圖:
能明顯感覺到登陸我國的颱風呈現一個2~4年的波動變化,且2000年以來,直擊我國的颱風整體數量有略微下降。
分析2:颱風登陸各省沿海城市分佈—數據地圖
這裡演示一下數據地圖的製作,用地圖直觀展現颱風登陸我國沿海各省市的分佈。
必須將維度創建成地圖角色,生成經緯度。
匹配好數據後生成省份(經度)、省份(緯度)字段。這裡要注意檢查一些匹配是否正確,我就遇到把遼寧省匹配成寧夏的bug,匹配有問題可以隨時調整。
然後將字段分別拖至橫軸和縱軸,會自動生成一個填充地圖。除此之外還有點地圖、熱力地圖等,這裡就用填充地圖舉例。
填充地圖顧名思義,就是用區域的顏色區分數值大小。這裡將記錄數拖拽到圖形屬性-顏色,即可看到區分,(顏色可在下拉框中自行選取)。再將記錄數拖拽到標籤,即可顯示登陸該省市的颱風數量。
在組件樣式——背景中,可以修改GIS地圖樣式,如下:
注:關於圖表組件的樣式,比如標題名(字體大小顏色)、軸線、配色,圖表佈局等都可在圖形屬性和組件樣式中選擇。選項非常多,請讀者們自行發揮自己的美學天賦吧!關於數值的計算、過濾排序等操作,都可在橫軸、縱軸的指標維度下拉框中找到。
六、可視化報告
其他分析大同小異,篇幅有限,以上只舉了兩個例子。
圖表分析組件完成之後,就是構建可視化報告(dashboard)了。
儀表盤樣式中有預設的模板可以直接套用,以下是筆者隨便套用的一個模板,更具模板的風格,後面調整了每個圖表的樣式和配色。好不好看全看個人審美了。
小結
總的來說,使用FineBI製作可視化報表,最關鍵的還是在於數據處理,數據處理好了,報表繪製起來才能得心應手。由於數據之前在excel裡已經做了一些處理,所以拿到的數據基本可以直接上手分析。
在充分掌握了數據處理技巧後,就可以將更多精力放在各種各樣的可視化圖形上。FineBI內置了很多配色及風格,接下來大家可以盡情發揮自己的想象力製作各種酷炫的可視化報表,儘量搞清楚可視化製作中所有內置圖形的繪製方法,以及樣式調整。
最後,附學習資料
1、Mysql數據源
- URL:jdbc:mysql://192.168.0.108/a
- 用戶名:root
- 密碼:123456
2、Excel資料可私心回覆“可視化報告”獲得!
3、FineBI 下載學習,點↓↓↓“瞭解更多”
閱讀更多 數據分析不是個事兒 的文章