文末有....
好久不喝星巴克了,今天天氣好,所以也就饞了,下樓買了一杯:
![幹掉星巴克!Python+BI可視化3W數據,告訴你誰才是咖啡之王](http://p2.ttnews.xyz/loading.gif)
我喝咖啡的第一反應就是星巴克,而不是瑞幸,儘管瑞幸很便宜,很會砸錢,但是我的心智還是選擇星巴克。很多人疑惑其咖啡之王的地位,今天我就給大家分析一下吧。
我回到辦公室,想看看星巴克在中國到底有多少家門店,於是python爬取數據和可視化分析就派上用場了。
主要是想分析4個點:
![幹掉星巴克!Python+BI可視化3W數據,告訴你誰才是咖啡之王](http://p2.ttnews.xyz/loading.gif)
話不多說,直接上部分代碼:
<code>temp = data.groupby('Countries and Regions')['Brand'].count().reset_index()
temp.columns = ['國家或地區','計數']
data_pair = [(row['國家或地區'], row['計數']) for _, row in temp.iterrows()]
top_country = sorted(data_pair, key=lambda x: x[1], reverse=True)[:10][::-1]
_map = (
Map(init_opts=opts.InitOpts(theme='dark'))
.add("門店",
data_pair,
"world", is_roam=False,
is_map_symbol_show=False)
.set_series_opts(label_opts=opts.LabelOpts(is_show=False))
.set_global_opts(
title_opts=opts.TitleOpts(title="星巴克門店在全球分佈",
subtitle='數據截止日期:2020年2月'),
legend_opts=opts.LegendOpts(is_show=False),
visualmap_opts=opts.VisualMapOpts(is_show=False, max_=2000,
is_piecewise=False),
)
)
_map.render_notebook()/<code>
一共爬取了3W+的數據,這只是部分代碼,完整代碼見文末。
數據取好後,就要選擇工具進行數據分析,一提到分析工具,很多人都會想到用Excel,我很多年前剛入行的時候,也是“Excel打遍天下”,但Excel數據清洗和計算效率低下,需要進行大量重複性、低附加值的人工操作,而且要做好看的圖表得花很多時間研究功能,遇到大數據量就卡的不行。
同時,很多人喜歡用echarts圖表接口或者是python的第三方庫進行數據可視化,甚至是用matlab,基本上都需要用代碼實現,在數據展示上十分繁瑣,效率不高。
我想到了一種方法:BI分析。
那個被拜耳開除的拒絕隔離的跑步女,也是拜耳BI項目的leader,想想真丟人,BI圈子它是肯定混不下去了。
敏捷BI,隨便拖拖拽拽就能生成可視化圖表,原理也很簡單,數據層由Python來進行抓取到網頁數據,解析後儲存到mysql數據庫;BI負責最後應用層的數據處理、加工和可視化。
本次BI工具用的是FineBI,對於個人來說,它永久免費,在國內BI領域,是直接對標Tableau的存在,不僅僅是性價比高,還因為:
- 30多種數據源支持,你的數據庫都能連上,口徑不統一的數據也能聯合分析
- 可以處理複雜式中報表,這是別的工具不具備的能力
- 可以自動建模,並且是利用自助數據集的方式,讓用戶能夠在人性化的操作界面進行數據處理和ETL處理,比如數據過濾、數據整合等等,能夠極大的降低用戶的數據清洗與數據加工時間
- 可視化優秀,支持聯動、下鑽、跳轉等OLAP分析操作功能,能夠幫助業務人員進行有價值的可視化分析和dashboard設計
拖拖拽拽即可生成可視化
來看看FineBI做出的星巴克數據可視化吧。
1、全球門店分佈
星巴克起源於美國,所以在美國的門店數量最多。
我們可以看見,門店主要還是集中在北美洲,亞洲,歐洲。
另外有意思的一點,整個澳大利亞只有20幾家星巴克門店,難道是澳大利亞人不愛喝咖啡嗎,其實正好相反,因為澳大利亞人太鍾愛咖啡了,澳大利亞人對咖啡的講究,就像中國人對茶的挑剔一樣,對於星巴克這種過於商業化的連鎖品牌有些難以生存。
2、擁有星巴克門店最多的城市
毫無疑問,如果國內星巴克最多的城市,那肯定是上海和北京。而且隨著時間的增加,星巴克會像羅森、全家這種便利店一樣,佈滿其大街小巷。
3、全國門店分佈情況
和上面的類似,毫無意外的最紅的三個區域——長三角,珠三角和北京,中部城市以成都為首。
我偷偷的告訴你top5:北上杭深廣,這要放在10年前肯定沒有杭州。但隨著互聯網的發展,基建速度和這個城市的數字化速度成正比,每座城市都有屬於自己的IT企業。
4、門店所有權分佈
這個得解釋一下,星巴克的經營種類分4個:
其實分析這個,不是想讓大家對星巴克增加了解,而是想教會大家在很短的時間內,可以自己上手,用BI工具做出一個數據可視化,Excel的數據透視表就別想了,可視化太醜,還要會VBA,性價比太低了。
最後來談談BI工具直接的區別吧。
FineBI畢竟是國產工具,基礎的學習文檔還是教學視頻資料都很豐富,另外還有著非常活躍的帆軟中文社區供所有用戶進行學習交流。
企業級方面,主要涉及部署項目和技術服務方面。Tableau和powerbi這塊是代理商在管,所以你懂得,和帆軟本土服務(前方售前技術),後方技術支持,無法比。有一次請教一個使用問題,麻煩了人家技術支持半天,又是遠程又是給文檔的。
最後,工具好不好,自己嘗試了就知道,大家不妨自己下載嘗試!
關注我,並轉發該文章,私信回覆“星巴克”,即可獲得FineBI個人永久免費版和python代碼!
閱讀更多 IT技術管理那些事兒 的文章