重慶火鍋哪家強,Python 幫你探探店

重慶火鍋哪家強,Python 幫你探探店

作者 | 劉早起

來源 | 早起Python

封圖 | 視覺中國

大家好,隨著國內疫情逐步好轉,一些美食店鋪又漸漸開張了,疫情結束你最想吃什麼?來一頓痛快的火鍋肯定是少不了的活動吧。可是對於選擇困難症的我來說,吃飯一小時,挑店一下午,所以今天本文將再次爬取美團網相關數據,以一個消費者的角度去分析如何選擇店鋪。

重慶火鍋哪家強,Python 幫你探探店

數據獲取與說明

本文將基於重慶市火鍋數據進行分析,為啥是重慶的火鍋,除了辣之外還因為其他城市的火鍋店數量相比重慶的火鍋店數量就是小巫見大巫。

重慶火鍋哪家強,Python 幫你探探店重慶火鍋哪家強,Python 幫你探探店

除此之外,相信重慶人民對於火鍋的評價會更加地道,所以我們打開重慶市美團網選擇火鍋進入店鋪列表。接下來的操作就和之前類似了:F12—>找到數據包—>requests請求數據—>pandas清洗。

重慶火鍋哪家強,Python 幫你探探店

但是本文需要爬取兩層數據,首先需要在店鋪列表取得店鋪id、店鋪名和銷量等相關數據,第二步還需要根據剛剛的店鋪id進入每一個店鋪請求評論數據,相關代碼如下:

for k in url_list:
url = k
r = requests.get(url,headers = headers,proxies=proxies)
data = r.json['data']['poiInfos']

for i in range(len(data)):
ID = data[i]['poiId']
biaoti = data[i]['title']
junfen = data[i]['avgScore']
pingjia = data[i]['allCommentNum']
dizhi = data[i]['address'][0:3]
junjia = data[i]['avgPrice']
youhui = 1 if len(data[i]['dealList']) > 0 else 0
df.loc[s] = [ID,biaoti,junfen,pingjia,dizhi,junjia,youhui]
s = s + 1

來看下最終爬取並清洗完畢的數據,經過提取共有評論數據、店鋪基本信息數據、評論標籤數據👇

重慶火鍋哪家強,Python 幫你探探店重慶火鍋哪家強,Python 幫你探探店
重慶火鍋哪家強,Python 幫你探探店

去哪吃

首先看下重慶市不同地區的火鍋店分佈,找火鍋店嘛,總要找火鍋店多的地區,這樣能選擇的店鋪也更多:

重慶火鍋哪家強,Python 幫你探探店

從上圖可以看到,重慶市的火鍋店基本集中在渝中區、渝北區、沙坪壩區、南岸區,並且經過進一步的計算可以得到這四個區的火鍋店總數為388家,在所有進入統計的重慶市27個區縣共750家店鋪中佔到了超過一半,所以優先去這四個區,十步一家火鍋店,總有你要的!

重慶火鍋哪家強,Python 幫你探探店

什麼時候吃

在對地點分析之後,我們來對吃火鍋的時間進行分析,以評論數量代替同時吃火鍋的人數,並使用Pandas提取含有時間的評論並進行整理得到不同時間的人流量與平均評分:

重慶火鍋哪家強,Python 幫你探探店

從上圖可以看到,重慶人民吃火鍋的時間集中在下午和晚上,並且高峰期集中在晚上7點至11點,所以想安安靜靜吃火鍋可以避開這段時間。不過從整體評價來看下午的評價不太好,反而晚上10點之後的評價比較高,可能是大家對於老闆也耐心等候表示認可👇

重慶火鍋哪家強,Python 幫你探探店
重慶火鍋哪家強,Python 幫你探探店

選什麼標籤

每個店鋪下的評價都有顧客評價的標籤:

重慶火鍋哪家強,Python 幫你探探店

本節我們通過繪製好評用戶的矩形數圖來看下帶有哪些標籤的火鍋店獲得的好評更多:

重慶火鍋哪家強,Python 幫你探探店

從上圖可以看出除了味道贊,重慶人更喜歡去回頭客多、上菜快的店鋪,所以當我們尋找一家火鍋店的時候,點開店鋪評價,按照帶有上面標籤找準沒錯。

重慶火鍋哪家強,Python 幫你探探店

選什麼價格

在挑選一家火鍋店的時候,價格也是很重要的一項參考指標,本節對人均價格繪製直方圖同時添加對應價格的平均分曲線👇

重慶火鍋哪家強,Python 幫你探探店

可以看到,雖然重慶火鍋店多,但是人均價格超過一百的並不多,大多集中在50—80之間,並且不是越便宜得到的評分越高,反而平均分最高的一個價格區間為100-110,其次是70-80,所以想要火鍋吃的爽,至少準備一百塊。

重慶火鍋哪家強,Python 幫你探探店

要不要優惠

相信大家都會在去吃火鍋之前看下商家是否有代金券/團購,所以本節使用箱線圖對重慶市火鍋店的優惠信息進行分析:

重慶火鍋哪家強,Python 幫你探探店

圖中箱子越寬說明數量越多,可以看到大部分商家是出售代金券的,是否有代金券對於高分評價沒啥影響,但是有代金券的最低分是0分而沒有代金券的商家最低分是3+,所以並不是一定要選有優惠的,有時沒有優惠可能體驗更好哦。

重慶火鍋哪家強,Python 幫你探探店

吃什麼菜

假設通過上面的分析,我們已經找到了一家火鍋店準備開吃,本節繼續通過提取評論關鍵詞來看看網友愛點什麼菜:

重慶火鍋哪家強,Python 幫你探探店

從上圖可以看到,最受重慶人民喜愛的肉是牛肉,蔬菜愛選豆芽,喜歡吃油碟的人更多,當然羊肉、毛肚也不能少。

重慶火鍋哪家強,Python 幫你探探店

大家都在說什麼

在對店鋪的影響因素分析完之後,本節對採集到的近萬條評論數據進行詞雲分析,看看大家都在說什麼:

重慶火鍋哪家強,Python 幫你探探店

可以看到除了味道,大家評論的熱點還有服務、服務員、環境,看來重慶火鍋的服務相關還是很重要的參考指標。

重慶火鍋哪家強,Python 幫你探探店

高分用戶怎麼說

在我們獲取的評論數據中,用戶是有等級的,根據查找美團相關資料知道這些等級是根據用戶的消費次數、評價質量等多個維度計算得到,相信他們的評價更具有參考價值:

重慶火鍋哪家強,Python 幫你探探店

我們看看高分用戶怎麼說:

重慶火鍋哪家強,Python 幫你探探店

可以看到除了味道和服務,份量、新鮮、團購、配菜等都是他們喜歡點評的,所以我們也可以根據這些標籤選擇,可是等等,怎麼老闆娘也成了熱詞。

以上就是一次爬取重慶市火鍋數據並分析的過程,當然這些數據可以進行的分析遠不止這些,如果近期有打算來一頓重慶火鍋的讀者可以試著自己去分析一下,記得在看哦,拜拜~

注1:數據採集於美團網公開數據,採集時間為4月16日,數據內容及其解釋權歸美團網所有。

注2:因本次數據含有商家、用戶等信息故不再提供。

重慶火鍋哪家強,Python 幫你探探店

☞訊飛智能語音先鋒者:等到人機交互與人類交流一樣自然時,真正的智能時代就來了!

☞企業打造自己的數據中臺,需要的是一套硅谷方法論(文末有福利!)

☞從Nginx到Pandownload,程序員如何避免面向監獄編程?

☞只會高中數學運算就能發現算法?Google開源的AutoML-Zero有多厲害

☞Spring Cloud雲架構下的微服務架構:部門微服務(Dept)

☞從Spring Cloud到Service Mesh,微服務架構治理體系如何演進?


分享到:


相關文章: