大数据告诉你我国什么地方吃货最多,快来看看你们所在城市怎样

本文阅读大概需要10分钟,阅读完本文将有助你了解我国什么地区收入最高,什么地区的人更愿意花钱,什么地区的人更愿意把钱花在吃上,什么地区的人更愿意把钱花在吃上还有成为吃货所在地他们的原因是什么。

中国至古以来就是一个善吃的国家。不仅人要吃,鬼神山水树木都要吃,如果你了解中国的饮食文化你就会了解中国人在吃上面很有讲究,不仅讲究色香味应有尽有还要讲究形神道一应俱全,既要有十里飘香又要有余音绕梁般的回味无穷,所以产生了中国著名的川菜、鲁菜、粤菜、苏菜、浙菜、闽菜、湘菜、徽菜八大菜系,又不乏有各地的名吃。今天明明同学就用大数据告诉你我国什么地方吃货最多(本文所有数据均来自中华人民共和国国家统计局,本文的数据分析及可视化均在R语言中完成)。

抽象问题,提出假设

我们的目标是为了得到我国什么省市吃货最多,把这个问题抽象化也就是说我国什么省市的人更愿意把钱花在餐饮上,因此我们围绕着影响人们在餐饮上消费的可能情况做如下假设

假设1:各省市人们饮食消费和他们的收入有一定正相关关系,即收入越高饮食消费越高。

假设2:各省市人们饮食消费和当地餐饮行业数量呈正相关,即餐饮店数量越多人们在餐饮上的消费越高。

假设3:各省市人们饮食消费和当地餐饮行业从业人数呈正相关,即餐饮行业从业人数越多人们在餐饮上的消费越高。

获取数据

整理数据

为了方便以后的数据计算和分析,我们把获取到的所有数据整合到一张数据表里面。人均餐饮消费支出数据没有得到这里

人均餐饮消费支出 = (餐饮行业餐费收入+连锁企业营业额收入)/各省市总人数。

创建一个表示人们愿意把钱花在餐饮上的指标:人均餐饮消费率

人均餐饮消费率指 = 人均餐饮消费支出/总支出的比例

可视化探索各个变量情况

经过数据获取和整理工作后,在这一步我们就需要基于我们的假设进行各个变量的可视化探索

1、各省市人均收入

大数据告诉你我国什么地方吃货最多,快来看看你们所在城市怎样

图为:2013-2016四年各省市人均收入累计图

大数据告诉你我国什么地方吃货最多,快来看看你们所在城市怎样

图为:2013-2016四年各省市人均4年平均收入箱线图

图中可以看出连续4年,人均收入最高的有北京、上海远远高于其他城市收入,4年总收入均在18万以上,第二档次的有浙江、天津、江苏和广东,4年总收入在10万以上,其他城市在10万一下。大部分省份年人均收入在15000到20000左右。

2、连锁餐饮企业门店个数

大数据告诉你我国什么地方吃货最多,快来看看你们所在城市怎样

图为:2013-2016四年连锁餐饮企业门店个数各地区平均值

图中可以看出连锁门店个数在4000以上的只有北京市,3000-4000只有广东省,2000-3000有上海和重庆,收入总和第六的广东省和没有进入前十的重庆市在连锁门店数量上竟然分别排到了第二和第四,广东和重庆小吃果然名不虚传。

3、餐饮行业从业人数

大数据告诉你我国什么地方吃货最多,快来看看你们所在城市怎样

图为:2013-2016四年连锁餐行业从业人数各地区平均值

4、人均消费率

将人均消费支出/人均收入得到不同地区的人均消费率如下图所示

大数据告诉你我国什么地方吃货最多,快来看看你们所在城市怎样

图为:各省市人均消费率

5、用于餐饮的消费率

将人均用于餐饮的消费/总的消费支出的到餐饮消费率。

大数据告诉你我国什么地方吃货最多,快来看看你们所在城市怎样

图为:各省市人均餐饮消费率

看到这相比大家都已经看出来了,在餐饮上的消费比率排名前三甲的是北京市、上海市、重庆市,远远高于其他地区。北京地区甚至有10%的花费比率在餐饮上,上海有9%的花在餐饮上。可见北京、上海、重庆是实实在在的吃货所在地。到此我们基本上已经完成了对吃货所在地的结论,关于你的省份的吃货排第几自己根据图中数据对号入座吧。

下面我们还想了解哪些因素使这些地方成为吃货所在地,为此我们进行了下面的模型探索。

建立数据模型

通过以上分析可知,收入高的地区人们在餐饮上的花费比较高例如北京和上海,而连锁门店多的地方人们在餐饮上的花费也比较多比如重庆,而餐饮行业从业人数视乎和人们餐饮消费不是太大。为了获得人均收入、连锁门店个数、餐饮行业从业人数这三个那个对人们餐饮消费贡献率大,做如下数据模型。

1、构建人均收入和消费率的模型

大数据告诉你我国什么地方吃货最多,快来看看你们所在城市怎样

图为:各省市人均餐饮消费率与收入的拟合曲线

整体看来收入高的地区人均餐饮消费率也高,但是地区之间差异挺大的。比如重庆市人均年收入在20000左右,但是消费率同等收入的其他地区高出几个百分点。还可以发现人均收入不同阶段消费率不一样,除了人均年收入40000以上的北京上海之外,其他地区拟合曲线比较平缓,但是到40000餐饮消费率就指数上涨,说明收入高的人群更容易在吃上花费。

2、构建连锁门店数量和消费率的模型

大数据告诉你我国什么地方吃货最多,快来看看你们所在城市怎样

图为:各省市人均餐饮消费率与连锁门店个数的拟合曲线

从图中可以看出拟合曲线整体比较平滑,没有出现跳跃的情况,说明连餐饮锁门店个数的确能够刺激人们餐饮消费水平。不够广东省比较特殊,连锁门店个数不少但是人均餐饮消费不高,可能是广东省外来务工人员比较多,生活压力大,餐饮行业消费少吧。

3、构建餐饮行业从业人数和消费率的模型

大数据告诉你我国什么地方吃货最多,快来看看你们所在城市怎样

图为:各省市人均餐饮行业从业人数与餐饮消费率拟合曲线

整体来看餐饮行业从业人与餐饮消费率之间的关系受地区影响很大。就图中可以看到当从业人数一定数量之下,随着从业人数的增加餐饮消费率增高,但是超过这个数量后这样增高的趋势已经不太显著了。

3、构建餐饮消费率与人均收入、门店个数、和从业人数的模型

大数据告诉你我国什么地方吃货最多,快来看看你们所在城市怎样

图为:多元显著性模型结果

图中与0值有交集的代表该参数对模型不显著,图中可以看出连锁门店数对人们餐饮消费率影响更大。餐饮业从业人数对模型不显著。

到此我们基本上可以得出结论了,中国吃货所在地为北京、上海、重庆。他们之所以会成为吃货所在地,要么是因为人均收入高而且吃的多(北京、上海),要么是因为历史悠久吃的多(重庆)


分享到:


相關文章: