五一去哪里人最少?爬取3000条数据,分析出性价比最好的地方

大数据 数据分析
从实际效果上看更能证明,距离五一假期还有整整一个星期,各大旅游出行app上的火车票、机票、热门景点门票、酒店民宿就已经被抢售一空了,今年的旅游出行将是五一假期最火热的内容。

眼见马上就要五一小长假了,估计不少人都在计划出游的计划,然而老李看了看今年的五一假期安排,仔细算了下发现五一调休竟然只有一天。

[[395884]]

因为在“美名其曰”的五天假期里,有两天是周末,有两天是前后两周调休,有半天是青年节,只有半天是劳动节,这样的放假方式让很多人都感到不满,当然也包括老李。

其实今年假期如此安排,就是为了弥补去年因为疫情而备受打击的旅游业,主要目的就是为了拉动经济增长,促使大家进行消费。

调休2天,从放假天数看是多此一举,但是5天假期和3天假期在刺激GDP方面是质变,比如旅游业,5天可以出省游,3天一般只能本地游,前者促进消费的能力远高于后者。

而从实际效果上看更能证明,距离五一假期还有整整一个星期,各大旅游出行app上的火车票、机票、热门景点门票、酒店民宿就已经被抢售一空了,今年的旅游出行将是五一假期最火热的内容。

而年年假期景点都是人山人海,怎么避免高峰人群、享受性价比最高的旅游出行计划呢?老李今天特意从网上爬取了3000多条数据,打包成了3个Excel表,导入到FineBI里进行数据分析,看一看今年什么地方最值得去!

数据准备

数据源的爬取这里不说了,很简单的爬取过程,爬取过程大家可以参考老李之前的文章,总共爬取了3605条数据,部分数据如下:

下面就要进行简单的数据处理和加工了,一般在Excel里就可以实现简单的数据清洗,但是excel的可视化程度太低,所以这次我选择用专业的数据分析工具——FineBI进行数据可视化(看文末):

FineBI可视化

首先进行数据导入,FineBI可以直接导入本地的数据源,如excel表、sql表等,也可以连接数据库,从数据库里直接取数,适合企业级的大数据抽取。当然这里就没必要了,直接导入excel表:

 

导入数据之后我们可以新建一个自助数据集进行处理,为什么要新建一个呢?原因是为了防止直接对源数据表进行处理造成的数据更改和破坏,相当于复制了一个表,再怎么对这个表处理也不会破坏源表的数据了:

这次要分析的数据还算是比较干净,因此不需要太多的加工处理,直接创建可视化组件就行了:

在可视化后台中,只需要将分析的字段拖拽到横纵坐标轴、选择对应的图表类型就可以了,如下图所示:

其中的过程也不详细介绍了,大家感兴趣的可以自己下载尝试一下,下面直接给大家展示分析结果。

可视化分析

1、全国哪里旅游的人最多


可以看到五一假期期间,大部人还是选择去南部旅游,江西省是五一期间全国旅游人数最多的省份,以及湖南省、贵州省、广东省、福建省都是旅游热门省份;

近年来越来越多人喜欢去西部进行旅游,新疆、甘肃、宁夏都是近几年非常火热的旅游地点,而山东、河南、陕西省等则是依靠文化底蕴吸引了不少人;

比较意外的是东三省和四川的旅游人数并不多。

2、全国旅游收入最高的省份


江西省毫无疑问是五一假期旅游收入和旅游人数的双料冠军,整体与上图的情况是差不多的;

3、哪些城市最受欢迎?

上图展示了五一假期销售门票最多的10个城市,可以看出虽然江苏、湖南是旅游人数最多的省份,但是从旅游城市上看,浙江杭州、上海、北京和香港才是最受欢迎的旅游城市;

4、哪些城市的好评最高?

上图从app里收到的好评率为主,可以看出旅客最满意的城市是武汉、海口、澳门等,属于旅游人数少、好评率高的旅游城市,十分建议大家去;

5、门票打折最优惠的地方?

在五一假期海南的琼海市的优惠促销力度最大,平均折扣是6.9折,其次是澳门、扬州、重庆的平均优惠力度也很大;

6、平均门票最便宜的地方?

肇庆、成都、南宁等城市的平均门票价格是最低的,其次扬州、阳江、清远、青岛的门票价格也基本偏低;

 

责任编辑:华轩 来源: 今日头条
相关推荐

2015-07-22 10:45:02

QQ数据大数据分析数据泄露

2018-06-21 09:12:01

编程语言Python数据分析

2022-04-06 14:15:10

Python数据

2016-04-01 11:09:19

2022-06-15 08:25:07

Python天气数据可视化分析

2012-04-01 15:07:32

开源设计工具

2013-06-08 10:10:36

IBM技术微博

2023-06-18 23:13:27

MySQL服务器客户端

2020-11-05 08:23:24

数据爬取数据分析爬虫

2016-12-22 17:01:11

2023-08-28 13:36:00

AI模型

2021-06-04 12:56:22

数据分析岗位

2019-04-28 14:24:54

吴亦凡流量数据

2011-04-27 11:02:39

投影机

2021-11-03 09:49:25

Python可视化数据

2019-06-24 11:07:34

数据数据库存储

2021-11-01 22:29:28

Python数据单身

2022-07-12 09:55:34

Selenium爬取数据

2019-01-02 12:23:30

Python金融数据爬取

2016-01-22 12:20:11

PHP数据爬取分析
点赞
收藏

51CTO技术栈公众号