图表分析2020年和2018年北京积分落户数据

大数据 数据分析
一年一度的积分落户工作马上要开始了,刚好对于2020年的分数情况还做了一些统计,总体的感觉就是:水涨船高。

[[393457]]

 一年一度的积分落户工作马上要开始了,刚好对于2020年的分数情况还做了一些统计,总体的感觉就是:水涨船高。

2020年10月15日,2019年北京积分落户人员名单出炉:最低分值93.58分,6007人最终成为“锦鲤”。

背景信息:

2016年8月11日,北京市积分落户管理办法(试行)发布。本市积分落户自2017年1月1日起施行,每年申请一次。

2018年4月11日,发布《北京市积分落户操作管理细则》,4月16日将正式开放在线系统,接受社会申报。

对于年年陪跑的我,还是耐不住寂寞做了下分析,假设我们看到的数据是这样的,有公示编号和姓名,出生年月,公司和积分,而且今年还对积分的明细做了公示。

公示编号 姓名 出生年月 单位名称 积分分值
100001 小王 9/1/1980 北京很厉害的公司 100.12

明细的公示如下,可以看到这些牛人的积分段位。

对于这些信息,我们可以分析出什么呢,我做了下拆解:

1)分析这些牛人的分数段

2)分析这些牛人的年龄段

3)分析哪些公司的中签牛人多

4)分析中签牛人的公司类型

1)中签牛人的分数段

可以看到97分靠线的人的比例很高,集中在97-101分之间,可见竞争是非常激烈的,已经很多人超越满分了。

相比于前两年,分数有了明显提高,如下是第一次积分落户的分数段数据,集中在90-95,亚历山大。

如果想换种方式看分数占比和总数的比例,可以使用如下的图来表达:

2)分析这些牛人的年龄段

年龄段是一个很有说服力的指标,我们看看他们的年龄段。

从指标可以看出,清一色是70后,已经有一小批80年的人开始扩张,而85后的机会相对很低。

如下是完整的数据列表,我的天,85后只有4位,恭喜他们。 

1961 2
1962 3
1963 5
1964 6
1965 8
1966 9
1967 10
1968 6
1969 27
1970 85
1971 107
1972 108
1973 329
1974 365
1975 507
1976 636
1977 751
1978 808
1979 741
1980 644
1981 468
1982 290
1983 83
1984 30
1985 3
1988 1
 

3)分析哪些公司的中签牛人多

中签的牛人所在的公司也能间接反映出公司实力,我抓取了一个标签云图,可以看到华为是遥遥领先,就这还不算华为研究所,其次赢家是电视台。

这个数据,包括名次和前2年差别不大。

4)分析中签牛人的公司类型

可以看到绝大多数的公司都是有限公司,此外一些出版社,研究院和事务所,大学也有有一定的比例。 

有限公司 3710
有限责任公司 213
出版社 16
研究院 14
事务所
43
大学 6
电视台 1
 

然后再来看看2018年的数据分析

2019年5月16日,市人力社保局发布消息,北京市2019年积分落户申报工作将于5月22日正式启动,申报期60天。

目前官方公布的数据为2018年的积分落户数据,通过对数据的分析,可以了解整体的比例和分布情况。

今天使用Python实现做了下数据分析,结合pandas, numpy, matplotlib, pyecharts等插件通过可视化的方式进行数据统计分析,以柱状图,饼图,地图,表格等形式展示数据的分布情况。

直接给出测试过程。

1 环境配置

Python

版本:3.8

插件

pandas

numpy

matplotlib

pyecharts


2 分数分布

2.1 分数按照5分为粒度进行统计

2.2 分数整体饼图统计

绝大多数的比例集中在90-95分,95~100分的区段次之,如果想得到更细粒度的数据,可以使用饼图查看。

其中,

90~95分的比例占到了55.6%

95~100分的比例占到了29.2%

100~105分的比例占到了10.8%

105分以上的比例占用不到5%

2.3 分数按照1分为粒度统计

在此基础上进行信息下钻,积分粒度按照1分来计算,可以看到90~91分的区段人数最多,90分压线的有300人左右。

3 年龄分布

3.1 细分年龄层次饼图

从饼图分布来看,

40~45岁的落户比例较高,为50.5%

35~40岁的落户比例次之,为42.2%

30~35岁的落户比例极低,为2.7%左右

45~50岁的落户比例较低,为4.3%

55~60岁的落户比例更低,为0.2%左右

3.2 细分年龄层次按照1岁为粒度进行统计

其中37~44岁为积分落户人数覆盖范围最多的年龄段,30~35岁的区段还是极少的比例。

4 公司分布

4.1 按照公司进行统计

公司情况如下:

北京华为数字技术有限公司

137

中央电视台

73

北京首钢建设集团有限公司

57

百度在线网络技术(北京)有限公司

55

联想(北京)有限公司

48

中国民生银行股份有限公司

40

北京外企人力资源服务有限公司

40

国际商业机器(中国)投资有限公司

39

中国国际技术智力合作有限公司

29

华为技术有限公司北京研究所

27

爱立信(中国)通信有限公司

26

腾讯科技(北京)有限公司

24

北京阿里巴巴云计算技术有限公司

23

中国石油天然气股份有限公司管道北京输油气分公司

20

用友软件股份有限公司

20

中铁建工集团有限公司

19

微软(中国)有限公司

17

中信银行股份有限公司

17

中煤建设集团工程有限公司

17

甲骨文(中国)软件系统有限公司

16

西门子(中国)有限公司

16

北京市京才实业开发总公司

16

中国光大银行股份有限公司

16

中铁电气化局集团有限公司

15

中铁三局集团第四工程有限公司

15


行业集中在华为,百度,爱立信,联想等公司,包括一些大型央企。

5 省份分布

5.1省份分布如下表所示: 

河北

894

辽宁

484

山东

445

黑龙江

444

内蒙古

340

山西

316

吉林

309

河南

309

湖北

290

天津

239

四川

225

湖南

210

江苏

210

陕西

207

江西

191

安徽

184

甘肃

109

北京

97

浙江

90

新疆

80

福建

79

宁夏

51

广西

44

贵州

40

广东

37

青海

34

云南

31

上海

18

海南

10

西藏

1

重庆

1


其中河北,辽宁,山东,黑龙江占据较高比例,地域和北京有直接联系,而重庆,西藏,海南,云南的比例较低,上海主观猜测因为城市自身竞争力原因也处于末尾。

而且让我有些奇怪的是有些已经是北京户口了,怎么还要申请北京户口?

5.2 省份数据地图分布

本文转载自微信公众号「杨建荣的学习笔记」,作者杨建荣。转载本文请联系杨建荣的学习笔记公众号。  

 

 

责任编辑:武晓燕 来源: 杨建荣的学习笔记
相关推荐

2020-01-06 11:38:11

大数据机器学习人工智能

2019-11-18 20:43:49

大数据分析Gartner

2020-02-10 10:59:44

大数据IT技术

2018-11-21 14:38:09

分析在数据电影

2020-05-26 10:56:49

数据分析大数据数据

2020-03-03 13:42:08

数据存储数据存储

2018-04-02 12:02:16

数据安全防火墙动态安全

2020-02-09 13:26:22

数据分析数据大数据

2018-05-10 09:00:57

数据分析工具可视化

2020-07-07 12:06:58

大数据数据分析工具

2020-02-09 17:22:27

5大数据分析预测

2018-03-02 11:46:35

数据分析中小型企业

2021-02-06 10:12:28

Emotet木马漏洞

2018-12-05 13:59:45

电影分析爬虫

2017-12-15 15:46:33

Java编程语言IT

2020-12-31 10:30:12

AI数据分析人工智能

2020-01-20 14:02:07

大数据IT物联网

2018-02-27 13:09:00

Hadoop数据仓库魔力象限

2020-06-11 07:00:00

数据分析BI平台

2020-07-22 11:26:05

5G运营商技术
点赞
收藏

51CTO技术栈公众号