一年一度的积分落户工作马上要开始了,刚好对于2020年的分数情况还做了一些统计,总体的感觉就是:水涨船高。
2020年10月15日,2019年北京积分落户人员名单出炉:最低分值93.58分,6007人最终成为“锦鲤”。
背景信息:
2016年8月11日,北京市积分落户管理办法(试行)发布。本市积分落户自2017年1月1日起施行,每年申请一次。
2018年4月11日,发布《北京市积分落户操作管理细则》,4月16日将正式开放在线系统,接受社会申报。
对于年年陪跑的我,还是耐不住寂寞做了下分析,假设我们看到的数据是这样的,有公示编号和姓名,出生年月,公司和积分,而且今年还对积分的明细做了公示。
公示编号 | 姓名 | 出生年月 | 单位名称 | 积分分值 |
100001 | 小王 | 9/1/1980 | 北京很厉害的公司 | 100.12 |
明细的公示如下,可以看到这些牛人的积分段位。
对于这些信息,我们可以分析出什么呢,我做了下拆解:
1)分析这些牛人的分数段
2)分析这些牛人的年龄段
3)分析哪些公司的中签牛人多
4)分析中签牛人的公司类型
1)中签牛人的分数段
可以看到97分靠线的人的比例很高,集中在97-101分之间,可见竞争是非常激烈的,已经很多人超越满分了。
相比于前两年,分数有了明显提高,如下是第一次积分落户的分数段数据,集中在90-95,亚历山大。
如果想换种方式看分数占比和总数的比例,可以使用如下的图来表达:
2)分析这些牛人的年龄段
年龄段是一个很有说服力的指标,我们看看他们的年龄段。
从指标可以看出,清一色是70后,已经有一小批80年的人开始扩张,而85后的机会相对很低。
如下是完整的数据列表,我的天,85后只有4位,恭喜他们。
1961 | 2 |
1962 | 3 |
1963 | 5 |
1964 | 6 |
1965 | 8 |
1966 | 9 |
1967 | 10 |
1968 | 6 |
1969 | 27 |
1970 | 85 |
1971 | 107 |
1972 | 108 |
1973 | 329 |
1974 | 365 |
1975 | 507 |
1976 | 636 |
1977 | 751 |
1978 | 808 |
1979 | 741 |
1980 | 644 |
1981 | 468 |
1982 | 290 |
1983 | 83 |
1984 | 30 |
1985 | 3 |
1988 | 1 |
3)分析哪些公司的中签牛人多
中签的牛人所在的公司也能间接反映出公司实力,我抓取了一个标签云图,可以看到华为是遥遥领先,就这还不算华为研究所,其次赢家是电视台。
这个数据,包括名次和前2年差别不大。
4)分析中签牛人的公司类型
可以看到绝大多数的公司都是有限公司,此外一些出版社,研究院和事务所,大学也有有一定的比例。
有限公司 | 3710 |
有限责任公司 | 213 |
出版社 | 16 |
研究院 | 14 |
事务所 | 43 |
大学 | 6 |
电视台 | 1 |
然后再来看看2018年的数据分析
2019年5月16日,市人力社保局发布消息,北京市2019年积分落户申报工作将于5月22日正式启动,申报期60天。
目前官方公布的数据为2018年的积分落户数据,通过对数据的分析,可以了解整体的比例和分布情况。
今天使用Python实现做了下数据分析,结合pandas, numpy, matplotlib, pyecharts等插件通过可视化的方式进行数据统计分析,以柱状图,饼图,地图,表格等形式展示数据的分布情况。
直接给出测试过程。
1 环境配置
Python |
版本:3.8 |
插件 |
pandas |
numpy |
|
matplotlib |
|
pyecharts |
2 分数分布
2.1 分数按照5分为粒度进行统计
2.2 分数整体饼图统计
绝大多数的比例集中在90-95分,95~100分的区段次之,如果想得到更细粒度的数据,可以使用饼图查看。
其中,
90~95分的比例占到了55.6%
95~100分的比例占到了29.2%
100~105分的比例占到了10.8%
105分以上的比例占用不到5%
2.3 分数按照1分为粒度统计
在此基础上进行信息下钻,积分粒度按照1分来计算,可以看到90~91分的区段人数最多,90分压线的有300人左右。
3 年龄分布
3.1 细分年龄层次饼图
从饼图分布来看,
40~45岁的落户比例较高,为50.5%
35~40岁的落户比例次之,为42.2%
30~35岁的落户比例极低,为2.7%左右
45~50岁的落户比例较低,为4.3%
55~60岁的落户比例更低,为0.2%左右
3.2 细分年龄层次按照1岁为粒度进行统计
其中37~44岁为积分落户人数覆盖范围最多的年龄段,30~35岁的区段还是极少的比例。
4 公司分布
4.1 按照公司进行统计
公司情况如下:
北京华为数字技术有限公司 |
137 |
中央电视台 |
73 |
北京首钢建设集团有限公司 |
57 |
百度在线网络技术(北京)有限公司 |
55 |
联想(北京)有限公司 |
48 |
中国民生银行股份有限公司 |
40 |
北京外企人力资源服务有限公司 |
40 |
国际商业机器(中国)投资有限公司 |
39 |
中国国际技术智力合作有限公司 |
29 |
华为技术有限公司北京研究所 |
27 |
爱立信(中国)通信有限公司 |
26 |
腾讯科技(北京)有限公司 |
24 |
北京阿里巴巴云计算技术有限公司 |
23 |
中国石油天然气股份有限公司管道北京输油气分公司 |
20 |
用友软件股份有限公司 |
20 |
中铁建工集团有限公司 |
19 |
微软(中国)有限公司 |
17 |
中信银行股份有限公司 |
17 |
中煤建设集团工程有限公司 |
17 |
甲骨文(中国)软件系统有限公司 |
16 |
西门子(中国)有限公司 |
16 |
北京市京才实业开发总公司 |
16 |
中国光大银行股份有限公司 |
16 |
中铁电气化局集团有限公司 |
15 |
中铁三局集团第四工程有限公司 |
15 |
行业集中在华为,百度,爱立信,联想等公司,包括一些大型央企。
5 省份分布
5.1省份分布如下表所示:
河北 |
894 |
辽宁 |
484 |
山东 |
445 |
黑龙江 |
444 |
内蒙古 |
340 |
山西 |
316 |
吉林 |
309 |
河南 |
309 |
湖北 |
290 |
天津 |
239 |
四川 |
225 |
湖南 |
210 |
江苏 |
210 |
陕西 |
207 |
江西 |
191 |
安徽 |
184 |
甘肃 |
109 |
北京 |
97 |
浙江 |
90 |
新疆 |
80 |
福建 |
79 |
宁夏 |
51 |
广西 |
44 |
贵州 |
40 |
广东 |
37 |
青海 |
34 |
云南 |
31 |
上海 |
18 |
海南 |
10 |
西藏 |
1 |
重庆 |
1 |
其中河北,辽宁,山东,黑龙江占据较高比例,地域和北京有直接联系,而重庆,西藏,海南,云南的比例较低,上海主观猜测因为城市自身竞争力原因也处于末尾。
而且让我有些奇怪的是有些已经是北京户口了,怎么还要申请北京户口?
5.2 省份数据地图分布
本文转载自微信公众号「杨建荣的学习笔记」,作者杨建荣。转载本文请联系杨建荣的学习笔记公众号。