本文转载自微信公众号「数师兄」,作者数师兄。转载本文请联系数师兄公众号。
在万众期待之下,伴随着各种质疑和猜测,第七次全国人口普查数据千呼万唤始出来,终于在5月11日公之于众。
从数据分析的角度来看,人口普查就相当于对全国人民做了一个画像,从年龄、地域、教育水平等维度来描述我国人口当前分布状况。
今天我们就着第七次人口普查数据,闲扯一篇。
1.整体趋势
(截自《第七次全国人口普查公报(第二号)》)
从上图来看,全国人口虽未负增长,但其增速已经平得不能再平了,年均增长率0.53%,可以理解为近十年在每一万人中,每年新生人口减去死亡人口数量后的净新增只有5.3。
(截自《第七次全国人口普查公报(第二号)》)
再看这个平均每个家庭的人数,不足3个人,较上一次普查减少了0.48,这一数字给我们的直观感觉就是大量家庭是没有孩子的。除了年轻一代长大成人建立了新的家庭之外,还有一大因素就是这些新生家庭的生育意愿正在降低。
过去几次普查数据显示的年均增长率一直都是在下降,1990年-2010年,可以理解为在计划生育相关政策的控制下,将人口增速逐步放缓,而最近几年我们已经放开了二胎,按理说在如此大的人口基数之下,且医疗水平日益提高的今天,正常死亡率会越来越低,净新增应该会出现较大涨幅才对。而实际的增长比上一个十年还要平,“死亡”没有问题,那么“新生”可能就不对劲了。
放到我们通常的互联网产品上来说,这就相当于我们的活跃用户数量增长缓慢,“新生人口”就是我们的新增用户(安装、注册等),“死亡人口”就是流失用户(注销、休眠等)。对于一个发展中的产品,如果新增缓慢,“开源节流”就要提上日程了,这就轮到渠道调控发挥作用了。
2.区域分布
(截自《第七次全国人口普查公报(第三号)》)
受于人口基数的影响,在大环境相对稳定的情况下,广东、山东、河南、江苏、浙江这几个人口大省仍然是位居前列。但是省与省之间的差异却是巨大的,这受到了地理环境、历史文化、经济水平等等多重因素的交叉影响,最后以行政单位形成了一个分界线。
同样,引申到用户画像上,不同地域的用户就会具有不同特征,人们在地理位置上的聚集,会一定程度上反应出其在教育水平、家庭收入、文化理念、风土人情等各方面的区域特性。所以,在用户画像当中,地域分布往往都是一个非常重要的标签,通常会按行政区划、城市等级两个方面来进行划分。
3.性别构成
(截自《第七次全国人口普查公报(第四号)》)
我国男女比例并不大,近年波动也较为平缓。这对于单身狗们来说算是个好事儿,至少理论上,狗子们找到另一半的机会还是很可观的。
性别是所有人群的一个自然属性。男性和女性通常会具有不同的行为习惯、不同的性格、不同的需求,所以在常规的画像当中,性别这一标签也有很重要的作用。正是因为不同性别的用户其行为特征差异较大,所以一些产品往往可以利用这一标签大做文章,常见的就是电商平台、内容平台的推荐策略等。
4.年龄构成
所有人还有另一个自然属性,年龄。国家层面上来看,老壮青年龄的分布很大程度上可以左右未来的发展潜力。
(截自《第七次全国人口普查公报(第五号)》)
从本次人口普查公布的年龄分层数据来看,虽然青壮年人口(15-59)占比仍有63.35%,但是对比2010年的第六次人口普查来看,就显得有些后继乏力了。60或65岁以上人口占比上升了5个百分点左右,老龄化的趋势愈发明显。而随着这一数据的发布,当日下午的养老概念股就开始持续走高,未来养老产业可能将要迎来一次高潮。那么为了避免青黄不接、减小老龄化的影响,可以预见政府将会采取一些鼓励生育的措施。所以到时候,我等打工人养娃的成本也许会有所下降,希望这些政策早日出台,我们也可以早日为中华民族的繁荣昌盛再添一把力,生生不息。
再次回到用户画像上,用户的年龄对于互联网产品通常也是极为重要的一个特征。因为不同年龄阶段的用户往往具有不同的需求,比如老人爱“养生”、日常“催婚”“催生”,年轻人爱熬夜、爱秃头、爱追求自由,熊孩子们爱动画片、爱“坑队友”,有孩子的中年人就爱“学习”、爱“攀比”、爱娃生过爱自己。玩笑归玩笑,有一说一,年龄代表了一个人所处的人生阶段,瞄准目标人群有的放矢,这是画像的初衷。
5.受教育水平
(截自《第七次全国人口普查公报(第六号)》)
在人群受教育水平上,北京可谓是一骑绝尘。百分之四十多的大学以上学历,比第二名的上海还高出8个百分点,其教育资源之丰富与其对高学历人才的吸引能力可见一斑。从全国来看,当前大学学历人群与上次人口普查时相比,增加了约70%,这表示我们国家高等教育的普及程度越来越高了,抛开地域因素不谈,我们这代打工人的崽儿也有了更多机会去接受更好的教育。
一个人受教育的程度,会影响他的眼界、能力、素养、行事风格等,那么当然用户画像也用得着这一标签。以短视频平台为例,其用户有着明显的教育水平分层,平台上充斥着大量三俗内容、虚假信息,而这些内容下的用户多数教育程度不高,容易被不良自媒体误导和引诱。本身这些用户并非此类内容的生产者,而是因为这些自媒体的低质内容锚住了下沉用户群。当然平台上也不乏有良心的自媒体账号和优质内容,但还是希望平台可以加大力度整治不良内容、净化网络环境,生产休闲娱乐内容的同时,也能让更多的科学知识惠及到普罗大众,传播更多的正能量和正确的三观。
结语
到这里第七次人口普查的数据基本上就讲完了。
通篇来看呢,就相当于对我们的全国人民做了一个画像,通过地域、年龄、性别、教育等属性来描述用户群的分布。那么在分析师的分析工作中,除了以上维度的应用,还有很多其他的画像标签在这里是没有提及的,比如:用户在产品中的行为、用户的偏好、用户社群关系等等。