颜值大比拼,用数据告诉你中国哪里美女多?

大数据
这个被叫做”颜值调查”的互联网实验于4月29日晚上8点正式开放,截止5月4日24点,共有619位志愿者参与了活动,其中,地址和照片有效信息2413条。


这个被叫做”颜值调查”的互联网实验于4月29日晚上8点正式开放,截止5月4日24点,共有619位志愿者参与了活动,其中,地址和照片有效信息2413条。

从参与时间上看,29号晚上的短短4个小时以内,参与人数达到峰值的241人,上传照片717张;30号全天参与人数220人,共上传照片753张。劳动节当天仍有169位志愿者参加了活动,之后……大家就都出去玩了。(见下图)╮(╯▽╰)╭

数据可视化

但从覆盖度上来看,结果还比较欣慰。其空间分布可见下图:

数据可视化

可以看到,我们的志愿者遍布五大洲。没错,连南极洲也沦陷了!感谢在南极探险时也不忘分享颜值的朋友。

从全国覆盖度来看,可以得到下图:

具体来看,我大天朝除了澳门以外的所有省级行政区已经被志愿者们调查全部覆盖。上海、北京、广东、浙江的上传照片数多于100张,四川、香港、江苏超过50张,而在西藏和台湾只有一名志愿者。

嗯,好吧。现在我们可以非(hou)常(yan)郑(wu)重(chi)地宣布:本次实验非常成功!

然后,在成功但却略有一些不***数据的基础上,我们得到了以下非常简单粗暴的结论:

一, 高颜值们在哪里出没?

从颜值在全国的空间分布来看,河北一举夺魁,台湾和甘肃紧随其后(这位台湾美眉真是凭一己之力为全岛争光呀);湖北和山东人民就长得比较抱歉了。这似乎说明,颜值与GDP、与是否沿海,没有什么关系啊…… 至于海外的志愿者颜值垫底这一点……虽然我们很想推翻“一等美女漂洋过海”的观点给国内广大男同胞以希望,但本着学(bu)术(fu)严(ze)谨(ren)的立场,我们还是认为仅有的9位海外志愿者样本并不能代表整体情况。

而从城市角度来看,在去掉照片样本数量少于5的地区以后,我们选出了颜值得分top5和bottom5的十个地级市。河北石家庄、浙江嘉兴、浙江湖州名列三甲,山东济南和安徽蚌埠屈居队列之末。

数据可视化

接下来,看看上海城市内部的颜值分布吧,请看下图:

 

数据可视化

简单地说,复旦-同济-财大高校群、松江大学城、临港大学城的参与度都比较高,高校的妹子们明显拉高了附近街道的颜值。此外,陆家嘴也是高富帅白富美们的重要集散地。

然而,既然知道了高校是高颜值人群的高频率出没地区,那么让我们聚焦活动参与程度***的几所高校来看看具体的分布吧,福利来了。

先看复旦大学。

数据可视化

从图中可以看到,复旦的高颜值群体主要分布在研究生宿舍园区和第四教学楼(红色地区),在光华楼和五六教自习的同学就长得比较抱歉了(绿色地带)。各位同学请注意避让。

再来看一下邻居同济大学。

数据可视化

从图中可以看到,同济的高颜值人群集中分布在南校区(电影学院所在地)和大学生活动中心(红色地区),而在图书馆和南北楼则均匀分布着低颜值的童鞋(绿色地区)。难道真的是好看的人都爱玩,人丑只能多读书吗?这个世界真是太残酷了TAT

我们再把视角切至帝都,来看一下北京大学。

数据可视化

从图中可以看到,北大的高颜值密集地区非常明显,集中在左下角红色那一块。这里似乎是宿舍区-食堂区?果然北大的美女学霸们都醉心学术,只有在饭点和睡前才会偶尔掏出手机玩玩么?至于围绕着逸夫楼的和个别院系所形成的颜值洼地(绿色地带),我们也只能呵呵了。

整理完高颜值在空间上的分布现象,我们再来看时间上的特征。

二, 高颜值在哪个时间段出没?

与我们所预想的一致,工作日和节假日的颜值空间分布是不同的。本次实验期间,4月29日、4月30日和5月4日为工作日,5月1日~5月3日为节假日,正好可以找出不同的分布规律。

从全国层面来看,工作日颜值***的是台湾、湖南、甘肃、重庆、广西,而节假日颜值***的则是河北、黑龙江、江西、重庆、江西。嗯,去重庆总是没错的!(见下图)

数据可视化

而从颜值的变化幅度来看,云南、湖南两个旅游大省在节假日颜值暴增,江西、河北两个工业大省则颜值大跌。这难道说明,高颜值的人节假日都去旅游了,低颜值的人则更倾向于宅在家中?(见下图)

 

数据可视化

再具体到每个小时的话,请看下图:

数据可视化

可以看到,在各个时段中,凌晨3点上传的照片得分是***的。可以想象,帅哥美女们在这个时段往往最为活跃。除此之外,早上6点、下午2点和晚上9点也都是高颜值的集中爆发期。

为什么呢?早中晚各一次?难道吃饱了之后,高颜值人群才有兴趣上传照片么?

事实上,关于以上各种现象内在原因的阐述和演绎,我还没有整理出更清晰的逻辑线索,但无论如何,还是要再次郑重说明:

关于高颜值的时空分布,由于样本有限且偏好明显,请大家参考以上结论时充分考虑再三思量。

当然,在这些不太靠谱的结论之外,我们还是有一些有趣的发现:

比如:48%的志愿者只上传了一次照片,45%上传了2~10张,7%的志愿者上传了10张以上。另外,一共有5位上传照片超过50张以上的志愿者,非常给力。(见下图)

数据可视化

再比如:从所有颜值得分的总量来看,颜值得分的频数为偏正态分布。无论从志愿者个人得分还是单张照片得分的统计情况来看,3分都是最常见的档位。从总体来看,大家的美丑分布还是比较均衡的。(见下图)

数据可视化

 

***,出于对人性的好奇,我们还统计了每一个志愿者发布***张照片的颜值得分与其参加活动总次数的关系,结果显示出得分的高低在志愿者活动参与度上具有显著的激励作用。请看下图:

数据可视化

 

总体而言,由上图可以看到,***张照片得到的分数越高,志愿者越乐意继续参与活动,拍摄上传更多的照片。

所以,我非常感激那些在本次试验中颜值得分总是为0,但仍然坚持不懈上传照片的小伙伴们。敢于自黑自嘲永不气馁并乐在其中的人都是真正自信的人。

大概就是这样吧。

 

责任编辑:李英杰 来源: 36大数据
相关推荐

2010-03-18 14:54:46

主流无线技术

2009-11-16 09:05:47

PostgreSQLInnoDB多版本并发控制

2011-01-19 11:10:30

2010-08-25 16:12:34

职场

2010-09-08 15:41:28

SIP协议栈

2017-09-10 14:29:03

眼力

2010-05-28 11:09:51

SVN功能

2014-01-07 17:08:02

Java开源框架

2023-05-26 15:53:48

MidjourneyAI图像

2021-03-15 21:07:17

IT行业薪酬薪水

2011-11-08 10:29:44

2020-08-04 17:06:40

Merging Rebasing Git

2010-07-14 13:38:51

Perl开发工具

2020-10-22 19:37:01

SASESD-WAN网络技术

2014-12-04 15:14:12

深圳虹安DLPDSM

2013-04-22 14:21:13

WP、Android、

2009-10-13 14:46:00

思科认证

2009-12-01 08:47:41

2010-04-21 12:54:46

Unix内核

2011-04-01 09:18:01

MRTGCactiZabbix
点赞
收藏

51CTO技术栈公众号