本文转载自微信公众号「志斌的python笔记」,作者志斌。转载本文请联系志斌的python笔记公众号。
大家好,我是志斌~
今天我们就来分析一下iPhone全部游戏免费榜的排名情况,看看哪类iPhone用户都喜欢哪款游戏~
一、数据采集
首先我们打开我们的目标网页,对其进行简单分析。
如上图,我们发现数据是以Ajax形式加载到网页中的,存储格式是JSON格式,我们在之前的文章中详细的介绍过这种网站的原理和爬取方式,有兴趣的读者可以看看这篇文章一文教会你,Ajax数据爬取。
这里我们就不过多介绍了,直接展示核心代码:
- import requests
- params = (
- ('analysis', 'dg51Ti93fkVqXnpcYjNbTwVzDxRqYQ0NcBMfSgVZU0tdWAVVSHATAQEBAV0AClAFB1YEcBMB'),
- ('brand', 'free'),
- ('device', 'iphone'),
- ('country', 'cn'),
- ('genre', '6014'),
- )
- response = requests.get('https://api.qimai.cn/rank/index', headers=headers, params=params)
- for i in response.json()['rankInfo']:
- xuhao = i['index']
- Id = i['appInfo']['appId']
- play_name = i['appInfo']['appName']
- pinglun_num = i['comment']['num']
- try:
- if '万' in pinglun_num:
- pinglun_num = float(pinglun_num[:-1])*10000
- except:
- if pinglun_num == '1,294万':
- pinglun_num = 12940000
- pingfen = i['comment']['rating']
- gongsi_name = i['company']['name']
- leibie = i['rank_c']['genre']
- leibiepaiming = i['rank_c']['ranking']
- try:
- with open('1.csv', 'a', encoding='gbk',newline='') as f:
- writer = csv.writer(f)
- writer.writerow([xuhao,Id,play_name,pinglun_num,pingfen,gongsi_name,leibie,leibiepaiming])
- except:
- pass
二、数据可视化
我们此次采集了游戏免费榜单前五十的数据来进行数据可视化分析,采用的工具是Excel。
1.游戏名称词云图展示
从图中我们发现用户较喜欢的是麻将、王者、漫威、格斗、校园和MOBA风格的游戏。
2.游戏公司所在城市
从图中我们发现,游戏公司在深圳最多有14家,其次是杭州有8家,然后是5家在北京,2家在上海,1家在广州。
想从事游戏行业的朋友,建议以后尽量去深圳和杭州看看,毕竟公司多,机会更多一点。
3.游戏评分倒数前五
从图中我们可以看出,以下五款游戏的评分最低,看来这五家公司的开发要被老板给约谈了~
4.评论数top20游戏
游戏的评论数处于遥遥领先的是保卫萝卜3,有1294w;其次是汤姆猫跑酷,有930w;樱花校园模拟器和腾讯欢乐麻将合集也不少,分别是256w和150w。
5.游戏类别分布
动作类游戏较受大众欢迎,其次是策略和休闲类游戏,看来开发些这方面的游戏,会更容易占据市场。
三、小结
1. 本文观点仅是作者个人观点,如有不当之处,请联系作者指正!
2. 本文仅供学习参考,不做它用。