本文转载自微信公众号「志斌的python笔记」,作者志斌。转载本文请联系志斌的python笔记公众号。
大家好,我是志斌~
今天我们就来分析一下iPhone全部游戏免费榜的排名情况,看看哪类iPhone用户都喜欢哪款游戏~
一、数据采集
首先我们打开我们的目标网页,对其进行简单分析。
如上图,我们发现数据是以Ajax形式加载到网页中的,存储格式是JSON格式,我们在之前的文章中详细的介绍过这种网站的原理和爬取方式,有兴趣的读者可以看看这篇文章一文教会你,Ajax数据爬取。
这里我们就不过多介绍了,直接展示核心代码:
import requests
params = (
('analysis', 'dg51Ti93fkVqXnpcYjNbTwVzDxRqYQ0NcBMfSgVZU0tdWAVVSHATAQEBAV0AClAFB1YEcBMB'),
('brand', 'free'),
('device', 'iphone'),
('country', 'cn'),
('genre', '6014'),
)
response = requests.get('https://api.qimai.cn/rank/index', headers=headers, params=params)
for i in response.json()['rankInfo']:
xuhao = i['index']
Id = i['appInfo']['appId']
play_name = i['appInfo']['appName']
pinglun_num = i['comment']['num']
try:
if '万' in pinglun_num:
pinglun_num = float(pinglun_num[:-1])*10000
except:
if pinglun_num == '1,294万':
pinglun_num = 12940000
pingfen = i['comment']['rating']
gongsi_name = i['company']['name']
leibie = i['rank_c']['genre']
leibiepaiming = i['rank_c']['ranking']
try:
with open('1.csv', 'a', encoding='gbk',newline='') as f:
writer = csv.writer(f)
writer.writerow([xuhao,Id,play_name,pinglun_num,pingfen,gongsi_name,leibie,leibiepaiming])
except:
pass
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
- 7.
- 8.
- 9.
- 10.
- 11.
- 12.
- 13.
- 14.
- 15.
- 16.
- 17.
- 18.
- 19.
- 20.
- 21.
- 22.
- 23.
- 24.
- 25.
- 26.
- 27.
- 28.
- 29.
- 30.
- 31.
二、数据可视化
我们此次采集了游戏免费榜单前五十的数据来进行数据可视化分析,采用的工具是Excel。
1.游戏名称词云图展示
从图中我们发现用户较喜欢的是麻将、王者、漫威、格斗、校园和MOBA风格的游戏。
2.游戏公司所在城市
从图中我们发现,游戏公司在深圳最多有14家,其次是杭州有8家,然后是5家在北京,2家在上海,1家在广州。
想从事游戏行业的朋友,建议以后尽量去深圳和杭州看看,毕竟公司多,机会更多一点。
3.游戏评分倒数前五
从图中我们可以看出,以下五款游戏的评分最低,看来这五家公司的开发要被老板给约谈了~
4.评论数top20游戏
游戏的评论数处于遥遥领先的是保卫萝卜3,有1294w;其次是汤姆猫跑酷,有930w;樱花校园模拟器和腾讯欢乐麻将合集也不少,分别是256w和150w。
5.游戏类别分布
动作类游戏较受大众欢迎,其次是策略和休闲类游戏,看来开发些这方面的游戏,会更容易占据市场。
三、小结
1. 本文观点仅是作者个人观点,如有不当之处,请联系作者指正!
2. 本文仅供学习参考,不做它用。