通过抓包,实现Python模拟登陆各网站,原理分析!

开发 后端
通过分析登陆流程并使用 Python 实现模拟登陆到一个实验提供的网站,在实验过程中将学习并实践 Python 的网络编程,Python 实现模拟登陆的方法,使用 Firefox 抓包分析插件分析网络数据包等知识。

[[236439]]

 

一、教程简介

1.1 基本介绍

通过分析登陆流程并使用 Python 实现模拟登陆到一个实验提供的网站,在实验过程中将学习并实践 Python 的网络编程,Python 实现模拟登陆的方法,使用 Firefox 抓包分析插件分析网络数据包等知识。

模拟登录可以帮助用户自动化完成很多操作,在不同场合下有不同的用处,无论是自动化一些日常的繁琐操作还是用于爬虫都是一项很实用的技能。本课程通过 Firefox 和 Python 来实现,环境要求如下:

  • Python 库:urllib, http.cookiejar, Django
  • Firefox 要求:装有 live http header插件 (已提供)
通过抓包,实现Python模拟登陆各网站,原理分析!

 

1.3 材料

通过抓包,实现Python模拟登陆各网站,原理分析!

 

1.4 准备

1) 安装抓包插件Live Http Headers

通过抓包,实现Python模拟登陆各网站,原理分析!

 

通过抓包,实现Python模拟登陆各网站,原理分析!

 

通过抓包,实现Python模拟登陆各网站,原理分析!

 

通过抓包,实现Python模拟登陆各网站,原理分析!

 

通过抓包,实现Python模拟登陆各网站,原理分析!

 

2)启动web应用

使用 ps -aux | grep codebox 查询获得 codebox 的进程号,然后使用 kill -9 进程号 停止 codebox 进程。执行过程见下图:

通过抓包,实现Python模拟登陆各网站,原理分析!

 

首先安装demo依赖的web框架django,并测试是否安装成功:

通过抓包,实现Python模拟登陆各网站,原理分析!

 

启动成功后在浏览器中输入 http://localhost:8000/polls 看到登录页面表示启动成功

通过抓包,实现Python模拟登陆各网站,原理分析!

 

二、分析登录过程

要通过编程实现登录,首先需要理解一般Web应用的登陆过程。

通过抓包,实现Python模拟登陆各网站,原理分析!

 

2.1 抓取请求

通过抓包,实现Python模拟登陆各网站,原理分析!

 

2.2原理分析

通过抓包,实现Python模拟登陆各网站,原理分析!

 

通过抓包,实现Python模拟登陆各网站,原理分析!

 

为什么是2个请求而不是1个呢?通过分析登录请求发现,登陆成功之后服务器发送了302重定向响应,服务器要求浏览器重新请求首页,这就产生了第二个请求。再来分析第二个请求,可以看到它相比登录请求多了一个请求头:

通过抓包,实现Python模拟登陆各网站,原理分析!

 

整个登录流程如下图所示:

通过抓包,实现Python模拟登陆各网站,原理分析!

 

服务器到底是如何区别不同用户的session的?为什么登陆成功会后要回写cookie呢?

通过抓包,实现Python模拟登陆各网站,原理分析!

 

2.3小结

对于服务器来说,登录=验证+写session。对于浏览器来说,登录=发送登录信息+获取带sessionid的cookie。可以说,只要获得了sessionid,就算实现了模拟登录。有了它我们便可以游离于系统之中。

三、使用Python实现登录(简单实例)

理解了登录过程的原理和细节之后,开始用Python来编写模拟登陆程序吧。

通过抓包,实现Python模拟登陆各网站,原理分析!

 

3.1导入模块

不要忘记编写文件头、导入必要的依赖模块

通过抓包,实现Python模拟登陆各网站,原理分析!

 

3.2构造登录请求

通过抓包,实现Python模拟登陆各网站,原理分析!

 

登录请求的实体部分如下:

通过抓包,实现Python模拟登陆各网站,原理分析!

 

通过抓包,实现Python模拟登陆各网站,原理分析!

 

全部Python代码:

通过抓包,实现Python模拟登陆各网站,原理分析!

 

附加参数

通过抓包,实现Python模拟登陆各网站,原理分析!

 

防盗链

Web 应用的资源都是有url的,只要获得了url就能够在任何地方引用。听起来很方便,但这可能会导致你的资源被别人盗用。

通过抓包,实现Python模拟登陆各网站,原理分析!

 

3.3发送请求并保存cookie

通过抓包,实现Python模拟登陆各网站,原理分析!

 

Python代码如下:

通过抓包,实现Python模拟登陆各网站,原理分析!

 

如果登陆成功

通过抓包,实现Python模拟登陆各网站,原理分析!

 

就可以在指定的文件my_cookies.txt中看到sessionid了。

3.4 使用cookie访问系统服务

通过抓包,实现Python模拟登陆各网站,原理分析!

 

通过抓包,实现Python模拟登陆各网站,原理分析!

 

通过抓包,实现Python模拟登陆各网站,原理分析!

 

在我们模拟登录成功后,就可以直接通过opener打开这个url来使用这项系统服务。代码实现如下:

通过抓包,实现Python模拟登陆各网站,原理分析!

 

如果有是在另外一个python文件中使用这个cookie的话,再打开url之前需要先载入cookie:

通过抓包,实现Python模拟登陆各网站,原理分析!

 

教程取自实验楼。 

责任编辑:庞桂玉 来源: 今日头条
相关推荐

2012-05-24 13:39:11

Python

2022-04-13 11:46:17

抓包wireshark丢包

2009-07-16 15:14:27

WebWork用户登陆

2021-07-12 06:23:38

抓包gRpcRPC 框架

2020-10-13 16:02:03

HTTPS浅析与抓包分

2015-01-13 09:08:54

内容安全策略CSP

2020-10-16 08:02:00

Android系统

2010-05-28 15:08:09

MySQL远程登陆

2019-09-27 09:35:12

2021-06-02 14:45:52

远程服务器Python

2009-08-28 09:59:05

BingiPhone微软

2011-07-20 09:27:37

Scala

2011-09-01 11:08:41

安全登陆Windows服务器网络安全

2012-02-15 17:17:02

开放平台

2009-12-21 17:48:30

WCF方法重载

2011-03-08 13:52:25

Proftpd

2010-04-21 17:20:03

Unix远程

2011-08-08 11:23:59

腾达路由器

2009-05-25 08:42:57

2012-02-28 09:41:20

AD病毒微软
点赞
收藏

51CTO技术栈公众号