鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

账号设置退出

此Python破解反爬虫实例，曾帮助过我成长，你也会对它表示感谢！

作者：空手忆岁月 2018-08-09 11:35:40

通过用JS在本地生成随机字符串的反爬虫机制，在利用Python写爬虫的时候经常会遇到的一个问题。希望通过讲解，能为大家提供一种思路。以后再碰到这种问题的时候知道该如何解决

通过用JS在本地生成随机字符串的反爬虫机制，在利用Python写爬虫的时候经常会遇到的一个问题。希望通过讲解，能为大家提供一种思路。以后再碰到这种问题的时候知道该如何解决。（如果缺乏学习资料的同学，文末已经给你提供！）

破解有道翻译反爬虫机制

web端的有道翻译，在之前是直接可以爬的。也就是说只要获取到了他的接口，你就可以肆无忌惮的使用他的接口进行翻译而不需要支付任何费用。那么自从有道翻译推出他的API服务的时候，就对这个接口做一个反爬虫机制。这个反爬虫机制在爬虫领域算是一个非常经典的技术手段。那么他的反爬虫机制原理是什么？如何破解？接下来带大家一探究竟。

一、正常的爬虫流程：

在上图，我们可以看到发送了很多的网络请求，这里我们点击***个网络请求进行查看：

对其中几个比较重要的数据进行解释：

其他的数据类型暂时就不怎么重要了，都是固定写法，我们后面写代码的时候直接鞋子就可以了。到现在为止，我们就可以写一个简单的爬虫，去调用有道翻译的接口了。这里我们使用的网络请求库是Python3自带的urllib，相关代码如下：

二、破解反爬虫机制：

然后把格式化后的代码，复制下来，用sublime或者pycharm打开都可以，然后搜索salt，可以找到相关的代码：

知道salt和sign的生成原理后，我们就可以写Python代码，来对接他的接口了，以下是相关代码：

责任编辑：庞桂玉来源：今日头条

Python 网络爬虫语言编程

51CTO技术栈公众号

业务
速览

媒体

51CTO CIOAge HC3i

社区

51CTO博客鸿蒙开发者社区 AI.x社区

教育

51CTO学堂精培企业培训 CTO训练营