起薪2万的爬虫工程师，Python需要学到什么程度才可以就业？-51CTO.COM

爬虫工程师的的薪资为20K起，当然，因为大数据，薪资也将一路上扬。那么，Python需要学到什么程度呢?今天我们来看看3位前辈的回答。

1、前段时间快要毕业，而我又不想找自己的老本行Java开发了，所以面了很多Python爬虫岗位。

因为我在南京上学，所以我一开始只是在南京投了简历，我一共面试了十几家企业，其中只有一家没有给我发offer，其他企业都愿意给到10K的薪资，不要拿南京的薪资水平和北上深的薪资水平比较，结合面试常问的问题类型说一说我的心得体会。

***点：Python

因为面试的是Python爬虫岗位，面试官大多数会考察面试者的基础的Python知识，包括但不限于：

Python的一些常用内置库，比如多线程之类的

第二点：数据结构与算法
数据结构与算法是对面试者尤其是校招生面试的一个很重要的点，当然小公司不会太在意这些，从目前的招聘情况来看对面试者的数据结构与算法的重视程度与企业的好坏成正比，那些从不问你数据结构的你就要当心他们是否把你当码农用的，当然以上情况不绝对，最终解释权归面试官所有。

第三点：Python爬虫

最重要也是最关键的一点当然是你的Python爬虫相关的知识与经验储备，这通常也是面试官考察的重点，包括但不限于：

第四点：爬虫相关的项目经验

爬虫重在实践，除了理论知识之外，面试官也会十分注重爬虫相关的项目：

以上是我在面试过程中，会碰到的一些技术相关的问题的总结，当然面试中不光是技术这一点，但是对于做技术的，过了技术面基本上就是薪资问题了。

也许有人问我现在在哪家公司做爬虫开发?很抱歉，最终我放弃了南京的所有机会到了上海做我更喜欢的岗位：数据工程师。

2、给你一点我的面经吧。

初级的：

网络基础：cookie,session,https,headers常用的字段,代理使用等等
python基础：这个网上搜到的面经都得会，加上异步，多进程，多线程等等
爬虫：xpath，requests如何处理https，常见的反爬措施，举例说一个最难的爬虫过程，scrapy使用中的细节，例如代理，cookie，传参等等。
数据库：数据库操作，并表之类的。

中级：

网络：几层网络层的细节，比如说说udp/tcp/smtp区别，说说10.x.x.x/127.x.x.x/192.x.x.x的区别，说说DNS，谈谈路由交换机的区别
python：多重继承，多态，单例用装饰器的实现，数组/生成器/列表解析效率等等稍深入的细节
爬虫：分布式爬虫的实现，给你一个任务你马上给出一个合理的架构，验证码的处理，增量数据爬取，写爬虫时有没写些辅助工具。
数据库：sql nosql的细节，性能上的。
加分项：数据挖掘，机器学习，自然语言处理，能写网站，熟练操作linux，github小星星

3、首先说说Python吧

爬虫给人的感觉就是对于Python编程的知识要求并不高，确实，搞懂基本数据结构、语句，会写写函数好像就OK了。

自己业余玩玩爬点数据还OK，但是你是要找工作成功爬虫工程师的，扎实的编程基础可不是会写函数就够了的。Python的高级特性、面向对象编程、多线程、装饰器等等你至少需要了解一下吧。

现在很多爬虫工程师的面试，编程的基本功要求还是很高的。编程的功底，以及对语言的理解，从某种程度上可以看出你的学习能力、发展潜力。

爬虫技术

了解布隆过滤器，会增量爬取。

加分项：

今天就聊到这里啦!