今天要和大家推荐5本每个数据科学家都应该阅读的书籍:
1. 《The Data Science Handbook》
这本书绝对应该放在每个数据科学家的书架上,它包含了对25位来自不同公司、行业和经验水平的数据科学家的采访。他们会给你一些宝贵的意见,告诉你如何长远规划自己的职业生涯,为哪家公司工作,如何保持学习,以及他们如何看待未来几年这个领域的变化。这本书里还有很多很有价值的见解,尤其如果你是一个初学者。
建议你从书中找到一些些有趣的问题,然后在你真正想为之工作的公司工作的数据科学家提问,这样你也可以得到不一样的见解,但还是要根据你的实际情况而定。
2. 《面向数据科学家的实用统计学》
如果你有一定的技术背景,需要了解更多关于统计数据,或者你有一定的学术背景,掌握一定的统计相关的理论知识,但在实践中并不常用,这本书将带你过一遍统计的主要概念,如分布和机器学习,并向你展示如何使用Python,这是一本很好的中级水平的书,重点是应用,而不是理论。
我强烈建议你仔细阅读这本书中的代码,尝试复制其中的一些代码片段,并对它们进行调整,看看它们是如何运行的。
3. 《精通特征工程》
特征工程可以说是数据科学工作流程中最重要的步骤之一。一旦你对工作流程和主要算法有了良好的总体认识,你就应该开始提高你的功能工程技能。这基本上意味着要掌握许多不同的工具以及何时使用它们,这取决于你的数据和目标。
这本书很好地结合了理论、应用,我建议你一边阅读一边做笔记,然后它放在身边作为参考指南。
4. 《机器学习精讲》
这是了解数学背后的主要ML算法最好的书籍之一,全书概念解释清楚,介绍精简,它应该是你开始机器学习之旅时首先要读的书之一,尤其是当你已经有一定数学基础的时候。如果你真的想详细研究这本书,我建议你尝试用自己熟悉的编程语言来实现其中的算法,从而帮助自己巩固知识。
5. 《贝叶斯思维》
一旦你开始学习统计学,你就会经常读到贝叶斯和某些贝叶斯算法,如果你不知道这两种方法的区别,一旦你理解了这种区别,学习贝叶斯统计就会非常有用,以便掌握贝叶斯算法并将其添加到你的工具库当中去,我特别推荐这本书,如果你有统计学背景,但之前从未详细学习过贝叶斯方法,它没有深入这个主题,但它已经足够让你在Python中使用贝叶斯统计。