如果你想学习数据科学,你首先需要做的就是掌握一些基本的数据处理,并开始学习编程,当你没有在电脑前的时候,你还可以阅读一些数据科学的书籍。
数据科学的火热,也使得其相关的学习资源更加丰富和开放,你可以不花费一分钱就获得许多有用的学习资料,但很多人苦恼的是,入门数据科学是选择Python还是R语言,今天我们就不探讨它们谁更合适,我们把它们最好的免费入门书籍都选出来了,想要选择哪门语言你们自己决定:
1. 《Python Data Science Handbook》
Jake VanderPlas撰写的这本《Python Data Science Handbook》也可以在Github上找到(Github地址:
https://github.com/jakevdp/PythonDataScienceHandbook),不过它不适合初学者,需要你具备一定的Python编程基础知识,不过不要担心,这里还推荐你可以学习这门免费的Python基础课程(课程地址:
https://www.dataquest.io/course/python-for-data-science-fundamentals/)
书籍地址:https://jakevdp.github.io/PythonDataScienceHandbook/
2. 《Automate the Boring Stuff with Python》
这本初级Python书籍并不是特别注重数据科学方面的知识,但书中的知识是所有数据科学相关的,和一些比如Web爬虫、Excel文件处理和CSV等数据科学家们需要用的技能息息相关。
书籍地址:https://automatetheboringstuff.com/
3. 《A Byte of Python》
这是另外一本很受欢迎的零基础Python书籍,它也不是特定于数据科学,但是它涵盖的大多数概念都与数据科学家有关,而且它还被翻译成各种各样的语言,因此来自世界各地的人都可以轻松地访问它。
地址:https://swaroopch.gitbook.io/byte-of-python/
4. 《Learn Python, Break Python》
这本书也是为没有任何Python编程基础的人准备的,本书从对Python编程的基础介绍开始,到逐渐引入一些示例和练习,并说明在哪里可以使用它们以及如何掌握这些方法,通过这种方式积累知识。
地址:https://learnpythonbreakpython.com/
R语言书籍
1. 《R Programming for Data Science》
Roger D. Peng的这本书将从零开始教你如何使用R语言进入数据科学领域,包括R编程的基础知识,这是一个你想付多少就付多少的书籍,选择0元也是可以的。
地址:https://leanpub.com/rprogramming
2. 《An Introduction to Data Science》
这本介绍性的教科书是由雪城大学(也称为锡拉丘兹大学)的Jeffrey Stanton教授编写的,他涵盖了很多数据科学和统计学的基础知识,它还包含R编程,其中某些部分确实非常值得一读,即便是对于那些正在学习Python编程的人来说。
地址:https://docs.google.com/file/d/0B6iefdnF22XQeVZDSkxjZ0Z5VUE/edit?pli=1
3. 《Advanced R》
这是一个免费的在线文本,涵盖更高级的R主题,本书主要是为希望提高编程技能和想要提高对R语言理解的人设计的,书中解释了R语言比较特殊的一些特性。
地址:http://adv-r.had.co.nz/