大数据已经成为这个时代的标志,如何理解和运用大数据,也是我们这个时代的重中之重。因此选择一本合适的数据科学书至关重要。
近日,在GitHub上看到一张大而全的数据科学书单图,该图片分成七大领域,各自都有相对应的推荐书单,本文就为为各位推荐几本书,希望能够有助于你在大数据方面的学习。
1、《数据科学入门》
本书从零开始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识——数学和统计学。作者选择了功能强大、简单易学的Python语言环境,亲手搭建工具和实现算法,并精心挑选了注释良好、简洁易读的实现范例。书中涵盖的所有代码和数据都可以在GitHub上下载。
2、《Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking》
本书清晰易懂,适合统计基础一般的人用来先理解ML的概念,书中涵盖大量数据科学的概念,读起来通俗易懂。你可以把书中大框架都理解了再去看别的更偏重理论或算法的书,
3、《贝叶斯思维》
这本书旨在帮助那些希望用数学工具解决实际问题的人们,但阅读本书之前你***懂一点概率知识和程序设计。本书在共计15章的篇幅中讨论了怎样解决十几个现实生活中的实际问题。在解决问题的过程中,作者还潜移默化的帮助读者形成了建模决策的方法论,在这个意义上,这本书又是一本关于数学建模的成功样本。
4、《数据科学实战》
这本书涉及的面包含数据科学的各个层面,是相关专家客座课堂讲义的分析和总结,主要涵盖以下内容:
- 统计推断、探索性数据分析(EDA)及数据科学工作流程
- 算法
- 垃圾邮件过滤、朴素贝叶斯和数据清理
- 逻辑回归
- 金融建模
- 推荐引擎和因果关系
- 数据可视化
- 社交网络与数据新闻
- 数据工程、MapReduce、Pregel和Hadoop
5、《复杂性思考》
本书提供了一系列练习;这些练习都要求学生重新实现一些开创性实验并对其进行扩展。复杂性吸引人的一个地方在于我们可以通过适当的编程技能与数学知识接触研究前沿。
6、《统计思维:程序员数学之概率统计》
本书是一本概率统计方面的入门图书,但视角极为独特,折射出大数据浪潮的别样风景。作者将基本的概率统计知识融入Python编程,告诉你如何借助编写程序,用计算而非数学的方式实现统计分析。
7、《利用Python进行数据分析》
本书含有大量的实践案例,你将学会如何利用各种Python库(包括NumPy、pandas、matplotlib以及IPython等)高效地解决各式各样的数据分析问题,十分适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。
8、《Python数据科学手册》
本书是对以数据深度需求为中心的科学、针对计算和统计方法的参考书。共有五章,每章介绍一到两个Python数据科学中的重点工具包。本书适合有编程背景,并打算将开源Python工具用作分析、操作、可视化以及学习数据的数据科学研究人员。
9、《Advanced and Multivariate Statistical Methods》
这是一本关于数据挖掘书籍,书中介绍了多种多元统计方法。