机器学习和数据科学是复杂而相互关联的概念。要想让自己在技术紧跟趋势,你必须消耗大量的时间进行知识的更新。
日复一日的重复劳动不等于学习,这样仍有可能掉队。
所以一方面我们需要学习新知识,一方面保持实操经验。这样的技能组合,才能帮助你在行业中取得成功。
尽管互联网上存在大量的学习资源,但对于信息的选择并不是一件容易的事情,所以,选择几本优秀的书籍尤为重要。
这里我们精选出六本好书,助你学好机器学习和大数据科学!
1. Machine Learning Yearning 认识机器学习,吴恩达著
现代数据技术,大数据和数据科学过程开发和生产精确的机器学习系统不是什么新东西了。虽然它们不是同义词,但是它们之间息息相关,因此,如果你在数据行业工作,那么提高对机器学习的理解和认识很有必要。
你可以从这本优秀的书籍中学到一些见解,例如应该多长时间收集一次培训数据,如何使用端口到端口的深度学习以及如何利用你正在创建的系统来共享数据和统计信息。
2. Hadoop: The Definitive Guide 权威指南,Tom White著
Apache Hadoop 是用于处理和管理大量数据的主要框架。任何从事编程或数据科学工作的人都熟悉这个平台,因为它是开发可扩展系统最有效的方法之一。
恰好专家 Hadoop 顾问和 Apache 软件基金会成员 Tom White 写了一本明确的指南,里面包含了许多独到的见解和有用的资源。大数据学习扣qun: 74零零加4yi3八一更重要的是,它将引导你完成使用Hadoop 集群的整个过程和设置。
另外,Apache Spark 也是你可以花点时间学习的另一个重要平台。
3. Predictive Analytics 分析预测,Eric Siegel著
本书详细解释了如何获取大多数形式的数据和信息,并将其转化为可操作的预测或见解。关键是要帮助专业的人员更好地了解他们的客户。你将学习如何识别他们购买的产品和服务,他们访问的地点,与他们共鸣的内容等等。
数据科学家的工作是用未经过滤的原始数据来确定可用的趋势和模式。本书不仅可以帮助你做到这一点,而且还可以提出必要的预测算法来改进未来的操作和流程,可以说是预测分析的圣经。
4. Storytelling With Data 用数据讲故事,KoleNussbaumer Knaflic著
这是一本权威的可视化指南,可以让你了解应该如何处理你收集的所有有用的数据。许多见解适用于常用技术,对于业界人士很有帮助。是业内任何人都必备的重要阅读物,甚至行业外人士也合适一读。
简而言之,本书涉及大量数据的组织和提取。这意味着过滤掉大量不明确的数据,改进数据收集流程,并提出相关的和实际的数据可视化。
5. Inflection Point 拐点,Scott Stawski著
本书副标题为 “How the Convergence of Cloud, Mobility, Apps and Data Will Shape the Future of Business(云、移动性、应用程序和数据的融合如何影响行业的未来)”,这本书对于了解当前数据分析和云计算行业的发展势头十分必要。
特别值得注意的是,Stawski直接关注原始数据的存储、挖掘系统、如何部署以及如何进行实际应用。
它不仅仅是一个理论指南,还揭示了实际的工作系统,并描述了如何使它们适应你的企业。
最重要的一点是,你能够从本书中清楚了解如何在企业中部署这些工具和平台。
6. An Introduction to Statistical Learning With Applications in R 基于R语言的统计学习导论,Gareth James等著
统计学习和相关的方法是数据科学工作所必需的。这本教科书能够帮助从本科生到博士生了解这些概念。
另外,它也提供了很好的R语言算法,有详细的解释和演练。这样做的原因是,你可以在练习数据科学的时候把它作为一个直接的资源,特别是在学习阶段。
这是一本好书,值得定期回顾,这些概念和信息对于日常应用也是实用的。