数据科学是当今市场上最热门的职业之一。 公司一直在聘用数据科学家,并且总是有很多人试图成为一名科学家。 但是,数据科学的发展不及其他技术学科那么长,因此与软件开发不同的是,没有专门针对数据科学的学习平台来帮助有抱负和经验丰富的科学家培养。 当然有Coursera和Udemy,然后是一些知名品牌平台,例如DataCamp。 然后有十二个或更多个较小的利基平台,旨在以自己的方式培训数据科学家。
我评估了数据科学界人士推荐的18种平台。 根据您的学习风格和需求,这里有一个平台。 本文的前半部分是我对平台的最终评估,最后是平台的完整列表以及所有有助于评估它们的细节。 本文的下半部分详细介绍了我评估平台的方法-了解不同的用户类型,采购平台和要评估的变量。 因此,如果您有时间,请先跳到最后以了解我的评估标准,然后阅读结果。 如果时间紧迫,请转到下一部分。
TL; DR:我的评估
我创建了2个图来映射变量。 它们是带有您在所有白皮书中看到的象限的那些图。 老实说,我为选择这种可视化感到有些ham愧(感觉就像在Excel中制作3D饼图),但是我认为它将使您快速确定最适合您的平台。
图1:学习风格和经验
问自己:我的学习方式是什么? 我想直接潜水并开始编码吗?还是想先观看视频? 我是这方面的新手,需要更多帮助吗? 还是我可以直接跳进去?
> Learning style by user experience [Image created by N. Rosidi]
在基于演讲的平台的最末端是纯粹的被动演讲,例如网页上的文字或视频交谈的人。 这些平台通常会要求您自己安装软件,我认为这很懒,因为使用所有软件启动服务器非常容易,以提供完整的现成体验。 用户并不总是很先进-这就是他们要学习的原因-因此至少必须对我来说,为他们提供一种可以通过浏览器轻松访问的软件,库和数据集的体验。
互动式,自主学习使您可以按照自己的节奏工作,并选择想要学习或练习的主题。 在最末端,有一个功能齐全的IDE,可让您像在真正的专业环境中一样浏览,交互和操作数据。 但这不仅是完全自我指导的,还提供了可以帮助您解决问题和理解概念的解决方案。 这里的方法是立即开始编码,并在遇到问题时学习解决方案。 这些平台非常适合经验丰富的用户,即使您只是中等程度的经验。
中间立场是讲课和互动式自主学习的结合。 使用这些平台,您将走上一条"路线"和"道路",从头到尾学习一系列概念。 系统会向您显示文本和/或视频,然后要求您在交互式但受限的IDE中应用所学到的知识,在IDE中,系统会向您询问复杂的问题。 交互式但受限的IDE意味着IDE仅接受回答提示问题的输入,因此您不能偏离道路探索数据或尝试不同的功能和技术-知道,一位出色的数据科学家会做的事情。 这对于从头开始学习并试图从头开始学习新东西的人来说是完美的。
图2:内容重点
问问自己:我在尝试学习python吗? 还是我想学习python成为数据科学家? 我要准备面试吗? 还是我正在尝试建立我的第一个机器学习模型? 还是只是尝试学习基础知识?
> Educational topics by technical focus [Image created by N. Rosidi]
专业主题是针对特定目的的教育内容。 例如,它准备进行技术面试(数据科学或软件开发)。 这是要学习使用python进行财务建模或构建梯度增强的决策树。 这些平台服务于小众群体,但它们在满足用户群方面做得非常好。
通识教育只是对基本概念的介绍,这些基本概念是熟练掌握该语言的基础,例如如何创建熊猫数据框来操纵数据。 掌握了这些概念后,下一阶段将是深入研究满足您需求的特定主题。
设计平台时要考虑到用户。 在这种情况下,您是数据科学家还是软件开发人员? 如果您正在阅读本文,则可能是数据科学家,但正如我之前提到的,还有更多的教学平台可用于教授软件开发。 有时,这些平台提供python教育,但它们的内容和示例并不总是适合数据科学家使用。 这有点像将插件添加到软件中(它不是本机的,有时会显得有些笨拙)。
每个平台的详细评估
万一图表还不够用。
每个平台的知名度和独特性
> Link to the Google Sheet: https://bit.ly/2UknbZ3
哪种类型的用户将从每个平台中受益最多
> Link to the Google Sheet: https://bit.ly/2YaNlhR
根据用户体验水平的教学风格和功能
> Link to the Google Sheet: https://bit.ly/3f0SPm9
按技术重点列出的教育主题(数据科学和软件开发)
> Link to the Google Sheet: https://bit.ly/30kaqkS
因此,根据您的职业目标和学习方式,每个人都有一个平台。 在旅途中,您可能最终会使用其中一些平台,因为每个平台都专注于特定的优势。 选择一个数据科学平台,该平台可让您了解所处阶段所需要学习的知识。 希望这份清单对您有所帮助。
请参阅下面的我评估平台的方法…
附录:我评估18个平台的方法
1. 用户角色
我从了解用户-您开始。 在考虑哪种类型的人会对学习数据科学感兴趣时,我想出了3种不同的用户角色:
- 经验丰富的数据科学家:这些是当前的数据科学家。 他们要么拥有多年的经验和经验丰富,要么就职于公司,或者他们在第一份工作中是数据科学家。 无论哪种方式,这些家伙都在寻找新工作并且需要准备/补充他们的面试技能,或者想学习其他数据科学技能以进入另一门数据科学领域。
- 技术性,经验不足/有抱负的数据科学家:这些人可能是CS学生或当前的业务分析师。 他们编写代码,并且在开始提高数据科学技能时不需要太多的工作。 他们可能对数据科学的职业转变感兴趣。
- 非技术,缺乏经验/有抱负的数据科学家:这些人可能是学生,也可能是公司中非技术人员。 他们不会编写代码,也不知道从哪里开始,但是他们对数据科学事业或将自己的脚趾插入技术世界感兴趣。
2. 采购公司(包括和排除)
我问自己,有人将如何了解数据科学平台。 除了简单的Google搜索之外,大多数人会选择他们认可的品牌,或者根据推荐选择平台。
我选择从流行子索引的建议中找到平台,例如:
- r /数据科学
- r /编程
- r / python
- R / SQL的
Reddit拥有活跃的数据科学社区,因此这是一个不错的起点。 我补充了Quora,Google和Youtube。
我有意识地选择排除(MOOC)大规模的在线公开课程(例如Udemy,EdX和Coursera),训练营和大学课程,因为质量取决于教师和课程,因此我很难评估从苹果到 苹果。 另外,我认为经验丰富的数据科学家实际上不会参加有关如何成为数据科学家的Udemy课程,但我可能是错的。
对于每个平台,我都注册并使用了一段时间。 除非我无法根据自己的标准正确评估平台,否则我不会注册使用高级版本。
3. 我评估中使用的变量
我根据我认为对上述每个用户角色都很重要的4个主要变量评估了每个平台。
返回我的评估部分以阅读结果!