机器学习一直是热门话题,它确实有理由如此重要,它能帮助人们预测未来的行为,使电子邮件免受垃圾邮件的干扰,并根据喜好记忆作出电影推荐。
机器学习有无尽可能性,该领域薪资高,工作者在工作上能享受到极大乐趣,这让他们大多数时候感觉不像工作。然而,零经验者如何在合理时间内掌握机器学习?本文会给出答案。
无论背景如何,所有人的第一步都相同。不是只有数学博士才能进行机器学习。我没有数学博士学位,也不认为自己格外聪明,不过一件事是肯定的——我比身边所有人都用功。
如果不工作,高学历将一文不值。
话虽如此,初学者应客观准确地评估自身的当前状况。问自己几个问题:
- 我的编程能力如何?
- 我上一次解决数学问题和做统计数据是什么时候?
- 我愿意投入多少时间到机器学习上?
注意,进行应用机器学习无需专于以上任一领域。只需编程能力优于普通数学家,数学能力优于普通程序员即可。这是黄金准则。
如果你看到这里,很好,现在请准备好进入让人又爱又恨的机器学习世界。
1. Python数据科学和机器学习训练营
来源:Pexels
这是一门在线课程,观看大约需要22个小时,但可能要花5倍时间才能完全理解。课程从复习Python到介绍库,再深入研究机器学习算法。
我已完成该课程——它是入门学习机器学习的好方法,但仅此而已。因为这些算法并没有讲解得很深入。当然,完成课程后你能够使用算法并以此解决实际问题,但是很可能不清楚要用何种算法、何时以及如何(适当)调整算法。
这是因为,这门课程的重点并不在于数学。事实上我认为这门课程根本没讲到任何数学运算,仅仅在讲解如何运用Python的各种库。课程作者建议学员在学习课程的同时阅读《统计学习入门》以获取扎实的理论基础。我也认为需要读这本书。
然而,该课程仍提供了诸多实践的好机会。
价格:Udemy上原价为194.99美元,但经常可以享受9.99美元的折扣价。这个投资绝对不会亏。
2. Coursera:Andrew Ng的机器学习课程
这门课程就如同进入机器学习行业的标准。到目前为止,已有12万多名用户对该课程评分,平均分4.9,满分为5。这也证明了它的优质。
视频画质不佳,但是内容质量弥补了这一点。这门课程的内容要比第一门课程深入得多,尽管Ng说有些地方不懂也没关系,但还是应该找到自己的弱项然后尽己所能强化它。
据我所知,实验室使用一种叫“八度(Octave)”的奇怪语言,它是Matlab的免费替代品。这几乎是这门课的唯一缺点,因为如今大家几乎只用Python或R语言进行机器学习。
价格:观看视频是免费的,但是必须支付100美元才能获得结业证书。
将证书添加到领英的个人页面很酷,但这不是必需品。
3. 哈佛大学:CS109A
来源:sina
与前两个学习资源不同的是,这不是视频课。它是一个GitHub库,上面有理论部分的讲座(PDF)和Jupyter实验室笔记。
老实说,我不知道为什么这个资源会免费。
明明这是一门由世界顶尖大学之一制作的完整课程,居然完全免费。它包含20多个讲座,13份实验室笔记,总体上是机器学习的不错起点。我还没完成学习,因为我最近才开始看这份资源。但是从已经学习的部分看,它确实很棒。
价格:免费,跟着库学习就行。
机器学习准备工作
来源:Pexels
现在你已经得到3个很棒的学习资源,可以开始机器学习之旅了。这绝非易事,尤其是在你缺乏一些背景知识而需要补回这些知识的情况下,但付出的精力都是有回报的。
如果零基础者,我会推荐从第三个资源哈佛大学课程开始学习,我认为这是以上三个资源课程里最好的。
但这也不意味着另外两个很糟糕,相反它们都很棒。我的建议是:
- 如果想对理论部分有个广泛的总概学习,并且想要很多实践机会,请选择第一个
- 如果想掌握机器学习总论且不喜欢视频课,请选择第三个
- 如果想要了解一点背景知识,但也想理解模因,请选择第二个
感谢阅读。保重身体。