在本文中,我们将提供一份完整的清单,涵盖了在数据科学与机器学习面试中可能会遇到的各种题目、学习案例以及智力测试题。此外,我们也列举了一些额外的资料,包括各种实用的提示与诀窍,希望通过这些指导让你顺利通过面试。
介绍
你是否有志于成为一名数据科学家,却又因为不知如何克服面试而头疼不已?好吧,其实你不是一个人!跨入数据科学领域并不是一件简单的事,而如果你不具备数据科学方面的背景,实现这一目标更是难上加难(很可能这正是你的现状吧)。
而你从其他同样想成为数据科学家的人们那里所听来的各种故事,说不定会使面试这件事更加令人望而生畏。因此,在进行面试之前,你最好能进行充分的准备。
你会被问到哪些问题?需要进行哪些准备,参考哪些资料?典型的数据科学面试的过程是怎样的?你的身体语言应当怎样表现?这些问题或许正浮现在你的脑海中。
别担心,来这里就对了!
我本人也同样经历过这段过程。相信我,克服数据科学面试的唯一办法,就是进行充分的练习并实现较高的质量。因此,请确保你进行一系列项目的训练。如果你正在寻找数据科学方面的项目,可以参考一下这些内容
此外,你还需要对常规的面试流程进行对应的练习,这也是本文的重点。
在本文中,我们将提供一份完整的清单,涵盖了在数据科学与机器学习面试中可能遇到的题目,学习案例以及智力测试题。 此外,我们也列举了一些额外的资料,包括各种实用的提示与诀窍,希望通过这些指导让你顺利通过面试。
本文列举的内容是你能找到的最全面的终极资料,请务必将本文保存到收藏夹中,今后每次需要准备面试时都可能会用得到。
祝学习愉快,面试顺利!
目录
-
数据科学与统计问题
-
机器学习问题
-
深度学习问题
-
案例学习
-
智力题与猜估
-
特定的工具与语言问题
-
新手提示与诀窍
-
励志的故事
1. 数据科学与统计学问题
这部分内容的目标是测试、强化及提高你对数据科学与统计学方面概念的理解能力。涵盖了概率与相关性;线性回归与逻辑回归等等。当你看完最后一篇问题后,你对相关概念的掌握就会变得相当扎实。
1. 1 40 创业公司在机器学习与数据科学方面常见的问题
本文列举了 40 个你在面试中很可能遇到的现实而又棘手的问题。如果你能够理解并解答这些问题,就可以放心了,你的面试表现将出十分出色。答出这些问题的关键,在于你是否对于机器学习及相关的统计学概念有着扎实的、具有实践性的理解。
1. 2 数据科学方面的 40 个概率论问题
概率论被视为诸多数据科学相关概念与技术的基础,为了赢得成为数据科学家职位的机会,你必须很好地掌握概率论。本文中的题目将评测出你对概率论的掌握程度。
1. 3 7 个最常见的相关性问题
文章地址:https://www.analyticsvidhya.com/blog/2015/06/correlation-common-questions/
相关性是数据科学领域的核心概念之一,虽然表面看起来简单,但实际上它也有一些难以掌握的特性。如果你正在学习统计学方面的概念,就必然要面对这些大部分人试图回避的问题。即使是已经精通统计学的读者,本文也可以帮助他们巩固这方面的知识。
1. 4 数据科学家与分析师相关的 41 个统计学问题
文章地址:https://www.analyticsvidhya.com/blog/2017/05/41-questions-on-statisitics-data-scientists-analysts/
在开始统计学相关领域的面试前,你需要充分掌握这方面的概念。为了帮助你提高并测试统计学方面的知识水平,我们精心准备了这一份问题列表。本文涵盖了描述统计与推论统计方面的问题,并为每个问题提供了解答。
1. 5 评测数据科学家在线性回归方面知识的 30 个问题
在数据科学行业与学术界,线性回归仍然是用于解释特征之间的关联性最常用的统计学技术之一。如果你希望成为一位数据科学家,线性回归是一项你必须充分了解的技术。
1. 6 评测你对于逻辑回归理解水平的 30 个问题
文章地址:https://www.analyticsvidhya.com/blog/2017/08/skilltest-logistic-regression/
逻辑回归很可能是处理所有分类问题中最常用的算法。文章中所列举的问题是经过精心设计的,专门用于测试你在逻辑回归及其细节问题相关知识的掌握程度。
2. 机器学习问题
机器学习已经成为大量企业的核心策略,如果你希望在这一领域发展你的职业生涯,就需要准备好面对这些难题。这一部分的内容将会最大限度地测试你的机器学习技能。
2. 1 评测数据科学家在机器学习方面能力的 40 个问题
如果你已经是(或者正打算成为)一名数据科学家,则必须掌握机器学习,别无选择。文章中的问题是经过特别设计用来测试你对于机器学习概念性知识的掌握程度的,它将使你做好进入这一行业的准备。现在请准备开始测试吧!
2. 2 评测数据科学家在自然语言处理方面能力的 30 个问题
自然语言处理(NLP)是一种对机器进行训练,使机器能够理解人类的语言及文字的科学。它是机器学习行业中发展非常迅猛的一个领域。各企业已开始意识到通过使用机器学习方式,从人类书写的文本中汲取指导性见解的强大力量。请完整地阅读这些问题,看看你在 NLP 方面的掌握程度如何。
2. 3 评测数据科学家在树模型方面能力的 30 个问题
文章地址:https://www.analyticsvidhya.com/blog/2017/09/30-questions-test-tree-based-models/
决策树(Decision Trees)是机器学习及数据科学领域中最为人所推崇的算法之一,它的优点在于清晰、易于理解、天然的健壮性以及广泛的适用性。你可以看到该算法实际进行了哪些操作,以及它采用了哪些步骤以获得最终方案。在某些业务场景中,如果需要向项目干系人解释某个决策的理由,上述特点就变得非常重要。这部分内容也是面试环节中的一个重要组成部分。
2. 4 评测数据科学家在支持向量机方面能力的 25 个问题
文章地址:https://www.analyticsvidhya.com/blog/2017/10/svm-skilltest/
你可以将机器学习算法想象成一个军工厂,其中堆满了刀剑和斧头等武器。尽管你有这么多工具可选择,但仍然要学习如何在正确的时机使用它们。“支持向量机”(Support Vector Machines)可以比喻为一把锋利的小刀 —— 它用于处理较小的数据集,但通过这些小型数据集,它就可以在创建模型方面发挥更强大的能力。通过对文章中的 25 个问题进行自测,可以提升你在这一成熟技术方面的知识。
2. 5 评测数据科学家在降维技能方面能力的 40 个问题
文章地址:https://www.analyticsvidhya.com/blog/2017/03/questions-dimensionality-reduction-data-scientist/
在面试中,最常见的问题之一是如何处理庞大的数据集,它可能包含百万级的数据行以及几千个数据列。在你遇到这类问题时,对降维(Dimensionality Reduction)技术的理解以及了解在哪些场景下使用这个技术将会非常有帮助。
2. 6 评测数据科学家在聚类技术方面能力的 40 个问题
文章地址:https://www.analyticsvidhya.com/blog/2017/02/test-data-scientist-clustering/
在通过非标签化数据获取认识的过程中,聚类(Clustering)技术扮演着一个重要的角色。它将数据分类为类似的分组,它为各种商业决策提供了基本的理解能力,从而提升了决策的准确性。聚类广泛应用在市场、财务与其他多个产业中。这又是一个你必须了解的概念,请务必充分掌握。
3. 深度学习问题
深度学习是目前在人工智能行业中最火热的研究领域,在它的带动下,各种令人惊叹的创新和震撼的突破层出不穷,而这才仅仅是个开始!不过,这一领域的工作机会却相对稀少。如果你有幸得到一次面试机会,务必对各种困难问题进行充分的准备,在深度学习领域的工作是没有捷径的。这部分内容可以使你认识到是否已经为面试做好了准备。
3. 1 评测数据科学家的深度学习基础知识的 45 个问题
文章地址:https://www.analyticsvidhya.com/blog/2017/01/must-know-questions-deep-learning/
如果你希望进入深度学习行业,文章中的问题是你必须了解的,也相对比较简单。在阅读这一部分的后续文章之前,先尝试着做一下本文中的测验,看看你的水平如何。如果遇到你不熟悉的概念,文章中也提供了相应的学习资源的链接。让我们开始吧!
3. 2 评测数据科学家的深度学习能力的 30 个问题
文章地址:https://www.analyticsvidhya.com/blog/2017/08/skilltest-deep-learning/
本文是测试你的深度学习知识水平的一个良好的起点,文中列举了从初级到高级的各类问题。在这篇测试问题刚发布后,从结果来看,很明显大多数进行测试的读者都没有充分地掌握深度学习的知识。你能拿出更好的表现么?来试试看吧!
3. 3 评测数据科学家的深度学习能力的 40 个问题
文章地址:https://www.analyticsvidhya.com/blog/2017/04/40-questions-test-data-scientist-deep-learning/
本文的内容是上一篇文章的续篇,它将测试你对于深度学习概念的知识水平。
3. 4 评测数据科学家的图像处理能力的 25 个问题
文章地址:https://www.analyticsvidhya.com/blog/2017/10/image-skilltest/
在深度学习世界中,图像处理是当前最火热的领域。由于 Google 和 IBM 这些业界巨头纷纷发布了用于生成图像分类模型的自动化平台,人们对这一领域的热情也在不断升温。本文所列举的问题将测试你在处理图像数据,尤其是图像处理这部分的知识水平。
3. 5 12 个深度学习方面的常见问题
文章地址:https://www.analyticsvidhya.com/blog/2018/05/deep-learning-faq/
虽然本文的内容并不是特别针对面试而设计的,但你仍然应当完整地回答每个问题。其中包括一些最基础的深度学习问题,对你来说应该是小菜一碟。
4. 案例学习
案例学习也是数据科学面试流程中的一个重要环节,在遇到这类问题时,面试经理一定会考查你的结构化思维能力。请确保你仔细阅读以下案例,在查看答案之前,先尝试自己解决这些问题,然后再对照答案检查一下你的回答。
4. 1 通过动态规划方式以 10 倍的速度解答面试中的案例
文章链接:https://www.analyticsvidhya.com/blog/2016/05/ase-studies-10x-faster-using-dynamic-programming/
动态规划并不是一种仅仅通过提供的输入值就能够给出正确答案的秘诀或是数学公式,而是通过结合结构化思维和逻辑思维而完成任务的一种方式。这种概念已经有一定的历史了,目前的使用场景也并不算多。如果你学会了这种独特的方式,面试官一定会大为震惊的!
4. 2 数据分析能力面试的案例 —— 出租车调配问题
文章链接:https://www.analyticsvidhya.com/blog/2016/04/case-study-analytics-interviews-dawn-taxi-aggregators/
出租车调配在某些地方已经成为一个重要的课题。在本文中,我们将解决一个出租车调配的案例。除此之外,我们也需要特别关注像一位专家一样处理案例问题的关键点所在。像贝恩、BCG 和麦肯锡这样的咨询公司,都很看重面试者在面对案例分析时能否像专家一样思考。本文将助你成为具备这种素质的面试者。
4. 3 分析学面试中的一个案例
文章链接:https://www.analyticsvidhya.com/blog/2014/02/interesting-analytics-case-study/
这是一道经典的路径优化问题,给你几条可选择的道路的相关数据,让你指出最省时间的走法。每答出一道问题,下一题你将面对更多的数据,一步步深入整个案例。这正是你将在面试中面对的情形,开足马力吧!
4. 4 适合新手的案例:呼叫中心优化(难度中)
文章链接:https://www.analyticsvidhya.com/blog/2016/04/case-study-level-medium-call-center-optimization/
本文介绍了一个真实生活中的场景:对某个呼叫中心的工作进行优化。通过学习这一案例,你可以摸索出如何在这样一个操作密集的职位上模拟出整个环境。文中的代码是用 R 语言实现的,不过即使你不熟悉 R,也可以在 Excel 里完成这一问题。
4. 5 案例学习:为某个线上商家优化产品价格(难度高)
由于在现实世界中的广泛应用,该案例也成为了一道经典题目。它的目标是为某家线上商家优化产品价格体系,其实即便在实际生活中,你也需要进行类似的计算。因此,该案例不仅仅是一道数学题目,同样也具有现实意义。在应聘较高级的职位时,类似的案例经常出现在面试过程中。因此请尽力一试吧!
5. 智力与猜估题
如果你有志成为一名数据科学家,那么直觉性的思考以及快速计算和组织思维的能力将成为一个关键点。这也正是面试官会首先考验你的问题之一,他会提出一道智力题或猜估题(或是两者皆有),以考验你能否快速而逻辑性地解决这些富有挑战性的题目。这部分内容将帮助你为克服这些挑战做好准备!
5. 1 通过猜估题测试的诀窍
文章链接:https://www.analyticsvidhya.com/blog/2014/01/tips-crack-guess-estimate-case-study/
猜估题在分析学与管理咨询相关的面试过程中非常普遍。如果你希望顺利通过数据科学面试,本文对于帮助你通过第一步非常有用。在本文中,你将学习到一些经过测试与验证的技巧,以帮助你克服猜估题。
5. 2 每个分析师都应解决的 20 道富有挑战性的面试智力题
作者在文章中介绍了他在面试数据科学职位时曾遇到的几道最困难、最有挑战性的智力题。这些面试题出自高盛、亚马逊、谷歌和摩根大通等公司。
5. 3 大部分面试者都无法通过的 3 道智力难题
文章链接:https://www.analyticsvidhya.com/blog/2016/01/3-tricky-puzzles-people-wrong-job-interviews/
本文所介绍的三道智力难题是大多数人在面试中都无法做对的题目。由于这些题目本身就难以理解,如果你无法一次性得出答案也很正常。千万不要放弃!有些时候,最难的问题反而有着最简单的解决方法。
5. 4 分析学面试中常见的智力题(第 1 部分)
文章链接:https://www.analyticsvidhya.com/blog/2014/09/commonly-asked-puzzles-analytics-interviews/
本文涵盖了在面试中最常见的一些智力问答题,由于这些问题相对简单,不用费多少功夫就应当得出答案。万一你在规定时间内无法解出其中的两道题,或许可以尝试一下解答不同类型的智力题,熟悉一下解决这些问题的思路。
5. 5 分析学面试中常见的智力题(第 2 部分)
文章链接:https://www.analyticsvidhya.com/blog/2014/10/commonly-asked-interview-puzzles-part-ii/
本文的第二部分与上半部分的内容是一脉相承的,由易到难解决各种智力题。题目共分为三个部分,并且第一部分的问题是没有给出解决方案的。如果你无法自行得出答案,意味着你或许需要从头开始学习解答智力题的技巧!
6. 针对特定工具与语言的问题
每个有志成为数据科学者的读者至少应掌握一门工具,以处理质量分析问题。不过,你掌握的工具越多,你的技能就越广,坐上你想要的职位的机会也就越大。在数据科学职位的面试过程中,工具类的问题是不可缺少的一环,在你开始实际面试前,应该对这一点做好充分准备。这一部分的内容涵盖了 Python、R、SQL 以及 SAS。
6. 1 数据科学评测之 R 语言技能的 40 个问题
文章链接:https://www.analyticsvidhya.com/blog/2017/05/40-questions-r-for-data-science/
本文中的练习将全面地测试你的 R 语言技能,包括编程问题以及概念性问题。在答题时请快速给出答案。我的建议是在自测时给每道题设定时间限制,这样在面对面试组的时候就不至于手足无措。
6. 2 4 个高难度的 R 面试题
文章链接:https://www.analyticsvidhya.com/blog/2014/05/tricky-interview-questions/
R 是当今最受欢迎编程语言之一,这主要得益于它开源的本质,以及优秀的用户社区。文中的 4 个问题是当你面对面试的压力时可能会遇到的最困难的问题。最好对此进行精心准备!
6. 3 在面试中常见的 4 个棘手的 SAS 问题
文章链接:https://www.analyticsvidhya.com/blog/2013/11/4-sas-tricky-analytics-interview/
SAS 与其它语言的不同之处在于它非常易于编写。但某些 SAS 方面的问题还是非常有难度的,对于部分面试者来说确实相当困难。本文介绍了 4 个这类问题,并提供了详细的案例以帮助你着手克服这些困难。
6. 4 在 SAS 基础方面的一些高难度面试题
文章链接:https://www.analyticsvidhya.com/blog/2014/04/tricky-base-sas-interview-questions-part-ii/
本文实际上是前文的后续,文中的问题与本系列文章中的上一篇相比难度更高,题目也更长。会问到这些问题的公司往往在分析学方面有着比较强的基础,大数据问题的处理是它们的日常任务之一。
6. 5 数据科学评测之 Python 技能测试方面的 40 个问题
文章链接:https://www.analyticsvidhya.com/blog/2017/05/questions-python-for-data-science/
Python 在数据科学相关工具中已经牢牢地占据了领先地位。文中所列举的问题是与这门编程语言相关的必读题。在参加数据科学方面的面试之前,请确保你已经经过这些问题的测试,为自己打下一个良好的基础。
6. 6 评测数据科学家的 42 个 SQL 问题
文章链接:https://www.analyticsvidhya.com/blog/2017/05/questions-sql-for-all-aspiring-data-scientists/
无论你使用哪种语言进行建模,掌握 SQL 语言都是你的简历中不可缺少的一部分。否则,走上数据科学家岗位的机会就变得非常渺茫。本文列举了一份详尽的问题,充分磨练你的 SQL 技能,以做好面试的准备。
7. 新手提示与技巧
对于刚刚跨出校门的毕业生来说,获得一份数据分析方面的职位并不容易。某些幸运儿或许能够被企业选中,委任数据分析方面的工作。但是不能指望这种幸运会凭空而降!本文是特别为新手所设计的,以帮助他们更好地准备面试的流程。
7. 1 参与数据分析与科学企业校园招聘时的几点提示
文章链接:https://www.analyticsvidhya.com/blog/2015/11/tips-crack-campus-interviews-non-core-companies/
本文的作者对于通过校园招聘的模式进行了细致的研究,这些模式能让你清晰地了解各种数据分析类的面试。在这篇文章中,作者分享了他在这方面的见解,并提供了一些实用的面试技巧。许多候选人对这些技巧想当然地置之不理,结果在错失 Offer 之后后悔不迭。
7. 2 新手如何在商业分析岗位的面试中脱颖而出
文章链接:https://www.analyticsvidhya.com/blog/2013/07/prepare-ace-interviews-business-analytics-roles/
部分校园招聘的面试是非常有挑战性的,尤其是顶级企业的职位。而对于新手来说,缺乏面试经验也会不时地造成你的局促不安。不过,你完全可以进行针对性的训练,以确保你在关键时刻能够发挥出最佳水平。通过学习本文的技巧,可以使你在任何数据分析面试过程中尽情发挥。
8. 数据科学家面试的其它(非常)实用的资料
至此,我们已经学习了面试过程中题目与答案的部分。但即便你已经了解这些知识,如果忽略了以下这部分内容所涵盖的面试技巧与行为准备,或许还是不够!诸如身体语言、思维组织方式、对行业的了解、领域知识以及能否跟上机器学习最新的发展等因素都将对结果起到很大的影响。
8. 1 留神 - 数据分析岗位的面试官正在仔细观察你!
文章链接:https://www.analyticsvidhya.com/blog/2015/06/analytics-interview-behaviour-to-avoid/
作为一个数据分析师,对细节的把握和认真钻研几乎已经成为了他们的第二天性。在面试中所遇到的面试官很可能在数据分析的岗位上工作的时间比你更长。因此,你应做好准备,对你的评测可能是非常详尽的。这一部分所列举的技巧对于这种场合非常实用。
8. 2 数据分析面试准备工作权威指南
文章链接:https://www.analyticsvidhya.com/blog/2014/07/definitive-guide-prepare-analytics-interview/
本文阐述了数据分析面试时的常见过程,涵盖了雇主考查你的各个方面,面试过程中的不同环节,以及技术面试的过程等等。这份指南将帮助你在数据分析面试中脱颖而出!
8. 3 开始数据科学生涯的 8 个重要提示
文章链接:https://www.analyticsvidhya.com/blog/2017/10/tips-people-starting-career-data-science/
我应该学习什么工具 —— R 还是 Python? 应当关注哪些技术?需要学习多少统计学知识?需要学习编程技术么?在踏上数据科学之旅后,你会面临以上问题。这也是为什么我们会编写这一篇简短的文章的原因,文章中所介绍的框架将帮助你顺利渡过数据科学生涯的初期阶段。
8. 4 关于数据分析相关职业,你应当了解的 10 件事
文章链接:https://www.analyticsvidhya.com/10-analytics-related-career/
本文是一份难得的资料,其中包含了各种详尽的指导!其中列出的文章都是与职业生涯相关的建议与知识。如果你打算进入数据分析行业,这些文章将使你了解必须经历的所有步骤。
8. 5 回归工作后打入从事数据分析行业?别指望一切会那么顺利!
文章链接:https://www.analyticsvidhya.com/blog/2015/05/moving-analytics-break-career-expect-rosy-land/
很多人会因为各种各样的原因离开工作岗位 1-3 年时间,你是否正面临着相似的状况?缺乏相关经验的人如何在重回工作后踏入分析师的岗位?在本文中,Kunal 将讲述他个人的经历,并提出他对这一问题的见解。
8. 6 如何克服缺乏数据分析工作经验的弱点
文章链接:https://www.analyticsvidhya.com/blog/2014/05/no-analytics-work-experience/
与上文类似,本文旨在帮助那些缺乏行业经验的从业者在重返工作后参与数据分析工作。其中的某些要点既适用于新手,也适用于有经验的从业者。Kunal 将从雇主和潜在候选人两方面的观点进行叙述,因此这是一份必读的文章。
8. 7 计划未来从事数据分析与大数据相关工作?请务必做好准备!
文章链接:https://www.analyticsvidhya.com/blog/2014/05/planning-late-career-shift-analytics-big-data-prepared/
近 4 年以来,它或许是最常见的问题之一,本文会告诉你在这种情形下会面对的问题。本文不会给你灌鸡汤(比如告诉你挑战虽然有,但是可以通过努力的工作与投入克服阻碍),而是毫无保留地告诉你各种很有价值的技巧。
8. 8 如何训练你的大脑以培养逻辑性思维?
文章链接:https://www.analyticsvidhya.com/blog/2014/01/train-mind-analytical-thinking/
如果你每天不停地进行计算,这一过程就会变得越来越自然和准确。上班族每周平均有 25 - 30% 的时间用于睡眠,40 - 60% 的时间用于工作,10% 的时间用于吃饭,还有 15 - 25% 的时间处于休闲状态。在忙碌的日常生活中,有超过一半的休闲时间都花在交通上。你完全可以利用这一部分时间锻炼出更敏锐的反应能力。本文为你推荐了一些有趣的方式,让你在休闲时间内磨练大脑的反应能力。
8. 9 想要接受一份数据分析领域的新工作?请先抛出这 5 个问题
文章链接:https://www.analyticsvidhya.com/blog/2013/09/analytics-job-5-questions/
在你准备接受一份数据分析相关的职业前,这几个问题是你需要询问你的未来雇主的。设计这些问题的目的是希望确认你已经了解你所要走上的岗位是什么样的。这些问题不仅能够帮助你做出正确的选择,同时也给了雇主一个信号:你对于应聘这个职位、从事该行业的决定是非常严肃的。
9. 励志故事
想给自己点激励?看这里就对了!下面的这些故事会激励你更加努力地工作,以获得梦寐以求的数据科学职位。
9. 1 作为一个 8 年经验的软件测试工程师,我是如何成为数据科学家的
这篇故事的主人公是 Bindhya Rajendran,她是一位电子通信方面的工程师。在她从事质量保障领域的工作 8 年之后,通过自身的努力和一丝运气,顺利地得到了数据科学领域的一份工作。
9. 2 在 IT 行业工作 10 年之后,我如何成为一名数据科学家
Karthe 在这篇文章中介绍了他是怎样在 IT 行业工作了 10 年之后,转型为一名数据科学家的故事。同时,他在文章中也提出了许多实用的技巧,他的经历对于那些处于类似情况的候选人能起到很大的激励作用。
结语
本文是你所能找到的最全面的一份资料集,如果你从头至尾认真地进行阅读练习,可以说你已经做好了面试数据科学职位的准备。即便你已经熟悉文中大部分主题的内容,这篇指南也将帮助你回顾相关的知识点。
那么,你有什么样的故事呢?这篇指南是否对你更好地准备下一次面试派上用场?欢迎你留言告诉我们!
查看英文原文: