什么是数据科学
数据科学通常被描述为统计和编程的交集。在本文中,我们讲介绍如何在你的电脑上设置立专业数据科学环境,这样你就可以开始动手实践与流行的数据科学库!
什么是专业的数据科学环境?一个普遍的共识是它的出现有下面两个原因:
- 编程语言:Python 3。有许多有实践经验的数据科学家继续使用R -特别是如果他们有很强的统计学背景。但总的来说,Python是一种更通用、更流行的编程语言,它可以更容易地解决更广泛的问题,从web抓取和数据清理到建模和构建仪表板或生产您的模型。如今,大多数数据科学家都在使用Python 3。
- 编辑:Jupyter Notebook——有很多很棒的文本编辑器可以用来编辑Python代码,比如Visual Studio Code则是一个流行的免费选择。但要创建可共享的文件,使您可以轻松地交错注释、代码和图表,它真的很难击败Jupyter Notebook。
安装Python和Jupyter笔记本最简单的方法是通过免费的Anaconda发行版。它还包括很多你需要的数据科学的软件包,像pandas,statsmodels和scikit-Learn。
安装过程取决于你使用的是Windows还是Mac或者是linux系统。我们今天介绍的是如果在Windows系统下安装
安装过程
点击Python 3的“下载”按钮。

这时会弹出一个窗口,询问你是否愿意向Python提供你的信息——除非你愿意,否则你不需要这样做。
您应该会在浏览器窗口的底部看到一个.exe文件正在被下载。下载完成后,点击浏览器左下角文件名称右边的箭头,选择“open”。

如果你在浏览器中看不到这个文件,你也可以打开Windows资源管理器,导航到“下载”目录,双击列表中的Anaconda文件来打开它。

这将打开Anaconda安装程序,它将为你在电脑上安装软件。

单击“Next”,然后单击“我同意”接受许可,然后您可以为“Just me”安装,单击“Next”。然后选择目标文件夹(默认值应该适用于大多数人)。

在下一个屏幕上,确保选中“添加Anaconda到我的路径环境”复选框。它会告诉你不推荐这样做,但是这是能够从命令行访问Anaconda所必需的,它会给你在项目中工作时最大的灵活性。然后单击“安装”。

这个步骤可能需要几分钟。

一旦安装完成:

点击“下一个"。你可以跳过Microsoft Visual Code Studio或PyCharm的安装。

最后点击“完成”。

它会打开一个浏览器窗口,你可以直接关闭。

这就是安装Anaconda的过程!下一步是测试您的安装
测试
要测试安装,在Windows上单击“开始”,然后在程序列表中 单击“Anaconda Navigator”(或者在搜索栏中搜 索“Anaconda Navigator”并选择“Anaconda Navigator”)。

在Mac电脑上,打开Finder,在Applications文件夹中 Anaconda Navigator。
Anaconda Navigator是其中一种方式,你将能够运行 Jupyter notebook:
