数据科学家必须知道的前十大Python库

开发 后端 大数据
Python是比较流行和广为人知的编程语言之一,它已取代了业界的许多编程语言。它是数据科学专业人士比较喜欢使用的编程语言之一,因为它拥有庞大的库。

 Python是比较流行和广为人知的编程语言之一,它已取代了业界的许多编程语言。它是数据科学专业人士比较喜欢使用的编程语言之一,因为它拥有庞大的库。

[[336062]]

Python因其简单易用而被称为初学者级编程语言,它的编程语法易于学习,并且与C,Java和C ++相比具有较高的水平。

为了获得更准确的算法和编码,Analytics Insight给出前10个Python库

PyTorch

Pytorch是一个开源库,它基本上替代了Numpy。 PyTorch带有高级功能,可用于构建深度神经网络。数据科学专业人士仍然可以使用其他语言,例如scipy,Cython和numpy,这些语言可在需要时帮助扩展PyTorch。 Pytorch被包括Facebook,Twitter,Nvidia,Uber在内的许多组织所使用,用于快速建立研究原型并训练深度学习模型。

GitHub:https://github.com/pytorch/pytorch

Arrow

Arrow是一个人类友好的Python库,它提供了诸如对日期,时间和时间戳进行转换,操纵,创建和格式化的功能。它支持Python 2和3,它是DateTime的替代方法,它具有更好的界面,以促进丰富的功能。

GitHub:https://github.com/crsmithdev/arrow

IPython

这是最有用的python工具之一,为用户提供了丰富的体系结构。使用IPython,用户可以在其浏览器中编写和执行python代码。 Ipython可在多种操作系统上运行,包括Windows,Mac OS X,Linux和大多数其他Unix OS。 Ipython为用户提供了更多功能,包括帮助功能,高级编辑等。

GitHub:https://github.com/ipython/ipython

TensorFlow

Tensor flow是由Google Brain团队创建的开源机器学习python库。 Tensor流库用于开发,训练和设计深度学习模型,并且可以用于进行数值计算。 Tensor Flow是Theano的替代产品,它可以在移动设备,单CPU系统和GPU上运行。

GitHub:https://github.com/tensorflow/tensorflow

Caffe2

Caffe2是将Caffe框架带入现代世界的尝试。它支持分布式培训,甚至可以在移动平台中进行部署。虽然PyTorch可能更适合研究,但Caffe2适合进行大规模部署,如Facebook上所示。

GitHub:https://github.com/caffe2/caffe2

Scrapy

Scrappy是一个广泛使用的Python Web抓取库。 Scrappy最初用于创建爬网程序,ands 则专门用于抓取,如其名称所示。现在它用于多种用途,包括数据挖掘,自动化测试等。scrapy是开源的,必须具有库。

GitHub:https://github.com/scrapy/scrapy

Requests

Requests是著名的Python库之一,该库在Apache2下获得许可并用Python编写。该库可帮助用户与多种语言进行交互。借助Requests库,用户可以手动将字符串串接到其URL。他们可以使用Request 库将HTTP请求发送到服务器,并且可以添加表单数据,内容(如标头,多部分文件等)。

GitHub:https://github.com/requests/requests

Zappa

Zappa是由Miserlou创建的比较好的python软件包之一,它很容易在API Gateway和Amazon Web Services Lambda上构建和实现无服务器应用程序。由于AWS自动处理水平扩展,因此没有请求会超时。使用Zappa,您可以使用Zappa在一行中更新代码。

GitHub:https://github.com/Miserlou/Zappa

Flashtext

FlashText是更好的选择,它的优点包括,无论用户有多少个搜索词,其运行时间都是相同的,而regexp则相反,运行时间几乎随词的数量线性增加。

GitHub:https://github.com/vi3k6i5/flashtext

Fire

Fire是一个开源库,可以为任何Python项目自动生成命令行(CLI)。用户几乎不需要编写任何代码或文档字符串来构建其CLI!他们只需要调用Fire方法并将其传递给CLI的任何方法传递给它:函数,对象,类,字典,甚至根本不传递任何参数,这会将整个代码转换为CLI 。

GitHub:https://github.com/google/python-fire

 

责任编辑:华轩 来源: 今日头条
相关推荐

2017-08-21 17:25:57

数据科学家深度学习计算机视觉

2019-04-09 09:00:01

数据科学代码编写

2022-09-07 23:54:17

机器学习无监督学习算法

2018-10-18 09:00:00

机器学习机器学习算法数据科学家

2019-05-05 10:59:26

数据科学家数据科学编码

2017-08-04 15:53:10

大数据真伪数据科学家

2022-11-03 14:13:24

腾讯科学家

2020-02-24 00:08:11

疫情数据科学家数据科学

2020-03-20 14:40:48

数据科学Python学习

2019-01-08 16:25:42

数据科学机器学习神经网络

2020-10-31 22:04:39

统计和数据科学数据科学家

2018-01-31 22:30:05

数据科学家数据专家工程师

2011-06-28 09:30:00

2018-12-24 08:37:44

数据科学家数据模型

2012-12-06 15:36:55

CIO

2019-07-08 16:18:56

PandasPyhton库数据处理

2023-05-05 14:14:10

2023-11-10 10:39:58

2023-04-20 10:29:46

数据管理数据分析

2015-09-15 09:32:50

点赞
收藏

51CTO技术栈公众号