那些被低估的Python库

开发 后端
在这篇文章中,我们想展示一些不同于流行的东西。这些都是深夜浏览GitHub的感悟,以及同事们分享的压箱底东西。这些软件包中的一些是非常独特的,使用起来很有趣的Python包。

在这篇文章中,我们想展示一些不同于流行的东西。这些都是深夜浏览GitHub的感悟,以及同事们分享的压箱底东西。这些软件包中的一些是非常独特的,使用起来很有趣的Python包。

那些被低估的Python库

混合派

  • Knock Knock:从Python发送通知到移动设备、桌面或电子邮件。
  • tqdm:可扩展的Python和CLI进度条,内置对pandas的支持。
  • Colorama:简单的跨平台彩色终端文本。
  • pandas -log:提供熊猫基本操作的反馈。非常适合调试长管道链。
  • Pandas-flavor:扩展pandas DataFrame/Series的简单方法。
  • More-Itertools:增加了类似于itertools的额外功能。
  • streamlit:为机器学习项目创建应用程序的简单方法。

数据清理和操作

  • ftfy:修复mojibake和Unicode文本中的其他故障。
  • janitor:有很多很酷的功能来清理数据。
  • Optimus:另一个数据清理包。
  • Great-experctations:一个检查数据是否符合预期的好工具。
那些被低估的Python库

数据探索和建模

  • Pandas-profile:创建一个包含来自pandas DataFrame的统计数据的HTML报告。
  • dabl:允许使用可视化和预处理进行数据探索。
  • pydqc:允许比较两个数据集之间的统计数据。
  • pandas-summary:对panda DataFrames描述功能的扩展。
  • pivottable-js:pands在jupyter notebook的拖放功能。

数据结构

  • Bounter:有效的计数器,使用有限(有界)的数量的内存,无论数据大小。
  • Python -bloomfilter:可扩展的Bloom Filter,使用Python实现。
  • datasketch:提供概率数据结构,如LSH、加权MinHash、HyperLogLog等。
  • ranges:Python的连续范围、范围集和范围令数据结构
那些被低估的Python库

性能检查和优化

  • Py-spy:Python程序的采样分析器。
  • pyperf:用于运行Python基准测试的工具箱。
  • snakeviz:一个浏览器内的Python配置文件查看器,对jupyter notebook有很大的支持。
  • Cachier:Python函数的持久、无延迟、本地和跨机缓存。
  • Faiss:用于高效的相似性搜索和密集向量聚类的库。

原文:

https://towardsdatascience.com/the-most-underrated-python-packages-e22bf6049b5e?gi=f9ed1a098270

 

责任编辑:赵宁宁 来源: 今日头条
相关推荐

2022-03-22 08:50:57

Python代码自带库

2023-02-14 07:50:30

Python模块

2022-11-10 08:31:09

原生图数据库可视化

2024-01-03 14:07:06

技术ChatGPTIT

2013-06-28 17:28:04

推送

2009-12-21 10:05:00

2021-05-21 07:26:15

DataSource接口数据库

2023-11-09 09:02:26

TypeScriptas const

2015-07-28 17:00:48

运营商渠道

2021-11-15 10:48:59

元宇宙加密货币区块链

2020-10-04 11:34:28

JavaScript开发技术

2011-04-22 15:16:26

2017-08-08 16:04:30

Python图片处理文章提取器

2024-08-22 15:11:26

2024-06-06 10:13:04

2020-06-23 08:28:58

HTML标签Web

2022-12-28 08:59:11

2013-01-14 09:36:54

程序员程序员价值

2023-01-16 18:16:49

CinnamonLinux桌面环境

2015-03-03 09:24:48

IT管理云计算安全影子IT
点赞
收藏

51CTO技术栈公众号