pandas语法乱、API多?你需要整理一下!

开发 前端
pandas作为Python的一个强大扩展库,被很多人称为数据分析界的“瑞士军刀”。

 

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。

pandas作为Python的一个强大扩展库,被很多人称为数据分析界的“瑞士军刀”。

然而,它也被不少学习者诟病:语法很乱!API太多!

[[401014]]

有没有什么好办法能够快速上手呢?

为此,有网友在知乎提出这样的问题:

pandas语法乱、API多?你需要整理一下!|知乎讨论

该问题引起了不少网友的共鸣,很多人也提供了自己上手pandas的方法。

为啥这么乱?

首先来看,大家都吐槽pandas用起来感觉很混乱,那为什么会这样?

针对这个问题,来自中科院大学的@李丁表示,由于Pandas等Python的科学计算包都是

“一帮学术界人士搞的”,主要是模仿R语言,又没有模仿到R的灵活语法。最后就是只做

到了功能全面能用就行,没有关注好不好用等其他代码工程素养问题

pandas语法乱、API多?你需要整理一下!|知乎讨论
pandas语法乱、API多?你需要整理一下!|知乎讨论

结果就是虽然它很乱,但是迫于它的“地位”,很多人还是不得不使用它。那大家都是如何上手的呢?

“磨刀不误砍柴工”

纵观整个回答,大部分人的思路都是先整体过一遍,脑子里留个印象,到用的时候再去细查

但是很多东西一遍根本就记不住,查的时候可能都不知道有某个功能,更有人吐槽即使已经用了很久pandas,再用还是需要一遍遍再查官方文档。

于是,为了提升查询效率,在初入门时就把各种语法和相关类整理一下非常重要,此所谓“磨刀不误砍柴工”。

pandas语法乱、API多?你需要整理一下!|知乎讨论
pandas语法乱、API多?你需要整理一下!|知乎讨论

下面是GiHub上一个获星1.3k的“磨刀”成果:

pandas语法乱、API多?你需要整理一下!|知乎讨论

每一条目录下都有全面的细化总结,包括示例代码:

pandas语法乱、API多?你需要整理一下!|知乎讨论

作者是来自阿里巴巴的技术专家。

也有知友更加细化,总结了75个数据分析打工人的Pandas高频操作

pandas语法乱、API多?你需要整理一下!|知乎讨论
pandas语法乱、API多?你需要整理一下!|知乎讨论

每一条都说明了具体用法:

pandas语法乱、API多?你需要整理一下!|知乎讨论

‍实在忍不了试试别的工具

学习计算机,看书是避免不了,除了pandas作者的那本《利用Python进行数据分析》(第2版),还有人强烈推荐《Python数据分析:活用pandas库》,不过也是不用全部看完,随用随查就行。

pandas语法乱、API多?你需要整理一下!|知乎讨论

‍亚马逊书评也不错:

这本书比我读过的其他介绍Pandas的书好很多,别的书也不错,但这本书更简明扼要。作者先介绍方法,接着给出示例,然后继续推进,非常适合学习。

官方文档一直被吐槽乱,但是官方网站升级以后的文档比之前好了一些,该查询该学习的时候还是得使用它。

剩下的就是在实践中一次次加深各种用法的记忆了!

当然了,也有一些人推荐直接改用matlab、mathematica,或者效率更高(但比较小众)的julia。

以及DaPy,一个专门针对pandas数据结构严格和api过多等问题的Python数据分析框架,轻量且具有易用性。

你又是如何上手混乱的pandas呢?

知友整理链接:
GiHub pandas教程:https://github.com/hangsz/pandas-tutorial
75个Pandas高频操作:https://mp.weixin.qq.com/s?__biz=MzUwOTg0MjczNw==&mid=2247490395&idx=1&sn=49215a3b51a6768802ba2eae3410e537&chksm=f90d5f05ce7ad613a5200b803580314a298443f98f853a73941ec64ea4a7c90822f1f814cfa9&scene=178&cur_album_id=1429956252289024000#rd

 

责任编辑:张燕妮 来源: 量子位
相关推荐

2022-09-23 15:01:33

图片加载代码

2022-08-25 14:42:45

JavaScrip字符串

2017-09-22 14:12:33

Android字体 Typeface

2021-12-27 18:00:30

对象数组Java

2019-11-07 15:20:07

JavaCollectorsteeing

2021-07-06 14:56:20

深度学习编程人工智能

2023-07-13 14:44:52

new Date()构造函数开发

2020-12-21 05:56:54

Clipboard A复制图像开发技术

2020-07-23 07:26:49

JVM类加载器

2023-08-18 20:50:22

2023-05-09 08:25:26

Gaussdb数据库开源数据库

2024-03-01 18:55:54

内存调试Go 语言

2018-08-27 05:29:29

PandasPython数据集

2024-01-31 13:02:00

高并发热点散列库存分桶

2010-02-25 13:03:13

迅雷

2023-11-23 17:02:34

LinuxSED工具

2021-07-27 11:31:29

运维架构技术

2023-12-28 17:50:00

前端开发

2019-09-26 15:06:29

数据平台架构

2018-04-09 15:36:01

数据库Oracle数据复制
点赞
收藏

51CTO技术栈公众号