想必很多人都用过Pandas来处理数据,作为Python数据科学领域的顶级库,Pandas确实有着强大的数据处理能力。特别是结合Jupyter Notebook平台,简直可以称作编程里的Excel。
Pandas是代码工具,不能像Excel那样通过软件界面操作,有时候也给数据探索带来小小的困扰。
比如说,你想简单探索下数据集的结构、描述统计结果、可视化图表等等,如果能绕开代码,直接通过GUI界面来操作,会更加方便。
D-Tale就可以完美实现上述功能,作为Pandas生态的辅助GUI工具,能读取DataFrame数据,供使用者进行探索分析。
D-Tale是 Flask 后端和 React 前端的组合,提供了简洁的GUI分析界面。它可以在PyCharm、Jupyter、命令行中打开,其功能包括筛选、排序、高亮、拼接、数据转换、描述统计、可视化等等。
尤其是可视化能力,D-Tale可以像Power BI那样实现拖拉拽的图表制作,而且提供了很多图表类型,包括折线图、柱状图、直方图、饼图、热力图、三维图、词云图、地图等等。
如果你经常使用Pandas进行数据分析,那么便可以试试D-Tale,它通过pip进行安装,非常简单。
pip install D-Tale
安装好后,导入D-Tale中的show()方法,通过show()就可以读取DataFrame数据,激活GUI分析界面。
该GUI界面提供了多种数据工具,可以在菜单中进行选择使用。
你可以对数据集进行筛选、排序、隐藏、调整大小等操作:
还可以查看数据集的描述性统计结果:
分析数据的缺失值情况:
对数据集进行热力图展示:
进行多元化的图表分析:
还可以制作有向图:
如果你想导出数据集,D-Tale能很方便地实现:
总的来说,D-Tale是一款Pandas辅助工具,可以高效地进行探索性分析。但D-Tale并不能替代Pandas来处理数据,因为它的功能还是有限的。