11个开源免费的数据分析与可视化工具-51CTO.COM

参与大数据、人工智能相关的项目的技术人员，掌握一些数据工具对项目建设至关重要。本文推荐一些优秀的开源数据分析与可视化工具，可以在从数据清洗到可视化等过程提高工作效率。

1.Apache Superset

https://github.com/apache/superset

Apache Superset是一个开源数据挖掘以及数据可视化平台，用户不需要编程知识就可以创建交互式仪表盘。平台支持各种数据源，提供丰富的可视化组件，并允许自定义仪和共享表盘。

平台在功能性方面，它集成了各种数据库和数据仓库，并提供了一个强大的SQL编辑器。在安全性方面，平台可通过基于角色的访问控制和身份验证。在可扩展性方面，它允许添加自定义功能，并且也有一个大型的、活跃的开源社区。

2.Metabase

https://github.com/metabase/metabase

Metabase是一个开源的商业智能工具，具有友好的用户界面、强大的数据可视化功能和交互式仪表板。它支持与各种数据源集成，支持实时查询，并提供自动报告。

Metabase还提供数据探索和发现工具，通过基于角色的访问控制以确保安全。它可以私有化部署，为项目提供了较为灵活的方案。

3.OpenRefine

https://github.com/OpenRefine/OpenRefine

OpenRefine是一个基于Java的数据管理和分析工具。支持用户使用Web端实现数据加工、可视化和功能扩展。

OpenRefine的主要功能包括挖掘、集群、协调、无限撤销/重做、隐私和Wiki。

4.Insights

https://github.com/mariusandra/insights

Insights是一个用于可视化地挖掘PostgreSQL数据库的工具，在图形的生成具有较强优势。

它支持PostgreSQL连接，自动检测发现数据库，允许连接到多个数据库，并允许模式编辑和添加自定义SQL字段。

它还提供数据挖掘、过滤器、基于时间的图形、键盘导航、保存的视图和固定的字段等功能。

安装如下：

npm install -g insightsinsights initinsights startbr
br1.
2.

5.Retentioneering

https://github.com/retentioneering/retentioneering-tools

Retentioneering是一个Python库，它主要用于分析点击流、用户轨迹和事件日志变等，并产生比漏斗分析，以便更广泛和更深入理解用户行为。

使用Retentioneering来探索用户行为，细分用户，并形成关于是什么驱使用户采取期望的行动或远离产品的假设。

Retentioneering使用点击流数据来构建行为细分，突出显示影响您的转化率，保留和收入的用户行为中的事件和模式。Retentioneering库是专门为数据分析师、营销分析师、产品所有者、经理以及任何负责提高产品质量的人创建的。

Retentioneering作为Cyberter环境的组成部分，它扩展了pandas、NetworkX、scikit-learn库的功能，以更有效地处理顺序事件数据。Retentioneering优化工具是交互式的，专为分析研究而量身定制，因此，非Python专家也可使用它。只需几行代码，就可以处理数据，探索用户行为地图，并进行可视化。