帮助数据科学家干脏活累活的云数据服务初创企业Paxata刚刚获得由 Accel Partners 领投的 800 万美元融资。
Paxata 成立于 2012 年,其联合创始人兼 CEO 是 Prakash Nanduri。在数据服务领域,存储和提供数据来源的数据管理系统(如 Hadoop)和利用数据的分析应用之间普遍存在的一道鸿沟,即分析应用在对数据分析之前需要抽取、处理和整合多个来源的数据才能进行分析。这个数据准备的过程以往大都需要人工处理,耗时费力,Paxata 的目的就是要填补这道鸿沟。
Paxata 的解决方案包括连接、发掘、转换、合并、发布、协作控制等功能。其中连接可将多种来源的数据(Hadoop 等,支持 Excel、文本文件、关系数据库、XML、JSON 等格式)接入然后自动解析数据。发掘功能可支持全文检索、交互式文本及数字过滤器、直方图、热点图等帮助识别错误与重复或缺失数据;转换功能可实时完成数据的分解、连接、去重、空行检测等。合并功能则可自动检测多数据集的共同属性然后合并为单一视图。数据准备的结果可以发布到各种 BI 工具上。
Paxata 提供的服务与ClearStory有点类似,均能从不同的数据源抽取数据,但是 Paxata 还可以将多个数据源进一步整合为单一的数据集,从而更方便业务分析师和可视化工具的理解。
Paxata 目前已经与 Tableau、Cloudera 及 Qlikview 等商业智能公司建立了合作关系,其客户包括 Dannon、Box、UBS、Pabst Brewing Company 等。目前该公司共有 28 名员工。
原文链接:http://www.36kr.com/p/207272.html