企业和组织被大数据淹没,难以有效管理数量不断增长、种类繁多且速度不断加快的数据,更不用说还要处理和分析所有这些数据以获得宝贵的洞察而确保竞争优势。
下面就让我们来看看2021年迄今为止引起关注的这10家颠覆性大数据技术初创公司,所涉及的领域包括数据运营、数据管理和自动化、数据质量、数据转换和集成、大数据分析、数据库和数据仓库。
Airbyte——Airbyte开发了一种开源的数据集成/ELT(提取、加载和转换)引擎,让企业和组织可以用它来快速构建数据管道,使用提供的或者自定义的连接器,在数据库、数据仓库和数据湖之间复制数据。
Airbyte总部位于美国旧金山,竞争对手包括Informatica和Talend等成熟的数据管理技术厂商,以及Fivetran和Matillion等新生代ELT厂商。Airbyte目前提供的是免费社区版软件,同时还在开发具有扩展功能的商用云和企业版。
Airbyte成立于2020年,在3月的种子轮融资中获得520万美元,紧接着在5月由Benchmark领投的A轮融资中获得2600万美元。
Bigeye——数据的延迟、丢失、重复和损坏会阻碍大数据项目和数字化转型计划,而Bigeye提供了一个数据质量工程平台,可以帮助数据管理团队发现和修复数据质量问题。
该平台通过检测数据集和数据管道来实现数据质量管理任务的自动化,它运用各项指标来监控和衡量数据质量,检测数据异常,并在出现问题时向数据管理人员发出警报。
Bigeye成立于2019年,总部位于美国旧金山,在今年4月的A轮融资中获得1700万美元,9月的B轮融资中获得了4500万美元,将用于加速产品开发并加快产品上市计划。
Cribl——Cribl的可观察性数据工程软件(包括了Cribl的LogStream旗舰系统)用于构建管道从而在操作、存储、分析和安全系统之间路由大量遥测数据,包括机器日志、仪器、应用和指标数据。
10月,Cribl推出了LogStream Cloud Enterprise Edition,一项用于安全管理全局分布式可观察性数据管道的云服务。据Cribl称,该服务让企业和组织能够在世界任何地方集中配置、管理、监控和编排数据可观察性管道基础设施。
Cribl公司成立于2017年,总部位于美国旧金山,已经在C轮融资中获得了2亿美元,将用于加快产品上市策略,其中包括渠道计划。
Firebolt——Firebolt开发了一种云数据仓库,凭借该产品向Snowflake和AWS Redshift(同时也支持运行在AWS上)等巨头发起挑战。Firebolt强调这种数据库具有规模化的速度、易用性和更低成本的运营模式。
Firebolt的系统旨在分离存储和计算,使其在无共享架构中实现细粒度弹性和可扩展性,同时还要依赖于S3共享存储。采用标准SQL查询半结构化数据的功能,进一步提升了系统性能水平,而无需复杂的ETL(提取、转换和加载)实践,并且使用Firebolt File Format快加数据更新速度。
Firebolt总部位于以色列特拉维夫,由Sisense资深高管Eldad Farkash和Saar Bitner于2019年创立,在今年6月的A轮融资中获得了1.27亿美元,将用于加快产品开发速度。
Grafana Labs——Grafana Labs开发了备受欢迎的Grafana开源数据可视化和分析平台,用于为IT基础设施、网络、网络安全工具、以及其他系统生成的指标、日志和跟踪数据构建数据仪表板和可视化。IT和AppDev经理可以使用这种分析功能和可视化功能来监控IT系统的性能并跟踪用户和事件。
Grafana Labs还提供了具有附加功能、插件软件、培训、专业服务和支持服务的Grafana商用企业版和云服务版。
本月,Grafana Labs与微软达成战略合作伙伴关系,开发在Azure云平台上运行的Grafana托管服务,这次合作有些类似于Grafana Labs与AWS之间的合作伙伴关系。
Grafana Labs公司成立于2014年,总部位于美国纽约,在8月的C轮融资中获得了2.2亿美元,总估值达到30亿美元。
Molecula——Molecula开发的FeatureBase是一个企业功能库,号称“简化、加速和控制”对大数据的访问,用于实时分析和机器学习应用。
今年10月市场研究机构Gartner将Molecula纳入了关于数据管理公司的“Cool Vendor”报告中。
Molecula成立于2019年,总部位于美国德克萨斯州奥斯汀,在今年1月的A轮融资中获得了1760万美元,将用于加速发布Molecula Cloud以及加强销售和营销策略。
Monte Carlo——Monte Carlo提供的数据可观察性软件可用于监控跨IT系统的数据,包括数据库、数据仓库和数据湖中的数据,以衡量和维护数据质量、可靠性和数据沿袭——Monte Carlo称之为“数据健康”。
Monte Carlo的平台主要根据数据的新鲜度、最新更新情况、数据表的数量或完整性、数据模式或数据组织、数据沿袭情况(包括来源和使用情况)、以及数据分布来对数据进行评估。
Monte Carlo成立于2017年,总部位于美国旧金山,在8月的C轮融资中获得了6000万美元,用于加速产品开发、推动产品上市、推广数据可观察性理念等方面。
Speedata——Speedata开发了一种分析处理单元(APU),号称是首个专门用于优化和加速数据中心和云数据库以及数据分析工作负载的处理器。
Speedata APU目前还处于原型阶段,该公司承诺在数据库和业务分析流程的主流处理器上可以实现两倍或更高的性能提升。Speedata表示,采用Speedata APU的服务器可以更换掉多个CPU,从而显着降低成本、节省空间以及降低能耗。
Speedata总部位于以色列内坦亚,于今年9月走出隐身状态,宣布获得7000万美元的风险投资。
Syncari——Syncari的无代码数据自动化平台可以帮助数据专业人员在企业上下对可信的客户数据进行统一化、清理、管理和分发,具备一系列数据同步、数据统一、治理和访问功能。
今年6月Syncari推出了更多复杂的工作流程功能,帮助销售和营销团队更有效地利用客户数据。
Syncar 总部位于美国旧金山,是由Marketo、Mulesoft和Zendesk等公司的前高管于2019年6月创立的。今年5月,该公司宣布在A轮融资中获得1730万美元。
Yugabyte——Yugabyte开发的YugabyteDB是一种下一代分布式关系数据库,旨在处理跨越多个地理区域和可用区的大量数据。该数据库主要面向那些需要低查询延迟和极强的故障恢复能力的全球关键业务型应用(例如网络安全和金融服务)。
今年9月Yugabyte推出了Yugabyte Cloud,一项完全托管的数据库即服务,用于构建云应用并将遗留应用迁移到云平台上。
Yugabyte公司的创始人包括总裁Kannan Muthukkaruppan、首席技术官Karthik Ranganathan和软件架构师Mikhail Bautin,他们在Oracle和Facebook了开发关键业务数据库技术后于2016年创立了Yugabyte。
Yugabyte总部位于美国加州桑尼维尔,10月的C轮融资中获得了1.88亿美元,总估值超过13亿美元。