Kyligence公司解决方案-51CTO.COM

公司名称: Kyligence

公司介绍:

Kyligence （上海跬智信息技术有限公司）由***来自中国的 Apache 软件基金会***开源项目 Apache Kylin 核心团队组建，是专注于大数据分析领域的数据科技公司。Kyligence 提供基于Hadoop 的企业级智能大数据分析平台，在PB（petabyte）级数据集上提供亚秒级查询响应和互联网级的高并发访问。

目前，Kyligence 已赢得了海内外多家保险、证券、电信、制造、零售、广告等行业的企业级客户。公司总部在上海，同时，在北京、深圳等地设有办事机构, 在美国硅谷设有分公司，目前，已获得来自红点中国、思科、宽带资本、顺为资本及斯道资本（富达国际自有投资机构）等投资机构的多轮投资。

解决方案介绍:

高性能的多维分析解决方案

背景

OLAP（Online Analytical Process，联机分析处理）是数据仓库系统最主要的应用，通过对业务部门常用的维度和指标进行建模和预计算，可以让业务分析人员快速、灵活地从不同业务视角对数据进行下钻、上卷、切片等复杂的分析操作，以达到深入理解数据的目的，从而更加高效地支持日常的业务运作。

需求

在面对不断增长的海量数据和爆发的分析需求时，传统BI工具的Scale up架构常常会陷入数据规模受限、Cube维度数目和容量受限、查询响应慢、并发支持能力差等技术局限，大大限制了OLAP分析的应用场景。IT运维方不得不每年投入大量经费对集群进行扩容，来满足日益增长的数据量和业务需求，这种方式成本高，周期长，效果也不理想。

解决方案

Hadoop技术拥有低廉的存储成本、灵活的扩展架构，强大的并行处理能力，使得用户能够摆脱传统DW/BI技术在性能、成本方面的限制，对海量结构化或非结构化数据进行存储、加工、交互式多维分析，以Hadoop技术为核心的生态圈业已成为大数据平台事实上的技术标准。

Kyligence依托Hadoop的HDFS分布式存储技术和MapReduce/Spark分布式计算引擎，能够提供万亿数据规模下的秒级查询性能。基于Scale-out架构的Cube技术，存储成本低，运维方便，性能稳定高效，支持高并发访问，且无需频繁扩容集群。另外，Kyligence提供对ANSI SQL的良好兼容性和丰富的ODBC/JDBC/Rest API接口，使得多维分析应用从传统数据仓库平台迁移到Hadoop平台的成本低，周期短。

解决方案优势/带给客户的好处:

Kyligence能够满足超宽表，超高基维度（***~亿级），超多维度组合（百级维度数），无容量上限的Cube构建需求，通过Hadoop强大的并行计算能力加速Cube构建时间，同时基于Kyligence独有的列式存储引擎技术，使得Cube的查询性能在秒级实现，从而支撑更广泛的业务应用和更佳的用户体验；另外，Kyligence提供线性扩展能力，轻松实现1000+的高并发支撑能力，使得多维分析平台开放给更广泛的业务群体成为可能，从而进一步提升企业运营和管理效率。

收益：
• 秒级查询性能：查询性能提升了约2000倍，平均达到5秒

• 更佳的Cube构建：Cube构建时间减少了75%

• Kyligence支持权限数据和Cube数据分离存储，迁移后Cube数量降低到几十个，减轻了运维的压力

• Kyligence同时支持Cube多维分析和明细数据查询，大大简化了原有的开发工作量

• 支持高并发查询：单节点单实例50并发/秒，且并发量可以根据业务增长需要进行水平扩展。

解决方案使用场景和案例:

案例

以某全国级金融企业为例，在全国有上亿客户，每天的交易明细数据超过10亿，一直以来深受传统数仓在数据容量、查询性能方面的限制，在将数据迁往Hadoop平台后，选择了Kyligence产品来建设其企业级多维分析平台。

痛点：

• ***的Cube每天构建时间超过20小时，业务部门只能看到2天以前的数据

• 基于Cube的单次多维分析需要1小时才能返回结果，严重影响业务部门的工作效率和正常分析流程

• 将Cube数据固化成报表文件来提升查询性能，带来大量额外维护成本的同时，彻底丧失了通过Cube进行OLAP多维分析的灵活性

• 由于权限管理问题，同一类Cube要为全国30多个省分行建立副本，导致Cube数量达到2000+，大大增加了IT部门的运维难度和工作量

解决方案：

• 数据处理：业务数据存储在Hive中，通过Kyligence构建Cube

• 固定报表：通过BI报表工具连接Kyligence进行报表定制

• 数据探索：通过数据探索工具Kyligence Insight for Superset连接Kyligence进行数据可视化分析