为什么改变人们对数据库技术的误解很重要？-51CTO.COM

数据库是任何组织技术生态系统的核心。云技术的出现，使得数据库具备了高性价比的数据存储、可伸缩计算、以利用率为基础的定价和完全管理的服务交付等功能。随着远程办公模式的增加，许多企业开始采用现代数据库技术来处理海量数据。这样一来，IT研发持续转向云计算，加速了企业创数字化转型的进程。

虽然在向云的过度中伴随着许多挑战，但是对于那些寻求尖端数据库技术的企业来说，终归是利大于弊。对于数据领导者来说，增强他们对共同障碍、创造数据库策略及上云的了解至关重要。如果数据库的领导者误解了数据库的成本、迁移的复杂性、数据安全性和灵活性，他们就不愿意采用现代化的解决方案。因此，更好地了解这些误区，对于企业的成功至关重要。

一、混合云系统增强数据库的仓储能力

混合云连接了私有数据中心和公有云，使数据和应用可以共享来自内部部署系统和云计算系统的信息。混合云计划能帮助企业利用多云和本地数据中心，具备更加灵活的优势。。公有云、私有云和本地数据资源结合，并通过人工智能和机器学习来支持敏捷性并改进报告。

二、了解常见的数据库误解

对云数据库的误解可能会导致IT专业人员对是否采用新的数据库系统和是否上云产生疑惑。

以下是关于这些误解的真相。

1、数据库只适用于对过去的数据进行业务分析。其实，使用现代化工具，数据库就可以进行实时数据分析。当考虑到企业数据库实时报告和分析的传统设计时，使用像Oracle Goldengate和Shareplex这样的数据复制技术是一个明智的选择。这些集成数据存储工具的数据库，能够将在线交易处理的数据复制到数据库，同时帮助提取、转换、加载，以及在线提取、加载和逻辑转换数据。

在现代数据库中，Kafka Spark streaming将在数据库环境下完成实时数据分析。因为实时定义的延迟性会根据企业实时定义方案的不同而有所不同，所以计划和管理实时定义的延迟性就显得非常重要。而企业的责任就是决定和定义实时数据复制的延迟性，并在确定的时间内配置实时数据。如果企业决定定义实时数据的延迟时间是几小时，那么实时数据处理可以通过传统的批量处理来实现。

2、传统数据库没有通用的结构化查询语言（下文称SQL）引擎去处理数据库中所有类型的数据，而在现代化数据库环境下就能建立一个通用的SQL引擎。如果企业要处理结构化的数据，或者使用一个数据湖选项去自定义和处理结构化或非结构化的数据，他们就会依赖企业自己的数据库解决方案。

一些企业用单一的SQL引擎，像Snowflake 或者Databricks ，作为统一的数据库引擎来使用数据库系统。然而，这些解决方案需要探索成本、性能和数据处理的属性。比如， Spark引擎最适合批量处理，但不适合低吞吐量的单一SQL。更好的数据库结构会基于数据模式来分析商业要求，然后建立一个合理的SQL引擎。例如，一个单一数据库方案用presto 引擎去处理低吞吐量的简单SQL，并且用Spark引擎来处理批量数据。

3、现代化数据库只能通过云端供应商来实现。现代化数据库需要基于企业数据及数据优先级来建立。比如，如果该数据很敏感，那么就需要部署在企业自己的数据中心。与此同时，对于非敏感的数据库来说，企业也可以从云供应商那里获取。在这些情况下，混合数据库方案就是不错的选择。Cloud Pak 等技术就可以同时在本地数据中心和云数据中心实时处理数据。Cloud Pak 的数据是高度可扩展的，并且可以为数据库提供更好的性能和混合云的解决方案。

4、管理数据库的数据治理有一定难度。如今，许多企业很难管理他们的数据衍生。这个问题就可以通过设计一个数据中心方案来解决，比如Cloud Pak 或者Apache Kyligence Semantic Layer。再比如，Watson Knowledge Catalog就具有创造多数据源和多个不同数据源的虚拟化表的能力。

当用户执行SQL时，这些方案也提供通用引擎。它在内部转换SQL并将数据传输到合适的数据源。这些方案和其他的引擎技术可以帮助企业更好地管理和治理数据衍生。

5、数据仓库使用了更多存储空间，并且成本也很高。企业使用成百上千个不同类型地数据库去管理和满足他们的商务需求，这样他们需要能整合所有数据源的数据以满足数据报告或者AI、ML需求。通常情况下，数据库领导者会选择价格低一些的解决方案，比如对象存储或者建立企业自己的SQL引擎来处理海量数据。

除此之外，管理传统块存储中的数据成本很高。在这些情况下，数据体系结构是下一代数据库解决方案的更好的选择。理想的数据体系结构提供一个通用的SQL引擎，用来处理来自关系数据库管理系统的结构化、半结构化或者非结构化的数据。Cloud Pak for Data和Watson Query是数据体系解决方案的两个例子。因为数据体系结构化可以直接处理在线交易或商务数据库的数据，它降低了成本，也不需要使用单独的数据库解决方案。

未来计划

采用数据库解决方案需要做一些前期工作，包括数据管理和治理、平台自动化、数据移动和复制、数据模型化和准备以及基础设施监控。如果执行得好，这些策略可以使企业记录他们的当前环境，规划现代化平台，迁移遗留的数据结构，并管理自动化新平台。通过解决对云数据库的误解，了解数据库模型的挑战、益处和总成本所有权，企业可以做出更明智的云数据库战略决定，并释放数据真正的价值。

原文标题：Why It’s Important to Change Misconceptions About Data Warehouse Technology

原文作者：John Thangaraj