如今,多云策略在企业中越来越受欢迎。IBM公司最近发布的一份调查报告表明,到2021年,98%的企业计划使用多个混合云。在数据仓库方面,采用两个(或多个)云平台要好于一个云平台。多云意味着公共云和私有云基础设施的混合,需要使用不同的云计算数据仓库(CDW)提供程序,例如Amazon Redshift和Snowflake。这可能意味着要在AWS云平台中托管运营数据存储,但是要在Microsoft Azure中对该数据进行传输和执行分析。
或者底层的云平台可能有所不同,例如两个不同的Snowflake实例,一个实例在谷歌云平台上运行,另一个实例在Azure云平台运行。这些不同的云计算数据仓库(CDW)甚至可以托管在不同的区域,例如运行在多云。
对于多云策略来说,这可能还处于早期阶段,尤其是对于企业来说,将内部部署工作负载转移到云平台上的问题更是如此。企业对将其锁定到单一云计算供应商提供服务面临的阻力可能会越来越大。随着越来越多的企业要求多个云平台能够更好地协同工作,预计该领域还会有更多的发展。
企业为什么要采用多云基础设施
企业采用多云的原因有很多,其中包括节省成本、在不同部门采用不同的底层技术、更多使用云计算数据仓库技术的数据湖,以及首选的云计算合作伙伴。这些是导致企业设计和实施多云基础设施的常见用例:
- 技术整合:随着新的云计算数据仓库在不同平台上的发展,企业拥有更多选择。首选平台会引入其他仓库偏好,企业可能会启动新环境,然后将其与现有云计算数据仓库(CDW)一起使用,或者使用多云一段时间,以促进从一个云计算环境到另一个云计算环境的平稳过渡。
- 数据和灾难恢复:很多企业正在利用多个云平台、数据湖和云数据仓库来备份其数据,以达到保护数据的目的。使用具有数据副本的单独系统可以很好地防止云中断、灾难或任何其他意外停机。
- 区域要求:云计算提供商提供了许多区域数据中心,可以利用它们满足业务数据方面的区域合规性和主权要求。根据区域优势和最小化延迟的能力选择云计算提供商也有好处。
- 团队和数据需求各不相同:一些企业会选择在不同的平台上进行投资,因为团队对基础技术的亲和力各不相同。这允许用户利用仅在特定平台上可用的服务。例如,在AWS云平台中使用Sagemaker,在Azure云平台上使用Snowflake,或者在谷歌云平台上使用带有Snowflake的Google ML。通过为每个部门提供他们熟悉、经验丰富并能满足其需求的技术,可以提高效率。
- 多样化和避免供应商锁定:企业可能希望避免供应商锁定。例如,随着平台多样化,企业在定价、存储或计算产品发生变化时具有更大的灵活性。
多云环境的挑战
与任何技术策略一样,多云基础设施带来了显著的好处,但也有其风险和挑战。其中包括:
- 数据孤岛:从本质上来说,多云设计通过允许将数据存储在不同位置的不同平台的不同仓库中来创建数据孤岛。尽管这些数据孤岛是无意的,但它们可能成为创建真相单一来源的巨大障碍。当企业尝试应用自己的业务规则时,在解决方案的应用中会出现不一致之处,这意味着输出可能会有所不同。这会阻止企业获得必要的知识,以制定具有竞争优势的数据驱动型决策。
- 数据可迁移性:数据孤岛很难打破,因为企业无法迁移格式不同且驻留在不同技术中的数据。当前的可迁移性解决方案获取和维护成本很高,并且缺乏可迁移性可能导致多云战略的风险。
- 数据安全性:数据孤岛和缺乏可迁移性会持续存在,因为在没有适当的治理和安全控制的情况下,将数据从一个平台迁移到另一个平台(或从一个区域迁移到另一个区域)也会带来数据安全风险。企业需要一种在最佳结构内充分利用多云产品的方法,该结构还允许安全地进行全球数据移动。
如何解决这些挑战
然而,有一些方法可以防范这些风险。不同的多云策略为数据可访问性、可迁移性和安全性提供了不同的选择和机会。一种解决方案是“跨云”数据共享。这一方法使用统一的数据管理层和相同类型的云数据仓库,可以在各种云计算数据平台上运行。例如,Snowflake客户可以在AWS、谷歌云平台和Microsoft Azure上启动Snowflake CDW。
企业的主要好处是选择并能够利用与用例匹配的平台的最佳功能。例如,Google BigQuery在读取数据时收费。因此,如果团队对数据进行大量读取并多次进行聚合,则Snowflake可能会成为这种情况下节省成本的更好选择。
如何在多云环境下工作
多云方法提供了云计算的所有优点,而没有很多陷阱。仅限于单个云计算供应商及其生态系统存在危险,特别是对于那些希望通过创新来领导的企业来说,云计算供应商的技术改进步伐仍在不断加快。维持在最佳云平台上解决特定业务问题或流程的灵活性,可为企业带来竞争优势。
企业可以通过以下几种方法来控制多云环境:
- 实施工具来跟踪跨云平台的使用情况,以进行预算和资源分配,以识别可能需要修复的架构难点。
- 选择专门为主要云平台构建并增强的工具,以确保企业具有与正确平台相匹配的正确策略。
- 了解哪些工具在哪种云计算环境中最有效,并找到专门为云计算数据仓库而设计的解决方案,以最大化投资回报率(ROI)。不同的云计算提供商可能会做得更好。
- 选择一种解决方案,将云对象存储扩展到多个云平台,作为默认的多云部署层,以实现最大程度的灵活性。
- 评估独立软件供应商的产品,这些产品扩展了原生云服务提供商产品中可用产品的功能和范围。
尽管多云战略一开始似乎难以招架并且具有挑战性,但它最终为业务连续性提供了最佳的方案。拥有正确的工具可确保可管理性,同时使企业能够领导创新,并实现最佳的投资回报率。