虽然云数据管理 (CDM) 可以涵盖很多方面——从成本管理到架构、治理和安全——但在本文中,我们将主要关注 CDM 的存储方面。
虽然传统或严格的本地数据管理受到当前基础架构和冗长的采购和部署周期的限制,但云计算为性能、耐用性、可用性提供了无穷无尽的选择。当然,每种选择都有不同的定价。
由于存储在云中的使用和交付方式存在巨大差异,企业需要新的方法来管理这一切。同样,随着许多企业采用多云架构并在边缘存储数据,复杂性正在加剧。
1、云计算将数据管理带入下一个成熟阶段
在企业数据存储的背景下,非结构化数据管理已成为一种实践多年,尽管它起源于存储供应商平台。现在企业正在使用许多不同的存储技术,包括用于数据库和虚拟化的块存储、用于用户和应用程序工作负载的 NAS、数据中心或云中的备份解决方案——以存储为中心的数据管理方法不再符合要求。
这是因为,除其他原因外,存储供应商数据管理解决方案无法解决管理存储在不同平台上的数据孤岛的问题。孤岛阻碍了可见性和治理,导致成本增加和利用率低下。随着越来越多的工作负载和数据迁移到云端以节省资金并实现灵活性和创新,云数据管理已成为一种日益增长的实践。
云数据管理 (CDM) 超越了存储,满足了对数据移动性和访问、成本管理、安全性以及日益增长的数据货币化的不断变化的需求。云数据管理实践可以帮助 IT 和存储管理人员利用最新的云技术,而不会牺牲控制和测量,也不会超支。
他们可以在云之间安全地移动数据,并在需要时将数据移回本地,并应用策略,这样所有数据都可以流畅地移动到满足企业和部门要求的最佳位置。
2、获取数据价值
传统的数据管理存储方法侧重于数据保护。现在通过云数据管理,重点正在扩大到包含价值。这意味着企业存储团队需要了解他们的文件和对象数据。
要做到这一点,最好的方法是与创建它的团队合作,并从物联网和应用程序等机器中收集它。云数据管理正在拆除的不仅是存储孤岛,还有团队孤岛。
3、入门框架
了解数据和业务:在确定非结构化数据的最佳云资源之前,需要了解关键利益相关者的业务需求。过去,许多 IT 团队对他们的非结构化数据几乎没有可见性——就像卡车司机并不总是知道他们的货物是什么,但他们得到的报酬是将货物从 A 点运送到 B 点而不会损坏或丢失。然而,云数据管理不仅仅是保持企业数据的安全和可靠。
现在必须了解不同数据集的价值,以告知其管理:使用频率、业务优先级以及需要什么级别的保护。现代非结构化数据管理平台允许客户索引他们的数据——从而获得对不同数据集做出决策的可见性。例如,分析可以通过向利益相关者展示将一年未访问的文件移动到云中更便宜的存储的原因,从而为协作决策带来共同基础。
数据移动性:将知识转化为行动。有了准确的数据洞察,是时候采取行动并开始将数据迁移到云端了。主要的云提供商现在为所有协议提供存储资源:具有不同性能、成本和持久性特征的块、文件和对象。企业当前的工作负载可能规定了协议——但企业仍然希望在未来对其的数据进行访问并保持其可移植性。
云出口费用是降低云存储成本的主要障碍。确保 CDM 实践考虑到这一点,准确预测数据召回的需求,同时了解保证云原生访问的非结构化数据管理解决方案如何帮助防止过高的费用。前瞻性的云数据管理策略不会将企业锁定在单一的云或存储资源中。企业将能够在数据的生命周期内管理自己的数据。
为价值管理数据:这就是 CDM 与传统非结构化数据管理的不同之处:意识到企业的数据具有超出创建它的原始应用程序的价值,并且云分析服务可以解锁这些数据。以下是企业存储团队寻求扩展其角色以成为数据管理专业人士以提供此价值主张的首要考虑因素:
- 通过支持对象存储 API 确保云原生访问。
- 与流行的数据仓库分析平台(如 Snowflake 和 Databricks)以及云原生服务(如 Amazon Sagemaker、AWS Athena 和 Azure Data Lake Analytics)的开放/轻松集成。
- 通过在整个生命周期中标记和丰富文件元数据来支持非结构化数据分析,以便以新的方式持续利用数据。
- 从存储技术即服务(STaaS)发展到数据即服务(DaaS);今天的重点是向各部门提供整体数据服务,而不仅仅是降低存储成本。
- 与业务/部门利益相关者合作,了解数据需求,以实现适当的计划和长期目标。
云数据管理虽然仍然是一种新兴实践,但随着数据管理、传统存储和云供应商提供的独特工具和服务以及安全和支出管理解决方案的出现,它必会逐渐成熟。
虽然云数据管理是整个非结构化数据管理实践的一个方面,但它应该紧密集成,以便 IT 管理者可以在一个地方查看他们的所有数据、策略和支出。