“一切都与数据相关!”一直是传统系统架构师的战斗口号,因为他们总是在建立复杂的系统中摸索,尤其是将生成和处理数据的能力作为核心能力。
从客户行为分析到预测性建模,这都与数据息息相关。然而,云计算生态系统,包括数据上云,往往被认为是理所当然的投资。而事实是否如此?数据又是如何影响系统效用的呢?
让我们来谈谈几个常见的问题,以及提高数据的商业价值的方法。
数据治理不充分
数据治理常常被忽视,并且数据治理需要联合企业的IT部门一起进行。你可以不相信我的话,但请问问别人有哪些数据治理系统,观察他们的数据治理过程,你会看到他们困惑的眼神。
云平台提供强大的基础设施和服务,但往往需要全面的数据管理、隐私和安全机制。解决方案和问题一样容易理解。企业必须负责应用合理有效的数据治理框架,包括政策和系统。同时,云供应商必须优先考虑并精简这些功能,以确保数据保护的有效性、合规性,并符合道德标准。
缺少互操作性
数据通常与特定的云平台或服务绑定、耦合。这使得数据迁移或与解决方案整合变得困难。事实上,这是大多数数据问题的基础:创建难以打破的数据孤岛。
数据处理应该独立于底层云基础设施。这样就可以在各种平台上移动和整合。我不知道为什么这个观点还没有广泛应用在企业的数据管理中,但多年来我一直在教授这样的技术和机制。然而,数据处理的互操作性这个原则经常被企业忽视。并且,随着我们进入云计算的平台,这将成为一个更大的问题。
解决数据互操作性问题的唯一方法是在系统中设计解决方案。互操作性通常不可以用“螺栓连接”的技术来解决,这只会使事情变得更加复杂。
数据访问和控制不充分
作为互操作性问题的近亲,数据访问和控制也需要企业的特别关注。如果设计不当,数据管理在云环境中的局限性较大,就可能给企业利用其业务数据造成阻碍。这里似乎没有一个中间地带,要么数据完全可以访问,要么根本不能访问。大多数情况下,控制器被关闭,宝贵的数据没有得到充分利用,系统也没有得到优化。
你只需要看看生成式人工智能系统的兴起,就会明白这种限制是如何影响系统价值的。如果数据不能被访问,知识引擎就不能被恰当地训练。你将拥有哑巴人工智能。
这种情况是因为不透明的数据所有权模式和有限的数据处理和存储控制。解决方案是组织为他们的数据建立更大的透明度和控制。这包括定义访问权限,管理加密,以及决定数据的存储方式和位置。这将确保数据所有者保留主权和信息可用性。
在目前正在建设的云系统中,数据并没有得到应有的重视。数据治理、互操作性和访问的工具众所周知,正确利用它们的过程也是众所周知。由于某些原因,企业并不愿意为这些问题寻找解决办法。
企业当然可以忽略数据问题,并希望没有人注意到,但现实是这样只提取了数据应有价值的一小部分。随着人工智能在大多数企业中的应用,数据的价值不再只是一个概念,而是企业无法回避的现实。
原文标题:Data should be a first-class citizen in the cloud
原文作者: David Linthicum