随着企业扩展云原生数据库的使用,企业陷入了数据复杂性的海洋。那么,自我识别数据能解决问题吗?
这并不是说数据和数据库的获取和运行成本一直很高。仅此一项就是公共云的主要优势。得益于按需云计算基础设施的美好世界,企业可以在大约一天或更短的时间内从“需要数据库”转变为“拥有数据库”。
但是,获得云原生数据库,并建立新的网络数据库的便捷性导致了数据复杂性问题,但存在一些核心缺点:
- 通常,对所有企业数据和该数据的场景没有共识。数据仍然处于孤立状态,甚至比十年前企业进入公共云的旅程还差。
- 现在面临着意想不到的后果,例如缺乏对付安全性,数据治理甚至需要利用“单一事实来源”所需的理解。
企业确实有正在进行的项目在解决数据复杂性问题,例如链接开放数据云。链接开放数据云提供了松散耦合的数据,信息和知识的集合,任何可以访问全球互联网的人或机器都可以访问。目的是创建Web提供的抽象层。它允许使用SPARQL查询语言或SQL进行基本的和复杂的面向查找的访问,从而提供对结构化和非结构化数据的访问,其访问方式与自网络启动以来访问Web页面以获取图像和文本页面的方式相同。
当然,一系列技术提供商也提供解决方案,例如主数据管理,数据虚拟化以及其他允许您以改进的方式管理复杂数据的技术。换句话说,在数据库之外(无论是否为云)提供数据语义和元数据管理。
现在所了解的是,这种用于处理云计算、跨云或混合云数据库管理的方法无法很好地扩展或老化。考虑到创新的快速步伐,在现在以及不久或将来的需求中,数据将变得更加复杂,包括技术上的多样化。
试图利用如今使用的方法和工具会增加复杂性,直到系统最终因其重量而崩溃。只需考虑一下当今数据中心中导致问“他们在想什么?”的工具的数量,的确,他们的想法包括寻找战术解决方案,最终不会提供他们曾经提供的价值,在某些情况下会提供负面价值。
但当在思考如何解决这个问题时,一种方法似乎一次又一次地出现,这是最有可能的解决方案。确实,它已经在不同的学术界被广泛采用。这是自我识别数据的概念。
但是这里的想法是:通过将更多的智能与数据一起嵌入以及对数据本身的更多了解,将自主数据概念进一步向前发展。无论数据存储在何处,或在何处索取信息,人们都将拥有有关数据本身可用数据使用情况的所有知识。如果人们以相同的方式实现此概念,则它将使数据复杂性降低二十倍。
一些独特的价值包括:
- 任何企业的最终目标都是要利用其拥有的所有数据,使企业公司中需要它的任何人都可以访问它以获取洞察力,并利用这些洞察力使业务更好地运转。
- 随着自动化程度的提高,数据团队可以处理更高层次,更有价值的问题。他们可以专注于数据而不是数据平台,以实现数据成功。
- 这是复杂数据管理需要解决的核心问题。自我识别数据提供解决数据复杂性问题所需的细节。
要实现这一目标,需要完成许多工作。我不确定我们是否有那么多时间;错过这样的事情会影响当今使用云计算的效率。是时候开始工作了。