如今,企业拥有比以往任何时候都要多的数据,数据架构师、分析师和数据科学家在所有业务职能部门中变得越来越普遍。然而,随着企业招募经验丰富的分析师以利用数据做出更好的决策,他们往往无法改善数据供应链和由此产生的数据质量。如果没有可靠的数据供应链管理实践,数据质量往往会受到影响。
糟糕的数据质量被认为是计划未能实现其预期价值的主要原因,高达60%的业务计划会由于数据质量问题而失败。随着企业转向支持人工智能/机器学习的决策制定,数据质量成为一个更加紧迫的问题。如果用于推动人工智能/机器学习模型的数据不准确、不完整或过时,则模型将无法提供预期的结果。
数据是分析和决策的关键原材料。每位出色的业务领导者都会问,如何提高数据质量,以便能够做出最好的决策?其答案是改善企业数据供应链的结果,以确保其不会影响分析能力。
那么,如何改善数据供应链的成果?
•了解第一公里/最后一公里的数据影响。
•降低供应链复杂性/成本。
•改进对数据质量的监控和报告。
供应链由三个主要部分组成:
(1)第一公里/最后一公里的影响
第一公里/最后一公里面临的挑战需要从获取数据(上游)开始全面解决供应链问题。拥有可用于分析和决策的数据的紧迫性,促使企业在“最后一公里”投入更多精力——将数据传递给下游的客户。在数据供应链的案例中,客户当然需要对数据进行分析、报告的内部部门或团队。面临挑战是从一开始就正确捕获数据源,并确保在跨数据供应链移动时不会降低数据质量。
用于评估实体供应链绩效的一个关键供应链管理指标是按时全部交付(OTIF),达到这一指标可以提高价值,并产生显著的效果,因为它直接关系到最终客户及其执行工作的能力。例如,如果企业需要10个属性来生成客户满意度分数,但只有9个可用,则无法执行计算。利用关注数据质量和可用性对下游流程的影响的指标,可以帮助提高企业的意识。
•推荐的行动计划:创建数据供应链地图。供应链可见性和采购的概念适用于数据供应链以及实体供应链管理。了解数据来源、发生的任何转换活动以及“客户交付周期”有助于企业识别和降低风险。实施指标来评估企业满足客户需求的程度有助于提高改进重点。
(2)供应链复杂性
供应链复杂性是用于描述满足下游需求所需的能力网络的术语。企业所需的供应商、业务部门和分销商的数量越多,就越复杂。
供应链中的每一个额外元素都会增加复杂性,而复杂性越高,越会增加可变性。可变性是质量的主要挑战。在实体供应链中,企业寻求降低上游复杂性。在数据供应链中,内部和外部数据的来源多种多样(来自数据代理、社交媒体/情感分析等),就像实体供应链一样,降低数据供应链的复杂性有助于提高整体质量。
降低复杂性如何提高质量?更少的系统意味着更少的数据转换,从而提高了数据的可用性和准确性。
•推荐的行动计划:清点可供下游使用的数据,并映射到源系统(内部与外部)。在通常情况下,在多个系统中创建公共属性,这增加了复杂性。对于每个数据元素,确定/选择一个单一的下游消费系统,并建立一个“记录系统”(SOR),其目的是从尽可能少的系统中获取数据。
(3)数据监控和报告
数据质量应该是当今大多数企业的关键绩效指标(KPI)。输出的质量取决于输入的质量。例如可以回想以往吃过的美餐,以及是什么让它变得如此美味;当然,企业和环境很重要,但材料的质量直接影响结果——例如新鲜的海鲜总是比冷冻的要好。
企业内部评估数据质量的方法和频率往往各不相同。企业中的不同职能部门可能会使用不同的方法来评估质量;例如,会计部门可能比营销部门更严格。然而,为什么不同的职能应该得到不同的评估?良好的决策依赖于高质量的数据,难道不是每个职能部门都应该尽可能做出最佳决策吗?
•推荐的行动计划:建立衡量数据质量的通用公式,并在所有职能部门(数据质量得分)中一致地使用这一衡量标准。评估的数据量要求抽样和估计,并且其方法应该是一致的。一种方法可以是抽取100条记录,检查每条记录并找出任何错误,然后统计无错误记录以了解正确创建的数据百分比。
对于许多企业而言,数据供应链是一个新兴且不断发展的概念。寻找和留住人才以帮助改善数据供应链成果对于企业的竞争优势至关重要。当然,有形产品和无形产品之间存在差异,但许多来自实体世界的概念和工具都可以应用于数据,其结果将与改善实体供应链一样具有影响力。