本文转载自公众号“读芯术”(ID:AI_Discovery)。
八年前,数据科学被誉为“21世纪最性感的工作”,然而,我们慢慢发现,连续数小时处理数据一点也不“性感”。如果非要说这个工作有什么特殊之处,那就是数据科学职业的传奇式崛起说明了大多数组织在管理数据方面做得多么糟糕。
从国际数据管理协会(DAMA)进入“认证数据管理专业人员(CDMP)”,这是最好的数据策略认证,但你可能从未听说过CDMP。老实说,考虑到我们做的是一份十年前不存在的工作,这一认证还没有普及就不足为奇了。
数据策略是一个重要的学科,它涵盖了数据生命周期的端到端管理,以及数据治理的相关方面和数据伦理的关键考虑因素。本文概述了获得CDMP的方法和原因,这为数据策略的有效思想领导奠定了基础。
免责声明:这篇文章不是由DAMA国际赞助的,均为我个人看法。
关于CDMP考试
CDMP的培训提供了14个与数据策略领域相关的专业知识,我将在后面的章节中更详细地介绍。考试是开卷形式,但其实你没有太多时间查东西,你需要在90分钟内完成100道题。因此,熟悉参考资料是很重要的。
当你参与考试(300美元)时,DAMA会提供40个练习题,这些问题可以很好地反映实际考试的难度。作为进一步的参考资料,你最好看看这篇关于认证学习过程的文章:https://medium.com/@nicolejaneway/how-to-ace-the-aws-cloud-practitioner-certification-with-minimal-effort-39f10f43146#9066。
你可以在线参加考试,过程中需要打开网络摄像头监控(11美元的监考费)。考试的形式是多选题,有的是5个选项,有的是T/F。你可以标记未答问题,然后再回答。考试结束后,你可以立刻看到分数。
图源:unsplash
超过60%即视为为通过,如果你有兴趣获得你的CDMP助理认证并继续前进,这就足够了;如果你对高级CDMP认证感兴趣,你必须通过70%(CDMP从业人员)或80%(CDMP硕士)的考试;要获得最高级别的认证——CDMP Fellow,你需要获得硕士学位证书,还需要展示行业经验和对该领域的贡献。每一个高级认证还需要通过两次专业考试。
最后,纯粹从职业发展的角度来看,为什么你应该选择参加CDMP的学习和考试:答案很简单,DAMA的认证与领导、管理和数据架构的高端职位相关,越来越多的数据管理相关企业及联邦合同要求CDMP认证。
CDMP
优点:
- 提供数据策略相关主题的全面知识库
- 开卷考试意味着更少死记硬背的时间
- 为不同水平的数据管理专业人员提供了4个级别
- 要求60%的分数通过最低级别的认证
- 成为精英的一条策略
- 为大马国际提供3年会员资格
- 311美元的考试费用,比微软和开放集团提供的其他数据相关认证便宜
缺点:
- DAMA没有一家大型科技公司(如亚马逊、谷歌、微软)的支持。该公司积极推动市场营销,推动CDMP认证的品牌知名度,这意味着CDMP可能主要在已经熟悉数据管理的个人中被认作有价值。
- 311美元的考试费用与AWS云从业人员证书(100美元)或GPC证书(200美元)相比相对昂贵。
选择:
- Microsoft Certified Solutions Associate(MCSA)侧重于各种Microsoft产品的模块化认证(330美元)。
- Microsoft Certified Solutions Expert(MCSE)以MCSA为基础,在核心基础设施、数据管理和分析以及生产力等方面获得集成认证(495美元以上)。
- 开放组架构(Architecture)框架(TOGAF)——软件开发高级框架和企业架构(Architecture)方法论的不同级别认证(550美元以上)。
- 缩放敏捷框架(SAFe)软件工程团队基于角色的认证(995美元)。
如何准备CDMP
图源:unsplash
CDMP是一个开卷考试,为了通过考试,你只需要 DAMA知识体系书(dmbok 55美元)。它大约有600页,你可以把大部分时间集中在在第1章(数据管理)、图表和模式、角色和职责以及定义上,能有80%的机会及格。
至于如何使用DMBOK,你可以每周末复习时间4-6小时,持续8-10周,也可以每天早晚读几页。不管怎么处理它,一定要在学习方法中加入间隔重复法。
不仅是作为考试的学习指南,DMBOK本身就是一本很有用的参考书,如果你的同事需要学习数据策略或者听不懂网络研讨会,可以把它推荐给同事们。
CDMP测试了什么
CDMP涵盖了14个主题——我已经按照它们在考试中出现的频率列出了它们,并为每个主题提供了一个简短的定义。
- 数据治理(11%):确保正式管理数据资产的实践和流程。
- 数据质量(11%):根据数据的准确性、完整性、一致性、完整性、合理性、及时性、唯一性/重复数据消除、有效性和可访问性,确保数据适合消费。
- 数据建模和设计(11%):将业务需求转化为技术规范。
- 元数据管理(11%):有关收集到的数据的信息。
- 主数据和参考数据管理(10%):参考数据是用于对数据库中发现的其他数据进行分类的信息,或仅用于将数据库中的数据与组织边界之外的信息关联起来的信息。主参考数据是指在组织内多个系统之间共享的信息。
- 数据仓库和商业智能(10%):数据仓库以优化的方式存储操作系统(以及其他数据资源)的信息,以支持决策过程。商业智能是指利用技术收集和分析数据,然后将其转化为有用的信息。
- 文档和内容管理(6%):用于组织和存储组织文档的技术、方法和工具。
- 数据集成和互操作性(6%):使用技术和业务流程合并来自不同来源的数据,以便捷高效地访问有价值信息。
- 数据架构(6%):根据组织的数据策略描述现有状态、定义数据需求、指导数据集成和控制数据资产的规范。
- 数据安全(6%):实施政策和程序,即便在恶意输入中也要确保人员和事物对数据和信息资产采取正确的行动。
- 数据存储和操作(6%):保存、删除、备份、组织和保护组织信息的硬件或软件的特性。
- 数据管理流程(2%):数据的端到端管理,包括收集、控制、保护、交付和增强。
- 大数据(2%):超大数据集,通常由各种结构化、非结构化和半结构化数据类型组成。
- 数据伦理(2%):包括数据处理、算法和其他实践的行为准则,以确保数据在道德环境中得到适当使用。
为什么数据科学家应该获得CDMP认证
还不明白为什么数据策略很重要?让我们从一个数据科学家的角度来看一看,他们的目标是增加知识和赚钱的潜力。
标识是Hivery的商标,Hivery是一家将AI用于零售业的公司。| 图源:Unsplash
有人说数据科学家是统计学、计算机科学和领域知识的纽带。我们为什么还要给他添加新的学习内容?
斯科特·亚当斯(Scott Adams)是《迪尔伯特漫画》的作者和创作者,他提出了这样一个观点:“你所掌握的每一项技能都会使你成功的几率加倍。显然有些技能比其他技能更有价值,你获得的第十二项技能的价值可能低于前11项技能的价值。”但问题是,有时走得远比走深要好。
抛开收益的相对大小,相对于埋头苦干地学习某项特定技能而言,扩大技能可以带来更显著的收益。这就是为什么我认为数据科学家学习数据策略很重要。
一般来说,拥有多元化的技能可以让你:
- 利用跨学科知识,更有效地解决问题
- 与其他专业的队友更好地沟通
- 获得新项目
图源:unsplash
为了加深对端到端知识生成过程的理解,它值得让我们忍受所有拗口的缩略语。理解数据策略将使你从数据消费者转变为组织中授权的数据倡导者。多一证不如少一证,更何况是如此有价值的认证。