随着我们继续渡过 COVID-19 危机,数据质量和使用数据的良好商业实践比以往任何时候都更加重要。 它们在药物和疫苗试验中至关重要; 预测下一次疾病爆发的地点和时间; 评估资源和人员的可用性; 以及评估经济影响。
在所有这些努力中,分析、人工智能 (AI) 和机器学习 (ML) 发挥着关键作用——但数据质量和良好的业务数据实践同样重要。
在 IT 方面,公司通过使用主数据管理 (MDM) 方法来获得高质量的数据,该方法定义了如何收集、聚合、匹配、合并、质量检查和分发数据。
有许多工具和自动化解决方案可用于主数据管理。 这些工具减少了手动剔除数据、规范化数据、决定什么应该与什么搭配以及谁获得哪些数据的单调乏味。 这项工作中比较困难的部分是制定合理的业务数据实践,这将为 IT 使用 MDM 进行的数据准备奠定基础。
这里有五种业务数据实践,对于任何努力为决策制定提供最高质量数据的组织来说都是至关重要的。
数字化暗数据
暗数据是可用但从未使用过的数据。 它可以以企业多年前创建的纸质文档的形式存在,也可以作为传感器生成的未使用的物联网 (IoT) 输出存在。
IBM 估计,公司拥有的数据中有 90% 从未被使用过,并且是暗数据。 虽然这些暗数据中的大部分可能被证明是多余的,但其中一些却不是。 组织需要审查这些数据,确定他们想要消除的内容,然后将他们想要保留的数据数字化。 然后,这些数字化数据可用于决策制定,因此它不会作为非数字化的浪费数据资产保留下来。
确定决策中的数据价值
即使数据可能被数字化,它仍然可能与决策制定无关。 如果数据没有价值,则应考虑将其淘汰。
决定保留哪些数据是一种平衡行为。 有些数据在今天并不重要,但在以后可能会变得有价值。 然而,还有其他数据(例如,物联网“抖动”,或关于 20 年前公司假日聚会的备忘录)很可能永远不会与决策相关,应该被消除。
能够聚合不同的数据类型
主数据管理通常侧重于规范化或整合来自不同系统的引用同一信息的不同数据字段。 但是,还需要聚合不同类型的数据,例如将天气预报与风暴系统的照片或视频进行聚合。
当明确识别业务用例以及决策制定所需的所有数据和数据组合时,数据聚合最成功。
专注于筒仓破坏
随着公民发展的增长和业务用户部门的独立 IT 预算,IT 部门更难了解未充分利用的数据包可能驻留在何处,以及如何将这些数据宝藏放入中央数据存储库,以便企业中的每个人都可以使用 他们。 例如,销售人员可能会对某个有价值的客户最近几个月因为产品反复出现故障而退回的特定产品非常感兴趣。 但是,如果销售人员无法访问制造或工程部门的退货和返工数据,他或她就不会知道这件事。 这可能会成为向客户推销同一产品的尴尬电话。
IT 在整个组织中跟踪新的和现有的数据资产的一种方法是使用驻留在公司网络上的资产管理系统,该系统可以检测新数据、系统和服务器。 如果确定了独立的业务孤岛,IT 或公司数据官可以与托管它的业务部门会面,并评估整个公司是否有其他用途的信息。 最终目标应该始终是创建尽可能全面和透明的企业图景。
教育管理
数据数字化和准备项目对 IT 以外的任何人都没有多大意义。 这是因为它们是准备性 IT 项目,不会产生业务决策者看到的可交付成果。
IT 必须尽早回答的问题是,管理层是否愿意资助不会产生有形业务成果的数据准备流程。
教育(并提醒)高层管理人员高质量数据对于高质量业务决策的重要性是一个持续的过程。 IT 应抓住一切机会这样做,并确保为数据准备提供必要的行政支持。