到 2025 年,智能工作流程以及人与机器之间的无缝交互可能会像企业资产负债表一样成为标准,大多数员工将使用数据来优化工作的几乎各个方面。
我们知道 2025 年并不遥远,但这就是重点。
七个特征将定义这个新的数据驱动型企业,我们已经看到许多公司至少展示了其中的一些特征,还有更多的公司开始这样做。
那些能够以最快的速度取得最大进步的人能够从数据支持的功能中获取最高的价值。 例如,已经有 20% 的息税前利润 (EBIT) 由人工智能 (AI) 贡献的公司更有可能参与支持这些特征的数据实践。
本指南旨在帮助管理人员了解新数据驱动型企业的特征及其所支持的功能。 它还提供资源来更深入地了解如何将它们嵌入到您的组织中。
数据嵌入到每个决策、交互和流程中
今天
组织经常在整个组织中零星地应用数据驱动的方法(从预测系统到人工智能驱动的自动化),从而留下价值并导致效率低下。 许多业务问题仍然通过传统方法解决,并且需要数月或数年才能解决。
到 2025 年
几乎所有员工都会自然而然地定期利用数据来支持他们的工作。 他们不会默认通过制定冗长(有时是多年)的路线图来解决问题,而是有权询问创新的数据技术如何在数小时、数天或数周内解决挑战。
组织能够做出更好的决策,并实现基本日常活动和定期决策的自动化。 员工可以自由地关注更“人性化”的领域,例如创新、协作和沟通。 数据驱动的文化促进持续的绩效改进,以创造真正差异化的客户和员工体验,并促进当今尚未广泛使用的复杂新应用程序的发展。
数据实时处理和传送
今天
由于传统技术结构的限制、采用更现代架构元素的挑战以及密集实时处理的高计算需求,只有来自连接设备的一小部分数据被实时摄取、处理、查询和分析 工作。 公司通常必须在速度和计算强度之间进行选择,这可能会延迟更复杂的分析并抑制实时用例的实施。
到 2025 年
由互联设备组成的庞大网络通常会实时收集和传输数据和见解。 新技术和更普遍的技术(例如用于实时分析的 kappa 或 lambda 架构)极大地改变了为最终用户生成、处理、分析和可视化数据的方式,从而带来更快、更强大的见解。 随着云计算成本的持续下降以及更强大的“内存”数据工具的上线(例如 Redis、Memcached),即使是最复杂的高级分析也可供所有组织合理使用。 总而言之,这使得许多更高级的用例能够为客户、员工和合作伙伴提供见解。
灵活的数据存储可实现集成的、随时可用的数据
今天
尽管数据的激增是由非结构化或半结构化数据驱动的,但大多数可用数据仍然是使用关系数据库工具以结构化方式组织的。 数据工程师经常花费大量时间手动探索数据集、建立它们之间的关系并将它们连接在一起。 他们还经常必须使用手动和定制流程将数据从自然的非结构化状态提炼为结构化形式,这些流程耗时、不可扩展且容易出错。
到 2025 年
数据从业者越来越多地利用一系列数据库类型(包括时间序列数据库、图形数据库和 NoSQL 数据库),从而实现更灵活的数据组织方式。 这使得团队能够更轻松、更快速地查询和理解非结构化和半结构化数据之间的关系,从而加速新的人工智能驱动功能的开发以及数据中新关系的发现以推动创新。 将这些灵活的数据存储与实时技术和架构的进步相结合,还使组织能够开发数据产品,例如“客户 360”数据平台和数字孪生——物理实体(例如制造工厂)的实时数据模型 、供应,甚至人体)。 这可以使用传统的机器学习功能或更先进的技术(例如强化学习)进行复杂的模拟和假设场景。
数据运营模型将数据视为产品
今天
组织的数据职能(如果存在于 IT 之外)使用自上而下的标准、规则和控制来管理数据。 数据通常没有真正的“所有者”,确保其能够以各种方式更新并可供使用。 数据集还存储在庞大、孤立且通常成本高昂的环境中(有时是重复的),这使得组织内的用户(例如寻找数据来构建分析模型的数据科学家)难以快速查找、访问和集成数据集。 他们需要的数据。
到 2025 年
数据资产作为产品进行组织和支持,无论它们是由内部团队还是外部客户使用。 这些数据产品有专门的团队或“小队”,与它们配合嵌入数据安全、发展数据工程(例如,转换数据或持续集成新的数据源)以及实施自助服务访问和分析工具。 数据产品利用 DataOps(数据 DevOps)以及持续集成和交付流程和工具,以敏捷的方式不断发展,以满足消费者的需求。 总而言之,这些产品提供的数据解决方案可以更轻松、更重复地用于应对各种业务挑战,并减少交付新的人工智能驱动功能的时间和成本。
首席数据官的角色扩大以创造价值
今天
首席数据官 (CDO) 及其团队充当成本中心,负责制定和跟踪政策、标准和程序的合规性,以管理数据并确保其质量。
到 2025 年
CDO 及其团队作为一个承担损益责任的业务部门运作。 该部门与业务团队合作,负责构思使用数据的新方法,制定整体企业数据战略(并将其作为业务战略的一部分嵌入),并通过数据服务和数据共享货币化来培育新的收入来源 。
数据生态系统成员资格已成为常态
今天
数据通常是孤立的,即使在组织内部也是如此。 尽管与外部合作伙伴和竞争对手的数据共享安排正在增加,但它们仍然不常见,而且往往受到限制。
到 2025 年
大型、复杂的组织使用数据共享平台来促进组织内部和组织之间数据驱动项目的协作。 数据驱动的公司积极参与数据经济,促进数据汇集,为所有成员创造更有价值的见解。 数据市场实现了数据的交换、共享和补充,最终使公司能够构建真正独特的专有数据产品,并从中获得见解。 总而言之,数据交换和组合的障碍大大减少,将各种数据源汇集在一起,产生的价值远大于其各个部分的总和。
数据管理优先化并自动化,以确保隐私、安全性和弹性
今天
数据安全和隐私通常被视为合规问题,这是由新兴的监管数据保护指令推动的,而且消费者开始意识到他们的信息有多少被收集和使用。 数据安全和隐私保护通常要么不充分,要么单一,而不是针对单个数据集进行定制。 为员工提供安全的数据访问是一个高度手动的过程,因此容易出错且耗时较长。 手动数据弹性流程很难快速、全面地恢复数据,从而产生长时间数据中断的风险,从而影响员工的工作效率。
到 2025 年
在《弗吉尼亚消费者数据保护法》(VCDPA)、《通用数据保护条例》(GDPR) 和《加州消费者隐私法》等不断变化的监管期望的推动下,组织思维方式已完全转向将数据隐私、道德和安全视为所需能力领域 (CCPA); 提高消费者对其数据权利的认识; 以及安全事件的风险越来越高。 自助服务配置门户使用预定义的“脚本”来管理和自动化数据配置,以安全可靠地为用户提供近乎实时的数据访问,从而大大提高用户的工作效率。
自动化、近乎持续的备份程序可确保数据弹性; 更快的恢复程序可以在几分钟而不是几天或几周内快速建立和恢复数据的“最后一个良好副本”,从而最大限度地减少发生技术故障时的风险。 人工智能工具可以更有效地管理数据,例如,通过自动识别、纠正和修复数据质量问题。 总而言之,这些努力使组织能够对数据及其管理方式建立更大的信任,最终加速新数据驱动服务的采用。