亚马逊公司在15年前推出了亚马逊网络服务(AWS)平台,在两年之后,该公司在该平台之上构建了100多个应用程序。人们如今已经知道这个故事的结局——几乎所有的企业都以某种形式或方式在云平台中部署应用程序。然而,企业采用云服务依然存在挑战,尤其是对于拥有大量内部部署业务的企业而言。对于许多企业来说,如何更好地将关键业务数据和元数据迁移到云端以支持持续的运营和分析仍然是一个难题。
尽管近年来人们越来越意识到云迁移的战略价值,但许多企业仍在采取违反人们直觉且成本过高的方法。企业倾向于将他们的方法分解成若干部分——“只是将新信息移动到云中,而不用担心存在于内部部署设施的当前数据”,或者“以后会考虑治理和安全性”。虽然这种方法可能有助于限制对预算的担忧并明确范围,但从长远来看可能会很麻烦,并会延迟云迁移的潜在投资回报。此外,如果企业将一些数据留在内部部署设施中,最终会限制其在未来现代数据堆栈中用于分析的用途。现实情况是,要充分利用现代数据堆栈,需要清楚地了解迁移到云端的用例以及成功所需的数据。
采用敏捷方法
如果询问业务领导者为什么没有将业务从内部部署设施迁移到云平台,他们的回答通常是出于对数据治理的担忧。虽然治理对于保护数据和确保正确使用确实至关重要,但真正采用敏捷数据治理的需求远不止于此。数据有能力在中断时期保持业务运行和繁荣,如今的企业根本无法承受由于治理问题而导致数据中断的后果。
预先投资敏捷数据治理或重新投资现有流程可以防止数据和分析阻塞,并使企业能够使用更现代的工具来加速投资回报。此外,它还促进了数据团队之间的协作,并允许企业在其工作时获取知识。特别是在云迁移中,这使数据生产者更容易理解企业为什么要迁移到云平台,以及他们希望在现代数据堆栈中运行哪些数据驱动的计划。拥有这些知识,数据工程师可以在内部部署设施创建优先级积压的数据资产,并等待迁移。
按顺序获取分析
无论是在云迁移过程中重新开始还是试图升级一些不成熟的技术,组织和一致性都是关键。提出重大问题以建立指标,这些指标将指导当前的过程以及未来的成功是什么样的。然后将其数据结构化为一致的架构和风格,以确保更顺畅的运行。
企业可能希望根据已有的架构类型组织数据。随着时间的推移,可以考虑分层数据模型。例如,企业的数据可能按业务部门排列,但将来希望围绕客户、产品和订单等实体进行整合。也许企业如今使用星型模式,但希望在表上进行分层以便将来更轻松地进行分析。无论选择什么,始终如一地应用架构风格将确保该平台不仅适用于数据生产者,而且适用于数据消费者。
为流程使用正确的工具
没有投资正确工具的最佳方法仍然不会完全成功。当然,随着经济衰退和通胀担忧给预算带来压力,这一领域已经并将继续对许多企业来说更具挑战性。然而,这一新现实并不需要限制云迁移。了解端到端流程将帮助企业确定正确工具的优先级、提高效率,并创造真正的业务价值。
其中许多选择将取决于企业的用例。随着企业的预算增加和迁移规模的扩大,数据治理平台、数据质量、分析、沿袭等可以在其优先事项具有战略意义时上线。例如,如果企业试图识别复杂的依赖关系和最常用的资产,那么沿袭将是关键。或者,如果企业试图跟踪拥有的数据并确保它也显示在新环境中,那么元数据清单和比较分析显然是优先事项。无论企业的短期和长期目标如何,数据目录都是将元数据结合在一起的粘合剂,确保可发现和可搜索、可分析并支持自助服务。
数据领导者
正如数据领导者所知,任何迁移过程中最具挑战性的部分之一就是在正确的时间让正确的利益相关者参与进来。为了真正获得成功,所有利益相关者都应该参与到云迁移中并进行切实的分析,而不仅仅是假设。选择与消费者实际需要完成的任务相一致的分析用例,并设置明确的截止日期,可以帮助企业衡量价值并防止一开始就陷入困境。
此外,在数据目录上构建云迁移基础的好处之一是它可以在各方之间实现协调、一致和集中的工作。数据消费者可以实时处理数据,以评估模型在回答问题方面的成功程度。管理员可以将业务术语表和指标定义与数据一起记录下来。由于所有这一切以及更多事情都围绕一个平台进行,因此它使协调更简单,并防止未来出现知识债务。
最终,使用正确的敏捷数据治理方法、分析方法、工具和人员流程进行云迁移永远不会太晚。随着对数据的需求呈指数级增长,参与这个过程,即使是零碎的方法,也会带来好处。