数据治理的重心,已经从“管”,晋升到“用”,其目的不是为了管好数据,而是为了数据好用和用好数据。数据目录的建设就是体现这一侧重转变的最好说明,为了让各种用户快速方便地查找他所需要的数据,而构建数据资产目录。
其目的是为了用,就需要认真面对一系列的问题,哪些数据需要纳入目录管理?哪些数据是资产?数据资产的价值是否实现?如何评定资产是否被很好的使用起来?建立好目录之后如何使用?
不同的用户,针对不同的数据使用场景会给出不同的答案,但最终的目的都是为了数据治理的成果被使用起来,当然数据治理不是单纯一个数据目录就能实现的,更是和企业的业务流程和治理策略相关的。
数据标准是数据治理中不可少的部分,治理的过程也是落标的过程,其中数据质量和问题的体现,很多情况下并不是数据的问题,而恰恰是数据标准的问题,是定义业务定义和业务规则的质量问题。
数据质量的管理除了对数据进行清洗转换,提升数据质量外,还要进一步促进数据标准的建立和统一,从而逐步减弱和消灭劣质数据,真正从根源提升数据质量,也为后期的数据准备降低清洗和转换工作量。
企业数据环境复杂多样,数据量和新的数据源也层出不穷,单纯靠人力去梳理复杂关系,不仅仅是一个漫长繁重的工作,另外主观的意图和方法还会导致一些重要的信息的缺失和遗漏。自动化的盘点、智能的分析和推荐、自动的比对和关联,自动的关联数据校验,都是治理工作中所迫切需要的,这样的数据治理环境,不仅提升数据管理的层次和水平,也激发参与管理的人员的灵感和创造性,使数据治理逐渐成为一种主动的行为。
数据治理在构建好以数据目录为中心的数据基础后,更要具有给上层分析应用和AI建模等提供数据服务的能力,真正体现数据价值。业务人员、数据分析人员和数据科学家等都可以通过数据目录查看到需要的数据,了解数据轮廓、数据质量,进行数据可视化查看,根据需要进行数据精炼,从而进一步使用数据。
咨询热线:400 668 2350
好文章,需要你的鼓励
软件开发瓶颈是现代企业面临的关键挑战。本文探讨了消除瓶颈的有效策略,包括优化沟通、提高可视化、自动化流程和培养共同责任文化。专家建议通过异步更新、看板管理和自动化工具来提高效率。同时强调了数据质量、跨团队协作和持续改进的重要性。文章还提到了新兴技术如AI在解决瓶颈问题中的潜在应用。
随着人工智能技术的发展,深度伪造内容在网络上大量涌现,可能对我们的健康造成潜在威胁。从虚假名人代言到有害的AI生成医疗建议,深度伪造正在助长一波危险的虚假信息浪潮。本文探讨了深度伪造在医疗保健领域的负面影响,以及如何在这个充满虚假信息的时代保护自己的健康。
INCYMO.AI 推出了一个革新性的 AI 驱动创意平台,专注于移动游戏广告制作。该平台基于 10 万多个市场验证广告的数据分析,通过 AI 技术为游戏营销人员提供创意构思和广告生成服务。在创意疲劳、用户获取成本上升和隐私限制的当前环境下,该平台为游戏营销开辟了一条数据驱动的全新道路。
Databricks 与 Palantir 签署合作协议,开发出更优的大语言模型微调方法,并与 Anthropic 达成为期五年的战略联盟,将 Claude 大语言模型整合到其数据湖平台中。此次合作将为企业客户提供更强大的 AI 能力,包括军工级安全性、高效的模型训练以及全面的数据治理,助力企业打造专属 AI 应用。