ICS35.240.01 CCS L 70 团 体 标 准 T/HAA1 002-2024 数据资产 数据治理规范 Data assetsData governance specifications 2024-11-27发布 2024-12-01实施 海南省人工智能学会 发布
T/HAA1 002-2024 目次 前 言 1 1范围.... 2规范性引用文件 3术语和定义. 4数据治理的目标与价值, 4.1搭建数据质量管理体系 2 4.2建设数据资产目录体系 4.3建设数据管理组织体系 4.4建设数据安全管理体系. 4.5促进数据价值释放. 5数据治理的框架, 6数据治理的模式 6.1数据治理推动应用模式 3 6.2应用牵引数据治理模式 7数据治理的实施流程.
7.1保障体系构建.
7.2调研阶段... 7.3需求分析与设计阶段, 5 5 7.4数据采集阶段.. 5 7.5数据存储阶段. 7.6数据清洗阶段.. 7.7数据质量管理阶段 6 7.8数据原子化阶段 7.9数据目录建设阶段.
7.10数据交换阶段. 8数据治理的主要工具. 8 8.1数据开发管理平台 8.2数据资源管理平台 8.3数据质量管理平台 8.4数据服务管理平台 参考文献. 附录A (资料性)附录一英文简写说明 1
T/HAA1002-2024 前言 本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定 起草.
本文件由海南省人工智能学会提出并归口.
本文件起草单位:中国电信股份有限公司数据要素技术创新(海南)中心、中国电信股份有限公司 海南分公司、海南师范大学、武汉大学、海南科技职业大学.
本文件主要起草人:张小建、黄健强、陈文思、符舒凡、梁钰、吴佩琦、丁超、黄程杰、周政成、 郭世坤、蔡雪云、严炜炜、王艺臻、白额.
II
数据资产数据治理规范 1范围 本文件提出的数据治理规范涵盖了组织或机构的信息系统内部,及该系统支撑外部业务开展所需 数据治理的基本过程.
具体包括调研、分析、需求设计、数据采集、数据存储、数据清洗、数据质量管 理、数据原子化、数据目录与数据交换等阶段的内容.
本文件适用于组织或机构数据资产入表前期的数据治理工作.
2规范性引用文件 下列文件中的内容通过文中的规范性引用面构成本文件必不可少的条款.
其中,注日期的引用文件, 仅该日期对应的版本适用于本文件:不注日期的引用文件,其最新版本(包括的修改单)适用于本 文件.
GB/T34960.5-2018信息技术服务治理第5部分:数据治理规范 GB/T36073数据管理能力成熟度评估模型 3术语和定义 GB/T37500界定的以及下列术语和定义适用于本文件.
3. 1 数据资源dataresources 是指具有使用价值的数据,是可供人类利用的新型资源.
3.2 数据产品dataproducts 是指基于数据加工形成的,可满足特定需求的数据加工品和数据服务.
3.3 数据资产data assets 是指特定主体合法拥有或者控制的,能进行货币计量的,且能带来直接或者间接经济利益的数据资 源. [来源:GB/T40685-2021,3.1,有修改] 3.4 数据治理datagovernance 数据资源及其应用过程中相关管控活动、绩效和风险管理的集合.
[来源:GB/T34960.5-2018 3.1] 3.5 数据质量管理dataqualitymanagement 数据质量管理是指对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可 能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织 的管理水平使得数据质量获得进一步提高.
[来源:GB/T44109-2024,6.4.4,有修改]
4数据治理的目标与价值 4.1搭建数据质量管理体系 4.1.1构建数据标准体系 通过统一的数据标准制定与发布,结合制度约束、系统控制等手段,实现组织或机构内部数据的完 整性、有效性、一致性、规范性、开放性与共享性管理,为数据治理工作打下坚实的基础,为数据资产 入表提供规范有效依据.
4.1.2实施数据质量评估 通过设计科学合理的数据质量评估指标和方法,定期对数据的准确性、完整性、一致性、可用性和 及时性等方面进行评估,及时发现数据存在的质量问题,为数据质量改进提供明确的方向和重点.
4.1.3强化数据质量监控 利用先进的技术工具和手段,对数据的产生、流转和使用过程进行实时监控,及时捕捉数据质量的 异常情况,做到早发现、早处理,有效预防数据质量问题的扩大和蔓延.
4.1.4推动数据质量改进 针对数据质量评估和监控中发现的问题,制定切实可行的数据质量改进方案,并组织相关部门和人 员实施,持续跟踪改进效果,形成数据质量提升的闭环管理.
4.2建设数据资产目录体系 建设数据资产目录体系是数据治理的核心工作.
数据资产目录体系要匹配组织或机构的战略规划, 形成高效的数据资产目录体系与数据服务能力.
通过系统化的数据整理、分类、描述与索引,组织或机 构可以更加高效地管理与利用数据资源,为业务创新与决策优化提供有力支撑,促使数据源不断地向数 据资产目录输出数据资源.
同时,数据资产目录的持续优化与选代,确保数据始终能够适应业务需求与 技术发展的要求,即业务产生数据,数据延申业务,形成业务数据化、数据产品化、数据资产化的闭环.
4.3建设数据管理组织体系 全面协同的组织体系是数据治理工作的组织保障.
该体系要契合组织或机构的战略规划,形成高效 的协同组织体系与协作服务能力.
通过跨部门跨业务的整合、协调、分工与合作,组织或机构能够更有 效地推进数据治理工作,为业务发展与管理优化提供有力保障,促使各部门不断地向组织体系输入资源 与支持.
同时,组织体系的持续优化与选代,确保其始终能够适应业务需求与管理发展的要求,即业务 驱动组织,组织服务业务,形成业务组织化、组织高效化、组织完善化的闭环.
4.4建设数据安全管理体系 组织或机构数据安全体系建设是数据治理与信息生命周期管理的基础.
梳理组织或机构内部数据 全生命周期,确定数据权分配与权责制度,满足监管合规要求.
在数据治理中,提高数据安全能力 是价值共享关键,推动安全体系建设是必要保障.
组织或机构按重要程度为数据打标签、分级分类,明 确使用范围与开放方式,不同等级数据在不同场景采用不同安全策略.
还可通过数据泄露防护、加密、 权限管理等手段保护机密数据,降低泄露风险.
4.5促进数据价值释放 数据治理作为一套涵盖数据标准制定、数据质量管控、数据安全防护及元数据管理等多维度协同的 系统性工程,数据治理的重要目标是让数据有序安全流动,挖掘价值,数据流动要推动开放分享,实现 汇聚、建模、共享,关键是数据汇聚打破孤岛,重构获取与应用方式,重塑链条,建立高效应用.
数据 治理促进数据应用及共享,让组织或机构用已有资源,减重复工作与费用,专注新开发及集成.
数据应 用及共享能降成本、增能力、提效率、减重复、促合作、强联系.
5数据治理的框架 构筑数据治理体系核心在于以数据应用构建“良性循环的闭环数据治理管理体系”.
各IT系统获 取业务活动所生成的各类数据,通过系统的数据治理和管理操作,持续挖掘并实现数据价值,拓展和深 化数据应用场景,为业务决策予以指导.
与此同时,在数据的持续应用过程里,基于发现的数据间题, 2