“数据治理能力”解读
来源:本站 作者:李 霞 吴绍兴 李玉清等 郑州西亚斯学院 南阳理工学院 鹤壁职业技术学院 发表于:2023.12.29 922浏览
文/李 霞 郑州西亚斯学院执行CIO、信息化建设与管理处处长
吴绍兴 南阳理工学院信息化建设与管理中心主任
李玉清 鹤壁职业技术学院网络安全与信息化处处长
孙晓莹 南阳理工学院信息化建设与管理中心大数据应用部主任
霍小卫 郑州西亚斯学院信息化建设与管理处发展规划部主任
数据治理工作主要是对学校数据资源的统一管理和质量控制,是在保障安全的前提下推动数据资源的共享和使用,实现跨业务部门的协作,构建统一数据标准、提升数据质量、建立数据共享机制、挖掘数据价值、推动数据应用、降低数据风险,为推进学校治理能力和治理水平提升提供基础数据支撑。根据数据治理体系建设内容与应用要求,评估指标体系对各学校数据治理能力评估围绕数据汇聚、数据治理、数据共享三方面开展。
一、数据汇聚:构建数据治理能力的基础
通过制定数据标准、多源数据采集、构建全域数据等方式进行数据汇聚,从而构建数据治理能力的基础。
1.制定数据标准
制定规范的数据标准是做好数据治理工作的前提,也是核心内容之一,对于提升数据质量、理清数据构成、打通数据孤岛、加快数据流通、释放数据价值有着至关重要的作用。在业务层面,数据标准能够明晰业务含义,使业务部门之间、业务技术之间、统计指标之间统一认识。在技术方面,数据标准能够构建规范的数据模型,实现数据在跨系统间敏捷交互,减少数据清洗的工作量,便于数据融合分析。
规范数据标准时,应按照定义数据标准、合理制定校标、满足使用需求的要求进行。一是要定义数据标准,在制定数据标准时,应依据教育管理信息化高等学校管理信息标准、教育基础数据、教育系统人员基础数据、数字教育资源基础分类代码等教育部行业标准为主体框架,进行数据子集分类和元数据标准定义。二是合理制定校标,在对学校数据资产进行全面调研梳理的基础上,结合国家、行业标准代码和学校现有业务系统的事实标准,制定学校的数据标准、数据交换标准、数据集成标准和接口集成规范等校级数据标准,建立标准管理工具,管理标准全生命周期。三是满足使用需求,校级数据标准应包含内容全面的标准代码集、元数据模型、接口交换标准、数据质量标准、数据安全标准、编码及对象命名规范等条目,数量满足业务系统间数据交换和共享所需的基本需求。
数据标准的充分执行是进行数据质量保障和数据规范化管理的前提和基础,应充分明确数据标准的管理责权,明确数据标准执行的具体要求,保证数据标准切实应用到各个应用开发和数据定义过程中,业务系统的标准变更能及时在数据标准中进行更新,使各个系统输出的数据符合标准规范的要求。为保障数据标准的充分执行的落实,应通过《数据标准管理办法》《数据集成规范》等规范性文件予以保障。
2.多源数据采集
学校通过建立数据交换体系、多种方式采集数据等方式建设高质量的校级公共数据中心,满足业务系统的数据共享和交换需求。
学校需要部署高效先进的数据采集工具、数据存储架构,采用多种数据填报采集工具,通过多种方式实现各类数据采集。对于业务系统数据,默认数据采集方式为通过数据采集工具连接到管理信息系统的数据库,以只读方式访问数据库,完成数据采集。无法按照上述默认方式采集的数据,也可采用数据库视图、API接口、中间库、log文件方式提供数据采集渠道,对于大数据文件JSON、Excel、TXT等非结构化数据也应提供采集支持。
参与数据采集的主要业务系统数量一定程度上反映了数据中心的数据完备程度和可应用基础。数据交换与共享管理的目标是在全校范围内充分消除数据孤岛、打通流程壁垒、打破部门隔阂,充分发挥数据资源的价值。为实现全校数据交换与共享的目标,应尽可能全面地采集校级业务系统数据,特别是教务管理系统、人事管理系统、学生工作管理系统等业务系统数据,这些数据是构建公共数据中心的数据基础,必须参与采集。不同类型的业务数据越多,数据中心构建的全校数据地图越完整,能够提供的数据服务和应用也就越丰富。
数据交换体系需要在规范流程管理下,明确数据的生产责任、交换范围、交换流程。数据使用者在满足需要的前提下按照最小范围申请使用数据资源。通过数据交换体系的建设,使全校部门、师生等通过数据交换平台获取共享数据,提升数据应用价值。
3.构建全域数据
数据采集后应按照标准数据模型的定义进行清洗、转换,生成实体表,构成校级公共数据中心的数据资源实体,构建包含“人、财、物、教学、科研、校园生活、行政管理、物联”等多维度的全域数据库。
全域数据库应能够满足绝大部分业务系统数据共享和应用的需求。全域数据库中的教职工、学生、组织机构数据是数据共享和交换中最基础和高频的数据,课表、成绩、物联设备和生物识别等数据也能够在相应数据服务和智慧校园应用中发挥数据基础作用。
数据采集接口和数据共享接口的数量及其活跃度一定程度上反映了数据交换体系的运行状况。数据采集接口应在定时采集业务数据、保持日常采集状态、保证数据采集频率等方面满足需求。数据共享接口可通过API接口、ETL推送等多种形式实现,能够支持业务系统对数据的实时调用、数据的准确性和实时性的要求。
二、数据治理:保障数据治理能力的质量
通过梳理数据资产、提升数据质量、加强数据运维等方式,实施数据分类分級、推进数据流转、数据质量稽核等工作,保障数据质量。
1.梳理数据资产
数据治理是实现数据资源向数据资产转变的重要载体。数据资产管理应通过完善管理制度、形成资产目录、加强数据安全等工作推进。
建立和完善相应数据管理制度,通过管理措施和技术手段,常态化开展数据资产管理工作。围绕数据资产管理、数据安全管理、个人信息管理等方面制定相应管理制度,通过规范化的管理体系,推进数据资产管理工作,对数据的一致性、完整性、合规性、及时性、开放性等问题进行规范。
做好数据资产梳理,形成数据资产目录。能够对数据资产实行数据确权,明确资产归属和维护责任,保证“一数一源、多源校核、动态更新”。制定元数据模型、数据标准等规范,采集并建立完整的数据资产目录体系。明确数据内容、存储格式、数据范围、数据流转形式、数据访问控制方式、数据价值高低等问题,形成数据资产清单。打破业务系统壁垒,建立以学校人财物为主题的各类主题数据资产目录。实现数据的标准化和资产化管理,提升数据质量、挖掘数据价值并通过数据赋能教学和管理。
在对全量数据资产梳理的基础上,明确学校内部的数据分类分级原则及方法,开展数据分类分级,可以实现差异化的数据安全管理。可结合《DB33∕T 2351-2021 数字化改革公共数据分类分级指南》《教育系统核心数据和重要数据识别认定工作指南(试行)》《信息安全技术个人信息安全规范》等文件,开展数据的分类分级工作,对敏感数据进行脱敏、加密、审计等数据安全管理工作,对核心数据和重要数据的业务属性、使用场景、公开范围等实施动态管理。
2.提升数据质量
高质量的数据是数据应用的基础,数据质量管理是对数据从产生、获取、存储、共享、维护、应用等各个阶段可能引发的数据质量问题,进行识别、度量、监控、预警等一系列管理活动,可以通过改善和提高管理水平使数据质量逐步提高直至满足使用需求。数据治理工作中的数据质量应满足数据使用者要求的数据完整性、唯一性、准确性、及时性。
建设数据质量管理平台,对数据治理过程中的数据流进行梳理,建立业务数据间血缘关系,形成从采集、清洗、汇聚到应用的数据流链路。通过对数据流链路的不同视角查看,实现对采集的数据溯源、核对、影响分析、审计等工作,支撑数据质量问题的快速排查、精确定位。
同时,数据质量管理平台应具备制定数据质量检测规则和基于校级数据标准形成面向业务系统的数据质量检测方案的能力。在数据质量整改方面应建立数据反馈子系统,通过督察督办机制,并结合周期任务完成数据质量检查和生成质量检测报告并及时反馈至数据责任部门进行修正。
3.加强数据运维
数据运维工作既需要监测数据采集任务、数据清洗任务、数据共享接口调用情况、数据质量核查等日常周期性维护的工作是否正常执行,又需要解决突发情况,如个别接口调用过于频繁、接口熔断处理,需要排查其调用方式,查找出现问题的原因。
为了更好地开展运维工作,需要认真梳理数据治理工作中各环节日常运维内容,制定标准化运维清单,细化维护管理机制,形成常态化、标准化运维机制,形成具备对数据采集、清洗、订阅、安全开放、共享等流转过程进行监测、日志查看、处置的能力。
三、数据共享:提升数据治理能力的成效
通过数据汇聚、数据治理后,数据共享为教学科研、管理服务等过程提供数据通畅、流程顺畅的应用环境,提升数据服务成效。
1.数据可视化
数据应用需要解决数据的不可阅读性和抽象性问题,通过建设数据可视化平台,采用文本可视化、时空可视化、多维数据可视化等多种可视化技术,可根据学校的不同业务需求、数据要求,进行关联数据分析、主题数据分析,建设基于教学科研、管理服务等的多角色、多场景数据分析模型,将数据以具体直观的图形方式进行呈现,使用户更加专注于自有业务,决策支持更具有高时效性和高回报性,提升决策科学性和数据获得感。
2.数据共享
通过拓宽数据共享与应用方式,加强对数据共享过程的管理。对于无条件共享且接口不需要管控参数的数据,由公共数据中心直接提供;对于有条件共享,或者无条件共享但接口需要管控参数的数据,由公共数据中心推送给业务部门受理。建立反馈机制,规范业务部门对于数据需求的申请、审查和审批,充分发掘数据治理后的数据价值。