数据治理赋能数字政府建设
顾平安
(中共中央党校(国家行政学院)公共管理教研部教授)
[摘 要]:数据治理是一套技术与管理相结合的制度体系,贯穿数据的整个生命周期。政务数据治理要在强化技术治理的前提下,以“数据确权”为基础,以“数据安全”为底线,明确政务数据的创制权、所有权、管理权、使用权和交易权,通过确立并实施一系列制度规则,落实数据质量责任,破除制约数据交换、共享和开放的体制机制性障碍,提高数据可用性、安全性、交融性,提升数据使用价值,加快实现政务数据合理有序流动,全面赋能数字政府建设。
[关键词]:数据治理;数据确权;数字政府建设
进入21世纪,新一代信息技术与经济、社会各领域加速融合,数据呈爆发式增长。多样化的数据形态,不断增强的数据流动性和各类不同场景的AI应用,大数据所蕴含的潜在价值不断释放。无数据,不智能!数据日益成为社会经济重要的生产要素。与此同时,数字政府快步迈入以“数据挖掘、应用融合”为特征的新阶段。没有高质量的政务数据,没有数据的融合、交换和共享,数字政府建设也就无从谈起。加强政务数据治理成为推动数字政府建设的内在需要和必然选择。
一、政务数据治理的内涵
广义的数据治理有两层含义:一是“用数据治理”,重在研究如何运用数据赋能经济、社会发展,充分发挥大数据在经济、社会各领域的作用,为数据赋能经济社会发展找出新方法和新路径;二是“对数据治理”,重在研究如何提高数据的可用性和价值,解决数据创制、使用、共享、交换、开放等环节中存在的一系列技术、制度和法律层面的问题,其目的是确保数据资产得到正确有效的管理,为“用数据治理”打下坚实的基础。
狭义的数据治理仅指“对数据治理”,从治理的内容来看,包括以“技术”为核心的企业级数据治理和以“规则”为核心的联盟级数据治理,是一套技术与管理相结合的制度体系,贯穿数据的整个生命周期。前者专注于数据要素层面的技术治理,后者着眼于使用层面的制度治理,其目的是通过确立并实施一系列制度规则,对数据全生命周期的每一个环节进行有效管理和控制,进而提高数据的可用性、安全性、交融性,提升数据价值。
具体来说,政务数据治理是政府对其自身数据资产进行管理和控制的一系列活动的集合,涉及数据创制、保存、使用、交换、共享和开放等环节,是一个完整的包含标准、流程、工具和制度等要素的科学管理体系。政府数据治理则是为了更好地利用数据开展决策、管理和服务。因此,政务数据治理不可能依靠某个政府部门来完成,也无法通过政府自身得到有效解决。加强数据治理既需要政府部门与IT企业进行协作,又需要政府各个部门围绕数据的全生命周期加强管理与控制,以改善数据的可靠性和质量,从而为关键业务数字化转型提供支持,并确保遵守法规,充分发挥数据在推进国家治理现代化进程中的基础性和创新性作用。
二、中央政府对政务数据治理的要求
经过20多年的政府信息化建设,我国政务数据呈现出八大基本特点:数据体量大、应用浅、开放少;点数据多、条数据强、块数据弱;静态数据多,动态数据少;碎片化数据多,关联性数据少;离线数据应用多,在线数据应用少;不能共享的数据多,能共享的数据少;有条件共享的数据多、无条件共享的数据少;行政性开发的数据多,市场化开发的数据少。
总体来说,我国政务数据治理缺乏有效的质量评价标准,基于政务数据的完整性、规范性、时效性、唯一性、一致性、准确性和关联性的数据质量管理体系尚未建立,数据交换共享存在着诸多制度性障碍,数据融合步履维艰,政务数据价值难以释放。造成这种状况的一个重要原因是政务数据确权问题没有得到有效解决。
2016年9月,国务院印发《政务信息资源共享管理暂行办法》(国发[2016]51号),对政务数据的共享治理做出具体规定。该文件首次明确指出,政务信息资源要遵循“以共享为原则,不共享为例外”“需求导向,无偿使用”等原则,通过构筑信息共享“大通道”,构建政务数据资源“总目录”,搭建共享交换“总枢纽”的方式,逐步建立完善国家政务数据共享交换体系。文件将政务信息资源按共享类型分为无条件共享、有条件共享、不予共享三种类型,要求政府部门编制政务信息资源目录,明确政务信息资源的分类、责任方、格式、属性、更新时限、共享类型、共享方式、使用要求等内容,进一步细化政务数据的共享要求。
但是,就政务数据治理来说,类似“谁主管、谁提供、谁负责”“谁经手、谁使用、谁管理、谁负责”这些原则性要求,无法从根本上排除数据共享的制度性障碍,加快推进数字政府建设依然面临基础性治理的缺失。
三、地方政务数据治理的整体情况
党的十八大以来,随着放管服改革的不断深化,在加快推进“互联网+政务服务”过程中,地方政府主动将政务数据治理纳入议事日程。2010年至2019年,全国31个省(自治区、直辖市)共出台了125份省级政府层面与政务数据治理直接相关的政策文件,为政务数据治理提供遵循和指导。
机构调整与设置情况。建立专门的数据管理机构进行政务数据管理和大数据应用,已成为当前地方政府的普遍做法。截至2019年底,我国31个省级政府(自治区、直辖市)中,已设立专门数据管理机构的省份为22个。各地政务数据管理机构大都包含五项主要职责:数据开放共享、数据产业发展、数据安全保障、数据基础建设、数据资金管理,建立健全政务数据治理的职责体系依然任重道远。
平台建设与投入情况。统计数据显示,2017年至2019年,省级政务数据治理相关的平台和系统建设项目1822个。从省域治理来看,建设项目最多的前五位分别是:北京市224项、广东省174项、广西壮族自治区145项、福建省105项、贵州省102项。从专业领域治理来看,政务数据平台的相关项目分散于财税、社保、交通、卫计等23个不同领域,数量最多的是财税领域,共有275项,占总量的15.1%。总体来看,地方政府数据治理发展不平衡,较多省缺乏切实有效的行动,虽然有些地方政府通过建立平台推动数据共享和数据开放,但却很难达到预期效果。
数据共享与开放情况。通过开展政务系统整合共享,可以逐步解决长期以来困扰我国政务信息化建设的“各自为政、条块分割、烟囱林立、信息孤岛”问题,实现政务数据资源跨层级、跨地域、跨系统、跨部门、跨业务的协同管理和服务。伴随《促进大数据发展行动纲要》等国家政策的逐步落实,全国范围内的省市级地方数据开放平台数量增长迅猛,近两年呈现“井喷”态势。截至2019年10月,我国已有102个符合政务数据开放基本特征的地级及以上平台陆续上线。从数量上看,全国范围内的开放数据集总量从2017年的8398个迅速增长到2019年的71092个。从地方政府的实践来看,政务数据治理的重点围绕数据的“聚、通、用”展开。所谓“聚”,是指地方各级政府大数据管理机构通过搭建云计算平台,将海量政务数据汇聚到大数据中心,实现政务数据统筹存储、统筹共享、统筹标准、统筹安全。所谓“通”,是指遵循数据的关联性,扩大数据的“朋友圈”,加快政务数据的流通融合,进一步释放政务大数据的价值。对于政务大数据而言,单一部门和单一维度的数据价值有限;关联性数据之间的流通融合,有助于政务数据价值最大化。所谓“用”,是指基于海量数据的聚集与融合,开展数据返还,为各地区、各部门基于数据的创新改革、建设协同高效的数字政府,提供政务大数据支撑。近年来,部分省级政府大数据管理机构不断扩大数据返还范围,围绕住房、教育、医疗、社保、健康、就业等领域,推动高频政务数据向市、县返还落地,加快推进政务服务数字化转型。同时,积极回应社会关切,将水、电、气、暖、通信等公共服务数据纳入政务数据开放范围,积极推动政务数据在社会信用、宏观经济分析等领域的综合应用。
四、政务数据治理需要重视的两个问题
“数据确权”是数字政府建设的基础性问题,直接关系到数据的流动性和有效使用,明确政务数据的创制权、所有权、管理权、使用权和交易权,是落实数据质量责任、确保数据在政府内部有序流动的必然要求。“数据安全”则是数字政府建设的根本保障,没有数据安全,就没有国家安全。在新基建环境下,传统数据安全面临从技术到管理全方位的挑战。
(一)数据确权是政务数据治理的基础
完善数据要素层面的技术治理是政务数据治理的基础,基于“数据确权”的规则层面的治理,是确保数据有序流动,提高数据使用价值,构建数据治理体系的关键。
2017年12月8日,习近平总书记在中共中央政治局实施国家大数据战略第二次集体学习时强调,“要制定数据资源确权、开放、流通、交易相关制度,完善数据产权保护制度。”产权是一组权利的统称,包括财产的所有权、占有权、支配权、使用权、收益权和处置权。作为虚拟资产,政务数据资源具有明确的产权属性。政务数据的开放、共享、流通和交易,都以数据资源确权为前提。如果政务数据的基本权力得不到清晰界定,数据治理就缺乏基本依据,政务数据交换、共享也会面临巨大的制度性障碍。
政务数据的确权是指要从法律和制度上明确界定政务数据的“创制权、所有权、管理权、使用权和交易权”这五项基本权力。
1.创制权。数据治理中最基本的问题是数据由谁来创制。明确数据创制权的归属部门,才能进一步落实数据采集、存储的责任。政务数据创制权是指享有定义一个或一组数据、依法依规创制一个或一组特定数据的权力,包括直接创制权和间接创制权。
直接创制权是指政府部门有权直接定义政务数据的数据项、数据内容和数据格式。现实中,大量的政务数据都是由政府部门直接创制产生的,政府部门可以根据本部门实施管理的需要,直接定义所收集或使用的数据。间接创制权是指政务数据的数据项、数据内容和数据格式的定义,需要获得有权机关的认可。证照类数据的创制权属于间接创制权,其数据通常是由法律或政策定义的,政府相关部门只能遵循,不能更改。
政府管理的权威性和整体性决定了政务数据的创制必须遵循“一数一源”的原则,避免“一数多源”。明确数据创制权是实现政务数据完整性、规范性、准确性和唯一性的根本保证。如果出现两个或两个以上部门对同一组数据进行定义,那么使用者就无法确定应该使用哪一个部门创制的数据。
2.所有权。数据的所有权是指对数据享有的支配权,包括原始数据所有权与衍生数据所有权。
从数据内容的产生方式来看,政务数据分为原始数据和衍生数据。原始数据是政府部门记录并保存在数据库中的数据,是未经处理或简化的数据,是政务数据的最初形态。衍生数据是指原始数据被记录、存储后,经过加工、计算、聚合,形成系统的、可读取的、有新的使用价值的数据。
政府部门依法依规采集的关于企业和公民个人的数据属于原始政务数据。原始政务数据具有权威性、公共性和隐私性特征,所有权归国家所有。政府部门间的信息资源共享是国家大数据战略的重要内容,政务数据共享不只是数据的流动,也是资源的流动。从法律上明确原始政务数据的所有权属于国家,有利于各级政务数据主管部门组织推进政务数据的归集、整合和安全保障工作,避免政府部门将政务信息资源视为本部门的资产,阻碍政务数据的归集、共享和开放。
在原始数据基础上,经过充分匿名化获得的政务数据集,政府对此类政务大数据享有限制性的所有权。政务数据的公共性决定了政务数据必须保持一定程度的开放性,方便公众和社会组织接近、获取和使用经过充分匿名化后的政务大数据。将政务数据设定为国家所有,有利于防范和避免政府部门将政务数据视为本部门的私产,将公众和社会组织排除在政务数据的使用许可范围之外。
3.管理权。原始政务数据是由不同层级的政府职能部门采集完成的,相关职能部门承担原始政务数据的管理权。原始政务数据汇聚到政府大数据中心后,经过算法加工,产生新的政务数据集,这类数据无论是用于政府内部管理还是对公众开放,其管理权属于政府大数据中心。社会第三方组织基于政府开放的数据进行筛选、分类、处理,形成主题数据、专题数据等一系列衍生数据产品,其所有权和管理权归第三方所有。
一切数据皆有源,隐私和安全保护成为政务数据管理权的核心,明确政务数据管理权,可以有效避免政府部门为规避风险而实施政务数据垄断。政务数据的生命力在于使用,最大限度地保持数据的共享与开放,是政务数据管理权追求的目标。为此,需要通过技术进步和制度完善,在数据安全与数据使用之间寻求平衡,在保证数据安全的前提下,最大限度地保证数据使用的便利性,不给用户“添堵”。
4.使用权。政务数据的使用权就是要明确界定政务数据的使用对象、范围、方式和责任,以及政务数据使用后的管理等问题。数据具有非物质性和非消耗性,在政府内部,政务数据坚持“以共享为原则,不共享为例外”,除涉密数据外,任何部门不能设置本部门政务数据排他性的使用权和支配权。政务数据的提供部门应按照“合法、正当和必要”原则,向使用部门及时提供数据共享服务,保障政务数据在不同部门之间及时交换和共享。
政务数据的公共性决定了政务数据的国有属性,且不排斥公众和社会组织对政务数据的使用权。《2016年联合国电子政务调查报告》认为,政府数据开放是“主动在网上公开政府信息,使任何人都不受限制地获取、再利用和再分发”。政府有义务在对政务数据进行充分匿名化和隐私处理之后,实行政务数据开放,让公众能够更方便地获取有用的政府数据。
5.交易权。政府部门采集形成的原始政务数据,是对公民个人和企业相关信息的记录。此类数据可能涉及国家安全、商业秘密和个人隐私,只能在政府内部基于管理合法性需要,进行交换共享,任何部门不得对原始政务数据进行交易。政务数据的交易权是指在原始数据基础上,经过充分匿名化和数据脱敏技术处理而形成的关于公民个人和法人的数据集,第三方组织可以按照一定的规则对此类数据进行交易。
随着政务数据向云端迁移,作为第三方服务的云计算平台,如果没有政府部门授权,任何组织不得将云平台上的政务数据自行脱敏后移作他用。大数据企业基于政府开放的数据集,经过加工处理,进而形成新的数据产品,大数据企业享有所有权和交易权。从原始数据到有价值的数据产品需要体力、智力和资本投入,只有当这些投入得到足够的回报时,才会有更多人愿意从事数据的收集、处理和加工,将数据转化为产品或服务。
(二)安全是政务数据保护的底线
随着新一代网络信息技术的快速发展,互联网正以超乎想象的速度向全球各个角落渗透,网络空间已经成为世界大国角逐政治、经济、军事、文化优势的全新领域,对数据要素的掌控和利用能力,已成为衡量国家之间竞争力的核心要素。
1.数据是网络空间战的核心和焦点。数据治理是涉及到技术、制度和法律等多个层面的复杂任务。习近平总书记在全国网络安全和信息化工作会议上强调,没有网络安全就没有国家安全,就没有经济社会稳定运行,广大人民群众利益也难以得到保障。政治上,网络空间已成为信息的“集散地”、舆论的“发酵池”,一旦被敌对势力控制利用,就会成为恶性事件的“催化剂”,严重威胁国家政权的巩固和社会安全稳定;经济上,网络空间已经成为新型企业的孵化器,对国家经济发展产生重要影响,国家重要基础设施的安全和有效运行依赖于网络空间;军事上,网络空间战既可以在陆、海、空、天等实体空间中实施,也可以在虚拟的网络空间进行,其中,数据的控制力对夺取陆、海、空、天的控制权具有重要影响。
网络空间战是互联网时代的信息战,除了基础设施安全,还包括系统漏洞和后门、外部攻击和窃密、数据资产泄露、内部非授权访问、违规交易等。1991年,海湾战争开始之前几周,美国情报间谍将国家安全局设计的病毒插入伊拉克计算机网络中,导致伊拉克防空系统瘫痪,是现代网络空间战的开始。2010年,美国和以色列联合针对伊朗核设施进行网络打击。马来西亚软件公司在不知情的情况下,将印度软件公司开发的、夹带“震网”病毒的离心机控制软件交给伊朗。“震网”病毒利用工业控制软件系统的漏洞,入侵伊朗核工业控制系统,取得了设备的控制权,导致近1000余台离心机因过热出现了永久性物理损坏,伊朗暂停浓缩铀进程。
网络安全的核心就是大数据安全。2017年5月,在贵阳举办的中国国际大数据产业博览会上,中国科学院院长白春礼认为,当前我国近50%的数据可能面临被泄露的风险。政务数据的完整性、可用性、保密性和可靠性,是国家安全战略的重要组成部分。政务数据资产规模大、分散度高、管理难,安全风险存在于政务大数据的采集、传输、存储、应用等整个生命周期。要加快改变我国政务数据安全建设碎片化、数据共享交换权责不明晰的局面。对政务大数据进行分级分类管理,完善数据安全管理制度,构建政务大数据可信的计算环境和安全管理体系,重点加强对数据资源采集、传输、存储、利用的治理,对数据全生命周期实施动态的防御策略。
2.“新基建”要持续深入推进数据要素安全管控。“新基建”被国外称为中国版“信息高速公路”建设,涉及5G基站建设、特高压、城际高速铁路和城市轨道交通、新能源汽车充电桩、大数据中心、人工智能、工业互联网七大领域,其核心是数字化和智能化技术的融合。“新基建”时代将迎来各产业的高度数字化,巨量数据和多元算力加速融入到智能化应用场景之中,数据的潜在价值将被无限挖掘和利用。“新基建”带来新业务的同时也带来全新的安全挑战,政务数据安全管理也从狭义的数据本身,延伸到与数据融合的每一个应用场景之中。例如,新冠疫情期间诞生的“健康码”,则是人与数据的相互结合,对“健康码”数据的保护已从政务数据保护本身,升级为对公民个人隐私的保护。
公共数据体量巨大、浩如烟海,并且大量存在于政务数据中。不同公共数据的安全管理、信息保护、开发应用的要求,均存在较大的差异。我们在超市里留下了购物记录,在共享单车和智能穿戴设备中保存的出行信息,在手机里保存的个人隐私,在医院信息系统中留下的疾病诊断和治疗记录,在人脸识别环境下被采集的个人生物特征,在智慧城市中产生的敏感统计信息,凡此等等,越来越多的应用场景使得个人数据泄密行为更加隐蔽,一旦遭遇不法泄露,个人隐私保护本身就会发展成为社会公共安全事件。
习近平总书记强调,“要切实保障国家数据安全”“加强关键信息基础设施安全保护,强化国家关键数据资源保护能力,增强数据安全预警和溯源能力”。从《促进大数据发展行动纲要》《网络安全法》,到《科学数据管理办法》《数据安全法(草案)》,再到《关于构建更加完善的要素市场化配置体制机制的意见》和“十四五”规划的发布,国家数据治理的政策导向明确,数据安全的赛道清晰。给政务大数据“守门”“上锁”,需要技术、法律和管理同步发力。要从被动防控向主动防御转变,将数据安全保护与“新基建”同步规划、同步建设、同步运行。要做好顶层立法和安全战略规划,将安全基因内置于网络系统、数据处理平台系统、应用系统,对政务数据实施全生命周期的动态防护,保护个人隐私和国家安全。
只有当其被正确理解和使用时,其价值才是巨大的。在传统的土地、劳动力、资本、技术、价格五大要素之外,数据已经成为国家基础性战略资源和核心性创新要素。近年来,随着互联网+政务服务的全面推进,“网上办”“掌上办”“一网通办”“一网统管”等数字政务建设步伐加快,数据治理在赋能数字政府“跨层级、跨地域、跨系统、跨部门、跨业务”的建设中发挥了重要作用。网络无处不在,数据无处不在,与之相伴而生的数据安全问题也无处不在。在非传统安全威胁与传统安全威胁相互交织、相互影响和相互转化的形势下,加强数据治理,进一步明确数据权属和责任,加快清除政务数据有序流动的体制和机制性障碍,对全面推进我国的数字政府建设具有重要意义。
|