贺誉洁｜政府数智化转型背景下数据可信发展的基础研究——基于生成式人工智能嵌入的分析

当前，政府治理已经进入数字治理时代，从数字化走向智慧化是政府治理形态演变过程的必然趋势。智慧政府有革新、智能、融合之意，其不仅能为建设更高水平的法治政府和法治中国提供有力支撑，还能为秩序价值在数字经济市场下的发展保驾护航。数据治理是当前数字政府建设的关键任务，数据不仅是人工智能实现高阶智慧的基础要素，也是推动政府智慧转型的重要引擎。然而，人工智能发展浪潮下的社会存在数据合规风险和数据公共风险，数据杀熟、数据歧视等违背人民理念和社会信任结构的现象需要得到有效解决，为了推动数据的可信发展、提高政府的数字治理能力，应建立一个金字塔式的数据治理方案，在上层实现政府体系全触点创新，中层探索敏捷型人工智能治理模式，下层建立数据合规监管体系，最大化发挥数据赋能政府治理的价值。

一、引言

当前，我国经济发展正在进入以数字化生产力为主要标志的新阶段，推动政府数智化转型已经成为优化国家治理体系和治理能力整体革新的题中之意。2021年，国家发展改革委印发《“十四五”推进国家政务信息化规划》，《规划》指出，到2025年，政务信息化建设总体应迈入融慧治理新阶段，并初步呈现一个“四化”新型数字政府，即在协同、服务、决策、监管四个方面分别实现平台化、在线化、数据化和智能化，为国家治理体系和治理能力适应数字时代奠定基础。在传统产业数字化转型、政务服务数字化融合的大背景下，技术与治理之间的深度互动开始潜移默化改变社会运行模式和治理形态演进，并嵌入到公民个人在社会中的行为规范和体系认知。以数字技术为中心的信息技术已不再具有纯工具性的特点，加之社会时代特征正在从“技术嵌入世界”向“世界嵌入技术”转变，具备跨越物理空间限制优势、自动优化生成内容的智慧型数字技术逐渐成为重塑政府治理体系和治理机制的关键一环。同时技术也带来了国家数据能力等生产异化问题，作为官方最新认定的第五大生产要素，数据具有无限的价值挖掘性，在生成式人工智能逐步改变社会治理架构的背景下，政府数字化、智慧化转型需要依托数据这个关键要素，然而数据还存在泄露、造假、违规等风险危机，为此，如何在人工智能时代下有效融合政府治理和数据治理，成为理论学界的热门讨论话题。同时，数字时代下的政府建设应体现包容性、灵活性和持续发展性的特点，为了促进政府加快公共治理转型，国家或政府应在有效应对数据风险危机的前提下，采取一系列强化数据可信性和可控性发展的措施，实现数据在政府流通利用过程中的共建共享共治，最大化释放数据红利，以期更好地在生成式人工智能到来的时代浪潮下，为政府数智化建设中的数据治理发展提供前瞻性思考。

二、从数字政府到智慧政府

随着区块链、大数据等新兴数字技术的不断迭代和以ChatGPT为代表的通用人工智能的出现，以“技术+应用+治理”为核心特征的数字革命正在加速智慧时代的到来。2023年年初，以AIGC技术为依托、呈现生成替代性和高效便捷性特征的对话型聊天机器人ChatGPT引起社会广泛关注，该应用打破了传统智能机器人在模仿、学习、创造等层面的局限性，能够通过对话形式提炼用户需求，并综合大容量数据集和各种算法模型进行文本、代码、音视频内容的产出，区别于弱人工智能，ChatGPT等新一代人工智能逐渐呈现出智慧性、交互性的特点，是以人类反馈内容为基础，兼具数字型孪生能力、编辑能力和创作能力的强学习应用范式。在数字政府建设过程中，通用人工智能这类智慧型数字技术的嵌入将进一步加深外生技术与政府内在治理间的融合互动，其物理形态和价值形态将随着智慧型技术的迭代更新从低阶的数字化走向高阶的智慧化。换言之，在国家治理体系和治理能力现代化演进中，政府治理从数字化走向智慧化是一个必然过程，二者不存在根本差异，前者只是后者在同一发展阶段和社会背景下的高阶外在形态，是继承与发展的关系。可以说，生成式人工智能的出现给政府治理带来了一条全新的发展路径，为未来的全周期智慧治理阶段提供了诸多可能。

理论层面，智慧政府并非是传统政府和电子政府的替代物，其是由时代特性变化所演变出来的一种新型政府形态，是在“组织-技术-业务”这个基本框架下进行的传承与创新。而整体性治理理论是政府治理理论在信息化时代下得以发展和改革的基础，整体性治理理论结合了内部组织和外部运作两方面，认为政府治理模式应以社会公众需要和公共价值增进为基础，以协调与整合为核心思想，从政务职能、运行方式、组织结构、信息系统四个方面进行优化整合，以推动政府治理从数据化走向数字化、从数字化走向智慧化。随着数字技术的普及和应用，公民可以在足不出户的情况下，将生活需求和公共服务意见清晰直观地呈现在互联网终端，并结合大数据分析技术和大语言模型进行反馈、整合，实现政府治理模式从单向管理到双向互动，提高公民社会参与度的同时保证政府决策质量。同时，数字技术还能打破政府部门间的隐形隔阂，在平等互动理念的贯彻下，智慧型技术的嵌入可以重塑政府治理体制，整合公共数据，实现系统更新和流程简化，以一站式服务平台为例，其不仅可以解决信息碎片化现象，还可以加强政府内部组织的横纵向交流，是整体性治理理论在人工智能时代下驱动政府治理创新的具体体现。

实践层面，智慧政府建设是从单纯的技术辅助发展到基于整体深层次要素进行改革的成熟阶段。数字技术在不同政务场景下的广泛应用将使得线上执法得以实现，而线上线下结合的方式将有效提升政务方面的效益、效能和效率。对于内部的组织结构来说，政务服务大厅、大数据主管部门的不断涌现使得各执法部门逐渐形成了一种网络型沟通体系，区别于传统政府金字塔式的信息传递模式，执法部门内部高频率、多方位、交互式的信息传递将有效形成一种如树枝般纵横交错的网格结构，这种结构将实现权力的去中心化和维护位于触角端的公民群体表达个人意愿的权利，充分保证数字时代政府治理的民主价值理念。对于外部的执法形式来说，具有打破空间距离、节约办公时间等优势的生成式人工智能，其嵌入政府执法领域将使得越来越多的业务实现自动化、智能化处理，不仅能让执法人员从复杂的手工作业中解脱，还能24小时快速应对公民的需求，减少人治色彩在部门决策失灵方面的影响。可见，数字技术快速的迭代更新现状和满足人民生活需求的目标原则将使得政府建设逐渐走向“智慧驱动治理”的革新路径。

数字政府是数字经济全过程发展的引领和驱动，中国政府的数智化发展在经历了信息化、数据化阶段后，正在向数字化和智慧化阶段迈进。在第一阶段，政府主要以政务电子化、信息化建设为主，在第二阶段，政府开始向政务线上化推进，致力于实现数据跨区域、跨层级、跨部门的共享利用，在第三阶段，政务开始延伸至更为广泛的社会应用场景，这一阶段尤其重视人工智能技术在应用层面所体现的深度和广度。而以ChatGPT为代表的AI应用向人们展现了前所未有的深度人机交互能力，正如波斯特洛姆在《超级智能》一书中提到的“超越人类一般智能的机器大脑”的出现将可能颠覆人类整体存在性的认知，与工业时期体现的技术辅助性相比，在经历了以信息型、数据型技术为基础的“量”的堆积后，大数据、区块链等智慧型技术产生了“质”的不同，视数据、算法、算力为三驾马车的人工智能越来越能从容应对社会高速运转下的各类复杂问题，借助该类智能技术，政府对公共资源的支配能力将得到进一步升级和强化，以AIGC技术为核心的人工智能应用在政务场景下将扮演“客服交流官”和“数据运营官”的中介角色。

对外，人工智能技术在政务服务平台中的嵌入将有效提升行政人员与社会大众间的沟通能力和服务能力。相比民众自发组织的涉益类政策咨询，其内容的合法性、权威性和实时性更能得到保障，同时人力财力成本投入方面也不会产生大量上幅，即使提问者在表达过程中使用了非专业性术语，生成式人工智能也能根据自身独有的优势对对话内容进行抽丝剥茧，找出关联性线索，进行智能网络搜索，及时生成特定反馈内容。对内，人工智能技术在组织结构体系中的嵌入将有效提升政府部门自身决策能力和管理能力。在数字时代下想要实现组织机构运行的可持续发展，智慧型数字技术缺一不可，由于数字政府本身也是一个不断迭代优化的过程，对数据的采集、管理和利用是政务数字化、智慧化转型的基础，也是数字政府管理、决策、创新的原材料，而人工智能时代下的数据与技术是一体两面的关系，数据是技术发展的前提，技术是数据安全的保障，数字运营等于数据运营本身，当政府收集的数据越来越多，生成式人工智能对组织管理的优化预测就越来越准确，作出的决策和执行的结果就越来越契合，当宇宙中智能数量每十八个月翻一番的摩尔定律得到验证时，人工智能在自我感知、自动交互、自主学习中的进化程度将创造机器人智能水平的新纪录，届时社会治理结构和治理水平将实现进一步的精准化、高效化。

随着智能化数字环境的形成，以信息、知识和技术为代表的社会资源传播方式发生了明显变化，5G、区块链、大数据、云计算等新一代智能技术与传统政务的融合催化了应用领域从人机合作计算模式走向机器自主计算模式，数据、算法、算力三个要素发挥的重要作用共同推动了政府向数智化转型：非结构化数据运算横向拓宽了政府治理范围、多维度算法逻辑打破了系统线性思维、虚拟空间的运算力中心为智能应用高强度的学习和训练提供了原始地基，三者合一共同实现了公众办理政务从空间的足不出户到时间的随时办理。

在这个层面上可以说技术与政务的融合使得数字政府以更高效的方式完成了信息的分配，利用具有智慧终端的人工智能技术从根本上对政务流程进行优化，不仅减少了传统业务运行过程中出现的重复无效性环节，还能根据公民个人文化情况、经济收入等附加因素对信息进行深度分析，为公众提供个性化服务流程，从而保证各地人民服务体验差异值逐步缩小、政府政务服务的绩效逐步改善。而数据是信息形成的基本单位，数据本身在政务治理中的融合程度便决定了信息资源在政府与市场间的分配比例，政务数据价值的激活会促进数据融合度的提升，数据融合度越高，信息分配渠道越权威精准，市场获取的信息成本便越低。此外，数据和政务的融合、技术和政务的融合也推进了外部主体协作共治的新治理局面，基于数据研发的智慧型技术实现了政务应用运行过程的透明化和公开化，个人、企业、政府在流动网络架构上被连接了起来，政府、市场与社会之间形成一个紧密闭环，市场下的多元诉求能够更加及时地被数字技术捕获，政务决策能够更宽领域、更长时段的被数字技术分析，社会发展趋势及潜在风险能够更加准确的被数字技术研判，政务服务得到“质量+数量”的双重提升，即政府治理与数字技术、数据要素的融合并不是简单的叠加堆积，而是政府治理演进形态再定义的重要一环。

面对数字时代浪潮，以数字政府建设助力国家治理体系和治理水平现代化发展已成为共识，而智慧型技术作为构建数字化、智慧化政府运行形态的一部分，其实施不仅是推动政府治理体系和治理能力在数智化转型过程中的着力点和突破口，还是对法治政府建设在优化监督形式、公开方式等方面的重要动力。作为国家治理体系中的核心子系统，政府治理建设迎来了“科技+法律+行政”纵深融合的新阶段。一方面，算法模型可以通过庞大的数据池和强大的算力使具体行政行为在满足比例原则要求的同时达到实际结果偏差值的缩小，进而实现行政行为作出精准化、监督实时化和效益最大化，以执法为例，嵌入数字技术的数据平台可以实现及时分析并告知工作人员任何违法现象或线索的特点，基于此进行后续的案件查明将大大节省执法人员的办案精力，同时社会公众也可以根据平台公开的执法记录对相关人员是否公正合规办案进行监督。另一方面，算法模型在迭代更新中也需要坚持公平正义的价值引领，在万物皆可互联的环境下，算法操纵、数据泄露等现象层出不穷，公民的合法权益已经受到严重且无形的威胁，为了驱动政府、社会、市场三方在国家治理全过程中实现善治，禁止逾越法律底线是保障。因此，在政府治理领域下的法治赋能与数字赋能是相辅相成、互相补充的关系，作为全面依法治国主体工程的法治政府建设，在以ChatGPT为代表的智慧型人工智能到来下，融合治理便是重点突破口，数字法治政府建设是融合了法治元素和数字元素的政府建设，推动数字法治政府建设不仅是国家建设在社会发展趋势变化下的内在要求，更是重塑国际竞争优势、抢占国际话语权的战略选择。

法并非是建立在各种价值的平行叠加上，相反，价值本身就是一个具有层次性和位阶性的体系，社会秩序的稳定来源于国家对法的安定性的保障，而法的安定性是正义价值在社会实践中的一种表现形式，正义对社会治理的一般性要求也是法的安定性对社会治理的内在要求，法律作为调整社会市场规范的主要手段，稳定的秩序便是这一范围内最重要且最需要维持的基本价值，而政府作为人民的代表，其基本职能便是发挥行政力量来稳定社会、市场以及政府内部的秩序，随着社会经济发展趋势逐渐向数字化、智慧化特征靠拢，数字贸易市场的建设以及数据要素市场的培育对政府转型建设提出了新的演进方向，即数智化转型。

这个过程中的政府将对秩序行政带来三方面的优势：首先，智慧政府建设可以更好地保护数据要素在经济交易市场的安全，避免市场失灵现象发生。随着网络技术的发展，人们逐渐依赖上电子支付、人脸识别、网上购物这类看似便捷但暗藏危险的生活方式，这些通过日常行为收集到的各类数据将被不定时的回收至以数字产业谋生的公司，这些公司背后的资本家将采用人工智能技术对用户个人的数据进行深入分析，以针对性预测用户的日常行为习惯，并试图去改变甚至操控用户的选择，最终实现公司暴利和行业垄断的目的。而智慧政府建设下的数据安全保护机制和监管体系可以及时挖掘并阻断经济市场中的非法交易行为，有效保护个人数据、企业数据和公共数据在交易市场中所具有的价值。其次，智慧政府建设可以更好维护公民在数字时代的人权。重大的技术变迁将会带来社会和市场的范式转换，但面对市场中大量数据泄露引发的侵权风险，主体个人的合法权益不仅需要权利束来进行事后救济，还需要借助政府的大规模控制能力进行事前保护，有了公权力的保护，市场交易下的个人数据便可以免于被企业权力所控制和支配，公民在市场交易秩序中的安全感进一步增强。最后，智慧政府建设可以更好干预和整治数字类不正当竞争行为，快速回应市场监管需求。政府作为公共数据的管理者，能够利用数据共建共享的特点，结合国家机关的权威力和公信力，快速推进市场商业主体间的业务协同和信息共享，同时借助政务服务平台规范电子印章、营业执照等办事流程标准化、统一化，利用通信技术、大数据分析技术对市场进行主动预测和时刻监管，促进数字营商环境科学化、有序化。

《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》提出，要加快数字经济、数字社会、数字政府的建设。在信息量和数据量的积累下，我国数字政府建设实现了质性转变，成为拉动数字中国建设的航向标和动力源。随着数字市场规模的高速增长和基础设施的逐步完善，我国各地政府陆续发布有关数字转型或数字建设的战略规划文件，政府治理已进入深化智慧型政务应用的新阶段。作为新一代技术革命的代表，生成式人工智能不仅具有目的通用性，还具有自主创新性，是当前新兴领域最具颠覆性的一项数字技术，基于此形成的智能设备和智慧化应用场景将给政府业务的转型带来重大影响。以广东、上海、浙江、江苏四个城市的政府建设为例：广东省坚持均衡协同的发展理念，以数据为重点治理对象，采取“制度+技术”双重创新的形式建立政务服务数据管理局，同时拓宽政务服务至全领域，深化“路台通办、路径通办”和省域治理“一网统管”，保障政府业务运行水平的同时强化数据安全防护；上海市以智慧城市建设为契机，将智慧执法建设列为重点关注对象，发布以统一规范非现场执法行为为目的的《上海市城管执法部门非现场执法工作规定（试行）》，明确了电子证据采集标准应以清晰、准确反映各类客观构成要素为主。此外，上海市在法治轨道上全面推进数字化平台建设，不仅定期完成“一网通”的迭代更新，还初步建立立体化、智能化的社会治安防控体系，以期实现线索互联、标准互通、结果互认的执法局面；浙江省采用“政府牵引+社会参与”的模式，以数据资源共享和云网设施建设为出发点，从经济调节、市场监管、社会治理、公共服务、生态环境、政府运行六个方面入手，已经形成“浙警智治”等一批典型代表成果；为了解决“管理分散、决策失误、联动困难、价值受限”等难题，江苏省在强大技术的支撑下建立了全国首个集“决策科学化、治理精准化、服务高效化”于一体的市域治理现代化指挥中心，该平台不仅利用人工智能等AI技术对数据价值进行深挖，为决策环节进行辅助研判、为执法环节进行远程调控，还形成了联动指挥体系，成功汇聚全省数十亿量级的数据，实现城市统一感知。除了上述四个城市之外，还有注重打造“局+产业中心+集团”三位一体数据发展格局的贵州省、“无事不扰+无处不在”的一体化综合监管体系的北京市、电子证照全覆盖的河北省以及加快实现基层“一支队伍管执法”的江西省。可见，人工智能应用爆发式的发展态势能够解放行政人员尤其是执法人员在常规程序事务方面的重复性工作，进而投入更多精力去解决更复杂的社会公共性问题，为我国政府治理现代化提供了更广阔的进步空间，同时人工智能技术所呈现的头雁效应将为我国数字政府建设创造一个相互强化、相互促进的良性循环应用生态。

作为实现国家治理体系和治理能力现代化的一个重要环节，政府治理建设逐渐开始重视与生成式人工智能本土系统的相互融合，而数字政府建设是一个浩大工程，其覆盖面包括政务智慧化、数字化建设。公民参与度是政务运行过程中的首要目标，而生成式人工智能具有语言学习能力和挖掘分析能力，其嵌入政务服务将为政府和公民之间开辟一条高效互动的渠道。一方面，人工智能可以通过生物识别技术和沟通技术帮助公众完成业务受理、线上信息填报、身份认证等基础性工作。另一方面，公众可以在以算法模型为底层运行逻辑的政务平台上进行信息查询、业务跟踪等监督性工作。政府具有知识属性，是聚合有关管理公共事物知识和智慧的集合体，ChatGPT的出现让人们意识到强人工智能时代已经到来，所谓强人工智能，就是指能够像人一样迅速适应外界环境、主动学习新兴知识，最终实现自我进化、自我修复、自我完善的智能体，这种智能体将网络知识和人的智慧进行了深度融合，其学习训练的运行过程主要依靠一组多功能函数，通过这组函数，人工智能能够源源不断的输入数据和反馈数据，同时，生成的数字内容也能够无限储存、再现和复刻。也就是说，在人工智能的整合梳理下，政务服务单个的隐性知识将可以被串联为可共享的显性知识，政务应用将内含一个具有快速信息传递与高质量反馈的智慧体系。因此，人工智能技术的发展将进一步推进政府治理与信息智慧的结合，通过模仿人类交流方式和大脑思考方式，嵌入政务服务的人工智能将使政府属性从知识性转变为智慧性。

数据不仅是人工智能实现人的智慧化的基础要素，也是推动政务智慧转型的新引擎，更是建设数字中国的生命线。2023年3月，加快推进政府数字化建设的机构改革方案——组建国家数据局被提出，数据局的组建将解决部门管理分散重复问题，实现国家层面的数据资源整合和利用。2022年10月，国务院发布《全国一体化政务大数据体系建设指南》，《指南》指出，要推进政务数据共建共享共治，构建全国一体化政务大数据体系。当前，我国广东、吉林、浙江等部分省市建立了以数字政府建设为引领、以电子政务优化为侧重点的数据管理局，超八成以上的数据资源掌握在政府手里，这些数据资源不仅能够调节数字经济运行，还能提升政务服务水平。究其原因，是以数据为基础的技术发展助推了政务运行从无纸化、在线化到信息化、智慧化，互联网时代为政务服务提供的便利便是实现公民随时查看、随时回看国家大事和政府信息，而数字时代为政务服务提供的便利是通过智慧型技术建立了政府与公民、政府与市场、政府与社会的互动纽带关系，这种互动产生的个性化服务大幅度提升了公民的参与感，体现了民主理念，可以说数据对政务的赋能使得公民可以更加深入地参与政府数字治理过程中。此外，政务平台治理的优化将实现就近办、同城办甚至异地办，而优化的第一步便是提升人工智能对内容价值的挖掘能力，因此高度数字化的政务型人工智能需要大量训练数据来模拟人与人沟通互动的情景，即人工智能嵌入政务应用场景后需要依靠大量数据来进行关联、计算和共享，以提取公民有效信息、改善数字核心技术、感知公民服务需求、预测公民体验反馈，及时对社会各领域出现的突发动态进行回应和判断，实现“理智人”思考和反应，推动政务升级为个性化、主动化、智慧化的模式。同时，数据是政府降低市场风险和社会风险的治理原料，真实客观的数据将带来系统全面的反馈结果。一方面，数据能被提取的价值越大，人工智能迭代更新的速度越快，信息的流动将不再局限于商事主体中，生成内容传播的精确性和快速性将使得任何角落的公民都能成为信息的生产者、传播者和交易者。另一方面，人工智能基于数据与数据碰撞出的数字化反馈将更直观清晰，政府可以通过该呈现内容对社会及市场的短期态势和长期趋势进行修正，及时对一些严重问题进行遏制，从而使社会公共治理和市场经济运行达到正向的预期效果。

在人工智能快速发展的时代，数据信任危机正在悄然发生，所谓数据信任危机就是指在数据采集流通和开发利用过程中产生的误用数据、误识数据、误判数据等一系列安全失控问题，体现在现实社会便是数据泄露、数据滥用、数据违规、数据作假等不良现象。数据具有的非竞争性和非排他性特点符合了经济领域对于“公共品”特征的定义，作为天然的公共品，数据的共建共享是互联网平台在数字时代赖以生存的基础法则，其流动性的特点使得数据危机将始终伴随人工智能存在，而数据又是提升政务水平和经济运行的基础，如果无法全面保障数据的完整性、安全性和真实性，政府治理将可能面临数据暴政、数据杀熟、数据歧视等违背人民理念和社会信任结构的糟糕局面。政府具有权威性和专业性，其对数据治理的介入将能够化解数据信任危机，如何确保政府在数智化转型过程中能够及时将数据流通共享的风险置于可控范围内，重点便是要知道数据合规风险和数据公共风险给当前数字政府可信建设带来的影响是什么。

以ChatGPT为代表，生成式人工智能现阶段的作用机制可以大致分为“喂养训练、运行生成”两个阶段，每个阶段都有数据的身影，每个阶段也都基于数据产生了不同的法律合规风险。在喂养训练阶段，数据会产生来源合规风险。生成式人工智能只有在准备阶段就设定好训练数据的利用规则及保护形式，才能在之后的学习优化阶段实现精准提取信息和准确预测趋势的效果，然而生成式人工智能在数据合法收集上存在边界模糊化的问题，其在初期形成阶段所需要的数据大部分是通过其他网络渠道（如政务平台、互联网公司、应用软件等）获取的，这些渠道可能包含个人数据，可能包含公共数据，还可能包含企业数据。不同的数据类型将产生不同的风险：对于个人数据来说，考虑到部分数据本身会涉及高敏感性和个人隐私性，获取需要取得数据主体的同意，而想要在市场领域做到每个用户对每家使用过的数字公司都做到知情同意，几乎是不可能完成的，这就导致有些营利性公司会以一己私欲，在未取得甚至违背数据主体意愿的情况下，对相关未经脱敏处理的数据进行非法售卖；对于公共数据来说，人工智能在使用数据过程中是否满足“合理范围”以及“是否会对已公开个人信息背后的个人权益有重大影响”仍存在不确定性，由于生成式人工智能无法做到实际承诺，一旦算法模型对公共数据的提取范围过大，将导致额外的公共数据兼具个人数据特点，合规隐患无疑会增大；对于企业数据来说，生成式人工智能的自动爬虫行为可能会对市场企业良性竞争造成影响，投入了人类智力劳动成果而形成的网络数据产品也被视为受保护的财产性权益，若人工智能在禁止实施爬虫行为的网站上进行了多次数据抓取，其自行获取的手段很有可能被当作企业间形成不正当竞争的信号。同时在人机交互情况下产生的数据可能被二次输入进人工智能的训练库，这些交互数据仍然会涉及用户甚至企业的知情同意。

在运行生成阶段，数据会产生使用合规风险。虽然相关技术公司在制定应用隐私政策时规定了用户可以随时对平台个人信息进行修正、查阅甚至删除，但生成式人工智能的删除机制比一般弱人工智能复杂，因为生成式人工智能具有一定的智慧性，自身会结合人类指令和最佳优化策略进行判断，这就导致数据领域发生“长尾效应”，即生成式人工智能数据池中应该被忽略的个性数据超过了共性数据，在神经网络式计算的模型操作下，大量已经被网络世界遗忘的隐蔽数据在不停累积下进行了二次挖掘和使用，个人在网络上的隐私保护逐渐透明化。加之个人数据、个人信息、个人隐私之间是同一价值在符号层、内容层、事实层上逐步体现的递进关系，从抽象到具体，三者都与个人日常生活具有紧密联系，所以对于在合规前提下能否真正满足用户删除要求、抹灭相关数据的存在痕迹是困难的。同时，由于前期数据是从其他渠道投入的，数据的准确性无法得到保障，一旦初始数据存在误导性，算法模型在生成过程中可能会受到不同价值观和思维模式的影响，甚至利用迎合外方立场或喜好的错误意识形态来歪曲或者误导某些客观事实，部分犯罪团伙甚至会抓住这个机会实施诈骗、造谣、诽谤等违法行为，不仅严重影响执法机关的办案投入成本，还会引诱人们尤其是青少年建立错误的价值观，进而导致网络背景下的社会矫正工作加大难度，政府公众之间的信任安全度和人工智能应用的可靠可控度在数字鸿沟影响下大幅度降低。

一方面，政务应用平台存在根据技术系统产生的泄露凝固风险。数据是数字政府建设不可缺少的一类战略性行政资源，在社会治理过程中各个地区的政府都需要收集大量的公民信息，这些信息通常以图文或音视频的抽象形式进行储存，基于数字技术水平、管理人员错误操作、应用平台超期维护等因素的影响，数据资源易受到网络攻击，若储存系统的防火墙达不到阻断黑客攻击的作用，数据资源将面临被窃取、篡改的风险，区别于物理空间上的窃取、篡改风险，互联网具有快速扩散和无限复制的特点，任何积极或负面的影响都会在各个领域、各个群体间产生多米诺骨牌效应。而对于数字政府建设来说，嵌入人工智能的政务服务基础建设可能因为丢失数据引发预测失误、输出混乱、技术卡壳，同时，人工智能通过自主提取、整合分析、学习训练等一系列技术获取的公民个人隐私数据将被充分暴露在黑客视野中，加之对于新兴领域维权意识的迟钝是中国人民思维习惯中的一部分，个人几乎没有能力克服数据安全控制过程中的重重障碍，基于技术掌握形成的不平等关系将加剧这种无奈，隐形的技术暴力将导致社会不平等关系的固化。就像布尔迪厄对公共空间战场般的形容，统治者和被统治者将一直为改变或维持这种社会结构而斗争，在数字时代下，掌握数字技术的研发群体便成为统治者，其他人便成为被统治者，作为人类，研发群体具有独立且不同的价值观，当这些个人思想偏好被长期放进人工智能技术体系中，应用的运行可能偏离以人为本的理念，生成内容的客观可信度将被质疑，数据对公民人身安全和财产安全带来的损失在个人层面上更无法得到解决，因此政府政务运营对数据安全的防控不仅需要从整体技术视角出发，还需要从公民个人权益视角出发，复杂程度不可言喻。一旦对数据泄露风险的化解不及时，政府公信力将产生大面积丧失，社会本身存在的信任链条将更加脆弱，国家在数字化建设过程中的繁荣力和竞争力进一步减弱。

另一方面，算法模型存在根据忽略数据管控产生的整体网络风险。算法和数据是生成式人工智能三大要素的其中两项，而算法模型的迭代先进度需要海量数据，低质量数据池将拉低算法模型的优化进度，延宕生成式人工智能的发展，实践中，数据的体量和质量是支撑人机对话、智慧医疗、电子政务等智能领域的基本生产资料，数据的体量越大、质量越好，算法模型的优化效果就越好，人工智能嵌入的程度就越深。通过促进多方社会主体应用政务服务以收集数据提升政府治理水平和治理能力是政府利用开发数据资源、实现数据价值的最高目标，然而开发者在技术研发过程中只注意到了算法模型的可行性和实操性，忽略了抓取数据在研发过程中的客观性和真实性，由于数据获取路径不同，虽然部分数据是来自网络用户的虚假投喂，但人工智能设定的算法模型自身在最初成长阶段并不具备完全辨别是非的能力，即使是虚假数据也有可能被视为训练数据纳入优化算法类的数据库，因此在生成式人工智能的开发阶段需要人为对数据集进行标注，标注阶段涵盖了数据管控环节，若工作人员只注重模型的开发程度，对数据管控有所疏忽，那将导致AI生成内容失实、偏差、错误等隐形危险出现，加之数据在网络传递过程中具有感染性和标记性的特点，若此类数据通过政务运行体系进行流转和共享，一旦工作人员打开了数据开发接口，数据虚假风险将通过各类接入接口或介质传导至政府各行各业的服务场景下，网络生态圈的良好氛围将首先被这些毫无正向价值的生成内容破坏，同时个人提供的初始数据将因为生成内容迷惑性的影响而被掩盖，一些虚假结论产生的社会影响甚至会反噬到用户自己身上，侧面促进数字网络暴力的发生，整个公共治理在现实社会与虚拟网络双层空间下将面临不实数据无限向外扩散的整体数字危险。

四、推动数据可信发展的三大策略

立法上要聚焦数字执法领域。数字政府不仅要夯实数字基础设施建设和大数据资源整合，还要配备相关规范性文件予以约束，《法治政府建设实施纲要（2021-2025年）》着重强调要深入推进“互联网+”监管执法，探索非现场式的远程监管、移动监管，并结合大数据、人工智能等数字新兴技术作出处罚行为。法治是保障国家稳定发展的基本要素，数字时代的到来为执法领域开辟了一条自动化路径——非现场执法，技术赋能执法打破了时空限制，自动识别技术、大数据分析技术等前端数字设备将实时记录和传输数据至后端的执法平台，弥补了过去执法人员在调查取证环节可能出现的人为错误。值得注意的是，目前执法领域仍处于半自动化阶段，人工智能技术主要还是以辅助性的目的嵌入执法设备，不能做到完全替代执法人员。因此，如何确保人工智能技术规范应用于非现场执法领域？执法部门提供的数据是否真实准确？非现场执法适用范围如何界定？人工智能获取的数据证明规则是否参照以往的证明力和证明标准？这些问题都需要地方立法机关予以回应。非现场执法具有特殊性，未来生成式人工智能还将继续迭代更新，非现场执法的适用范围将从交通领域逐渐向环境、航道等其他领域扩散，政府部门应事先做好立法规范，坚持贯彻行政法治原则，实现技术的可控透明，例如根据不同应用场景单独制定相应的《非现场执法管理规定/办法》，从适用范围、执法原则、处理程序、证据采集、数据安全、告知送达、法律责任等内容出发，确保非现场执法获取的数据如实通过网络传递，增加人工审核证据环节，保障数据的真实性，避免因技术至上观念导致的相对人权益减损，坚持将智慧型技术融入执法全过程，使嵌入的人工智能同时兼具语义明确性和个案同质性成为可能，实现执法全要素数字化、全场景规范化、全环节简易化、全程序透明化，同时加快建设智慧政府，提高执法效率，为执法办案人员减负的同时做到便民利民。队伍上要培养数字治理思维，人才是政府数字化、智慧化建设的核心推动力，数字治理思维的形成将有助于公务人员在人工智能嵌入政务的背景下同步提升行政水平。想要实现政府建设可持续发展，首先便是要将数字思维、数字技能和数字素养纳入青年骨干的定期培训内容中，建立一支具备专业数字知识的人才队伍，各地区政府可以建立数字培训学院，为行政人员和执法人员提供练好“管理数据、分析数据、运用数据”的基本功，同时聘请相关数据专家充当“宰相”角色，在人工智能系统试运行、维护、关闭等阶段进行实践参与和指导，制定阶段性激励机制，将人员考核形式从理论层面转为实操层面，在具体应用服务场景下探索数字人才的发展方向，建立政府、社会、市场间的人才资源共享流动机制，创造助力政府数智化转型的人力资源环境。其次，要针对技术人员和安全人员进行心理测试、道德评估、行为观察等辅助干预训练，避免相关核心人员给政府治理带来人为的数据危机，同时也为数据人工标注阶段的安全可靠护航。最后，要通过普及相关法律知识和伦理知识对政务人员进行价值引导，使其牢记价值中立和人民至上原则，避免技术中心主义的渗透，强化政府人员适应数智化转型的韧性和灵活性。

平台上要协同共享共治，信息时代下的数据保存和搜集具有割裂性、固化性的特点，政务人员通常需要进行二次手动关联才能将分散状态下的数据拼接起来，可以说这个阶段数据与数据之间是无法自动进行互通的，其在政府治理方面的价值被锁住了。而生成式人工智能可以利用海量数据和大型语言训练模型进行无止境的迭代，数据与数据之间的分布将从平面线状向立体散射状转变，数据要素得到前所未有的重视，为了充分发挥数据赋能治理的潜在价值，政府部门应依托一体化一站式政务平台实现数据无障碍共治共享，将政府、社会、市场三方的数据资源加以整合，在确保数据完整性的基础上实现整体内容预测、研判的精准性，进一步提升国家治理效能。除了一体化一站式政务平台，还可以结合区块链技术和人工智能技术，搭建一个横向跨部门、纵向跨区域的数据指挥中心，组建专门的数据管理部门或首席数据官进行统一规范地调整、调度，保证每一个数据的更新、替代、消灭都能同步至整个中心网络，同时设定同一层级部门在信任通道下的平等交换模式，对已获取的数据进行定期处理和更新，以保证在汇聚省市县乡所有数据的前提下，打通治理封闭性，实现不同层级数据库间的合并同类项，缓解政府治理和职能分配的双重压力，提高政府多部门同步应对社会突发事件的能力。

体系上要建立科学合理的安全机制，可以从动静两态着手。静态方面，根据数据不同的应用价值在公共数据、个人数据、企业数据的大分类框架下抽象出具有普适性的几类安全风险域，再结合数据的全生命周期得出多个具体的风险场景，并以“低、中、高”来划分风险等级，给予不同的保护力度。动态方面，结合政务服务因地制宜的特性对数据实施分级开放，统一地方政务数据开放的标准，制定地方服务治理的开放目录和清单，对于含弱敏感性的公共数据要尽可能全部开放，对于含高敏感性的公共数据要在综合评估应用场景、技术成熟度、社会民意等因素后再向上级管理数据的部门进行申请开放，同时划清数据资源使用方和管理方的法律责任边界，保证数据安全体系落到实处。

“敏捷”一词产生于经济市场下的制造业，是指企业形成的通过自我灵活调整以应对市场突发状况的能力。而敏捷性治理是一种以灵活性、包容性和可持续性为发展目标，以民主理念为原则的一套弹性决策手段。生成式人工智能符合克利斯坦森教授所主张的破坏性创新理论，“破坏性创新”指的是新兴技术通过对现有技术的冲击或替代，而重新得到新的价值属性的过程。由于我国目前数字技术发展的速度和人工智能应用治理模式间存在不同步的情况，传统的治理模式在数字时代下具有滞后性，以ChatGPT为代表的人工智能带来了破坏性创新，倒逼智能机器治理模式转型，为了有效避免数据等基本要素带来的风险危机，应探索人工智能在治理原则和数据管控上的敏捷性发展，提高数字新兴科技在我国政府建设过程中的治理价值。一方面，坚持包容审慎的治理原则。包容治理并不是一种无原则的混乱状态，相反，是一种在规范治理前提下体现包容性特征的融合治理。人工智能治理模式下的“包容”具有容纳、宽容的意思，即只要不触碰数据安全底线，国家就可以对那些新型人工智能技术和数字企业采取鼓励、支持、合作的积极态度。人工智能治理模式下的“审慎”具有谨慎、慎重的意思，即在新型业态的初期发展阶段，国家应设定一个发展观察期，一旦发现有非法售卖数据、侵犯公民合法权益等行为时再立即进行制止，切断风险的进一步扩大。由于智慧型技术提供了互联网产业的新形态，以数据为支撑的生成式人工智能给传统搜索引擎带来了冲击和挑战，虽然人工智能应用在经济市场下的份额占比越来越大，社会整体福利却一直在提升，因此治理社会的法律手段也需要贯彻包容审慎原则，法律在数字市场下应扮演一种谦抑性和鼓励性并存的“引路人”角色，确保人工智能在法治轨道上完成无限迭代更新。同时，包容审慎原则也需要体现在具体环节中，研发公司应在生成式人工智能的学习训练阶段提供一个安全独立的数据测试环境，确保算法模型的可靠性和生成内容的准确性，避免数据危机产生。

另一方面，实施数据管控的“软法”治理。由于数据具有可复制性、可交易性的属性，一旦投入经济市场便会发生信息不对称的局面，因为数据的利用涉及算法技术的支持和研发人员的维护，对于缺乏专业知识和操作经验的个人来说，其势必会在交易环节处于劣势，更为严重者将失去对个人数据的支配和控制。因此，为了及时弥补法律法规在事后救济上的滞后，政府部门应辅助市场主体建立人工智能应用全过程的软法管控机制。在研发训练阶段，政府应要求人工智能应用的生产商或销售商建立一个数据风险评估机制，定期申请相关的政府技术人员对AI应用进行审查并出具阶段性的专业安全认证证明，同时对认证结果进行全网公示和说明。在运行收集阶段，政府应提供专业技术人员进行二次敏感辅助判断，生成式人工智能应用可以设定扫描确认功能，对每一个在具体人机交互场景下获取的数据进行初步敏感程度判断，如果判断结果为敏感，应自动上传给技术人员进行二次判断，最终结果为敏感的数据应停止使用，同时人工智能应用应主动发送消息给数据主体，确保取得明示同意后才能够继续使用。在生成反馈阶段，政府应提供有效的申诉渠道，生成式人工智能存在基于数据滥用、造假引发的个人权益损害风险，针对这部分风险，政府应提供一个合理正当的事后救济途径，因此有制定相应申诉机制的必要，确保数据提供方和数据使用方受到应有的约束和惩罚。此外，政府还可以运用监管沙盒方式对数据进行治理。“监管沙盒”是政府金融部门为了促进经济创新和科技发展相互融合，许可部分机构或企业对金融领域出现的新产品、新模式等进行模拟测试，以降低项目监管要求、放宽项目限制的一种新型方案。通过构建数据监管沙盒，可以更好地为生成式人工智能应用创造一个安全、真实的训练测试环境，在最低投入成本下对数据风险进行观察和预防，进而缓解数字市场下的不平等问题，最大限度化解技术发展和数据安全二者之间的张力。

在个人层面，应根据生成式人工智能对数据收集利用的最低比例原则进行合规监管体系的构建，一方面要利用数字技术手段对个人数据价值进行深层次的挖掘，另一方面要根据个人数据资产属性所体现的利益为技术在整个数据处理阶段的合规予以价值佐证。如法律上对个人信息保护义务的规定促使互联网类型的公司应单独设立一个数据合规监管机构，当人工智能使用了敏感边界模糊的个人数据时，机构应立即对研发部门予以提醒，防止数据收集标准模糊化。同时在满足运行必要性和完整性的前提下，监管机构应着重审查最低比例原则在生成式人工智能运行过程中的贯彻程度，比例原则有合目的性、适当性和损害最小化的三大递进要求，对于个人数据价值的提取应以围绕实现用户需求为中心向外适当扩散，尽量保证个人数据权益受到政府部门或企业公司的损害处于最低点，一旦发现违规利用，应立即采取停用手段进行消除，避免生成内容造成个人隐私、个人信息、个人数据暴露。

周芷妍｜数字时代法官预判确定性与认知偏差控制

朱舒予｜我国短视频平台版权治理义务体系之重构

目录｜《新兴权利》集刊2024年第1卷

王镕洪｜生成式人工智能背景下个人信息保护的困境与破解

徐宇翔｜生成式人工智能发展背景下的金融消费者个人信息保护问题研究

杨顺｜ChatGPT等生成式人工智能对学术诚信的挑战及应对

上海市法学会官网

http://www.sls.org.cn

贺誉洁｜政府数智化转型背景下数据可信发展的基础研究——基于生成式人工智能嵌入的分析