本文作者:姚期智(系中国科学院院士,清华大学交叉信息研究院院长、教授)郁昱(系上海交通大学计算机科学与工程系教授)
数字经济进入数据资源驱动新时代,培育数据要素市场、促进数据交易流通是经济社会创新发展的必然要求。本文结合近日发布的《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》,以数字经济的数据、模型算法与算力三个核心要素为立足点,思考和分析推动数据基础制度落地的核心支撑技术。
数据要素流通交易是价值凸显的动力引擎。数据作为数字经济的关键要素,其流通交易过程,也是数据、模型算法和算力协同发展、持续递进的过程,其核心是“以数据为资源,发挥信息价值”。数据环境是一个广泛开放式环境,并处于频繁流动与共享状态,加剧了跨部门、跨行业的数据流动趋势。数据具有来源广、规模大、结构类型丰富、处理行为多样、拥有权与使用权分离等特点,使数据在开放环境下面临泄露安全风险。
坚持数据开发利用和有效保护两者并重。一方面要合法流通数据、充分发挥数据潜能,另一方面要采取必要安全措施有效保护数据、确保具备保障持续安全状态的能力。近年来,国家陆续出台网络安全法、密码法、数据安全法、个人信息保护法等法律法规,构筑网络与数据安全的基础“合规堡垒”,以数据安全保障数据流通交易和行业数字化发展,将发挥数据要素倍增效应,推动数字经济高质量发展。
数字经济的核心要素包含数据、模型算法、算力等方面。数据正在成为经济关键生产要素,是数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各个环节,深刻改变着生产方式、生活方式和社会治理方式。我们需要研究推进数据确权和分类分级管理,畅通数据交易流动,完善数据合理定价,实现数据要素市场化配置,合理分配数据要素收益。
利用创新技术手段加快培育数据要素市场。在符合个人信息保护法、数据安全法等相关法律法规要求的前提下,利用安全多方计算技术打破“数据孤岛”,实现数据要素在数据安全和隐私保护基础上有序流通。探索开展数据质量标准化体系建设,加快推进数据采集和流通交易接口的标准化,促进数据整合互通和互操作。围绕数字化转型,打造“数据中台”,在数据安全、数据隐私合规的前提下进行全面整合;同时,建设企业间的合作联盟,打造行业级的隐私计算平台,形成企业间的数据要素流通市场。
安全多方计算(MPC)是数据安全流通的关键技术。数字化转型的最大挑战之一是“数据孤岛”问题:对于不同主体,基于数据安全、数据隐私的法律法规要求,不能将数据简单整合;对于同一主体,数据可以通过管理行政命令有限程度整合,但是由于存在部门利益、权限管理、安全管理等障碍也无法依靠简单的管理要求进行完全整合。
零知识证明(ZKP)是数据要素市场监管的有效支撑技术。数据要素市场需要监管与治理,这就需要在数据安全的前提下建设“监管工具”与“监管算法”,确保数据要素流通平台上的业务活动、生产活动在监管的框架下进行,并且可以接受监督与治理。零知识证明的密码技术可有效实现这一目标。政府部门或行业联盟可利用零知识证明技术实现监管与隐私兼顾,在保证数据隐私前提下实现数据要素使用合规性的公开可验证,保障个人数据隐私与企业商业机密,实现“党管数据,央企先行”的目标。
监管与隐私兼顾实现。推进在央企间的数据要素流通市场先行先试,利用零知识证明技术实现监管与数据隐私的兼顾。参考“监管沙盒”在金融行业的成功经验,在数据要素市场的建立过程中,利用高性能的区块链技术实现数据的上链存证和不可篡改,同时结合零知识证明等密码技术兼顾数据的隐私性和数据合规性的可审计和可监管。
技术助力实现数据要素市场化配置。在以安全多方计算、零知识证明、区块链等技术建立的数据流动技术设施的基础上,打造数据要素的流通市场。这些技术可以帮助实现数据确权和分类分级管理,畅通数据交易的流动。在解决了数据安全、隐私保护和数据监管等数据流通问题之后,最重要的就是形成合理的经济分配机制,从而驱动企业内部的部门独立核算、企业间的数据共享,以形成数据要素市场,实现数据要素市场化配置,合理分配数据要素收益。
数字经济时代千千万万的生产活动催生海量智能化模型。近年来,人工智能技术取得了巨大进展,大数据与人工智能的结合使得海量模型的建立成为可能。无论是在纵深的算法研究,还是横向的创新场景层面,人工智能技术都为数字经济拉开了波澜壮阔的巨幕。人工智能模型有着强大的优势,不需要预设的逻辑、不需要专家观点就可以实现建模,并且各类算法工具平台可以支持快速建模。然而,人工智能模型也有不足,主要集中在模型的可解释性、校验方法的可靠度,模型缺陷与局限性等方面。
算法模型治理是人工智能的下一篇章。算法模型的治理,即模型的可解释性、模型的精度与风险、算法公平性等方面。模型治理既是技术,又是制度,成熟的数字化企业会形成完整的模型治理制度。在推广建设人工智能能力的同时,也要推广成熟的模型治理制度建设。目前,包括对抗攻击、因果分析与可解释性分析的研究工作已经给这方面的工作指出了发展方向。在这些方面,我们认为应该进行以下工作内容:一是建立模型治理制度,形成模型价值评估、精度评估、风险与缺陷管理的成熟体系。二是建立模型评测中心,结合各类场景牵头建设数据模型标准,并实践模型评测,赋能行业发展。
模型治理的另一面是算法的合规性。在数字经济时代,越来越多的生产活动需要依靠算法模型开展,算法与业务的深度融合会是未来的趋势,对于业务的合规性要求也会传导到对算法的合规性要求。同时,行业监管也在逐渐建立之中。建议各行业也应建立相应的行业规范与标准,在数据安全法等法律法规框架内,发展测评中心,对算法使用的合规性、公平性进行测试和评估。
建设数字经济离不开算力的支持。算力在数字经济建设过程中的必要性,主要体现在五方面:一是数据模型需要在算力平台上实现;二是在海量数据、海量模型、实时计算的数字化时代,对算力的要求急剧提升;三是建立数据要素流通市场,多方数据共同建模使得对算力的要求更高;四是创新型软硬件体系架构、智能芯片以及未来的量子计算技术对算力都有较大需求;五是从数据要素安全的角度来讲,算法是攻防双方的主要角力点,更高的算力支持,能够有效增加不法分子窃取数据的成本,从而降低安全风险。
布局“优化防守效率”的安全体系。安全对抗本质是敌我双方对资源的消耗战,优化敌我战损比是赢得胜利的关键。从安全技术角度出发,安全多方计算和零知识证明等隐私计算技术,在保障数据隐私和安全性的同时,相比无隐私保护的同类计算在计算效率和通讯复杂度上都有一定程度的牺牲。因此,为了保护数据要素安全,需要综合考虑各类技术的优劣势,优先融合应用“低算力成本、高敌方消耗”的密码技术,采用免改造应用的创新数据保护技术,合理加强“防护算力”投入,以实现更低成本、更高安全的有效数据防护。
坚持关键核心技术自主可控。构建数据基础制度是支持数字经济的前提,核心技术是推动和完善数据基础制度建立的支撑,技术深耕、模型建设、算力提升都是数字经济发展中不可或缺的组成部分。从技术角度,我国要加强安全多方计算、商用密码技术、人工智能等关键核心技术攻关,牵住自主创新这个“牛鼻子”,发挥我国社会主义制度优势、新型举国体制优势、超大规模市场优势,提高数字技术基础研发能力,打赢关键核心技术攻坚战,牢牢掌握发展数字经济的自主权。