一、数据要素化要解决的两大问题
数据联合计算(可选):主要场景是多家数据源融合计算,将计算结果授权给客户使用;
数据可控流通(必选):数据是已经加工好的成品,可以直接流通;
二、从数据内循环到外循环
2.1 内循环
数据持有方在自己的运维安全域内对自己的数据使用和安全拥有全责,主要防止对象是外部黑客和内鬼。
对于外部黑客,主要用的是传统的网络安全手段;
对于内鬼,主要用数据加密、角色分离、保密协议等技术+管理的组合手段;
内循环,整体上还是一个可信可控的环境,较容易解决。
2.2 外循环
数据要素在离开持有方安全域后,持有方依然拥有管控需求和责任,主要防止对象除了外部客户和内鬼,还有合作主体对于数据的不合理使用。
这里关键的有两点:
- 数据是否进行了物理拷贝?如果数据拷贝到对方环境,如何保证只用在特定场景?如何保证控制权不丧失?
- 数据的结果是否泄漏了额外的信息?这是合理输出的通道,要尽可能最小化输出有价值的信息。
三、解决之道
3.1 身份可确认
这是防君子的手段,通过合约等约定数据的使用范围和方式。
如果是平台,可以给客户颁发数据证书(CA密钥基础设施)。
作为数据要素化的平台方,一般要是国有企业,身份可信必不可少。
3.2 利益可依赖
对于大的数据源,可以通过入股的平台方,实现利益一致。
在数据流转的利益分配中,让合作主体合作共赢。
3.2 能力有预期
数据要素化平台是比较负责的,核心技术包括了云平台、隐私计算、数据空间等技术,需要有强大的技术方案提供方,平台企业也需要配备足够能力的技术团队。
云平台:提供资源的弹性分配;
隐私计算:明文不出库,密文传输和计算;
数据空间:数据控制权不转移,通过各种策略控制数据的使用;
3.3 行为有后果
所有的行为都记录日志,并上传到第三方的区块链平台,接受监督。