作为数字经济时代的重要构成,数据已经拥有过去的种子、钢铁、服务、技术等作用,作为制造或生产产品,不可或缺的生产资料。
2020年04月,“数据“第一次作为第五大生产要素在《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》正式提出;
2021年3月,《国家十四五”规划纲要》把“加快数字化发展 建设数字中国”单独成篇,成为提出迎接数字时代,激活数据要素潜能等关键性指导;
2021年9月1日《中华人民共和国数据安全法》正式实施,其中重点强调数据“安全与开发利用并重”原则;
解决数据流通瓶颈,促进数据安全并高效发展,已经不仅是各企业、安全厂商意识形态的要求,而是法律明确要求的执行规范。
数据流通帝国
01 数据别“埋藏”,要合理“发光”
数据单独存在的价值,远低于数据安全流通后的价值。
比如车辆里程数,单独看只是个数字,对比二手车的里程要求才会发现跑出去了多少钱;
个人就医,医生对比你用药记录、过敏记录、药物本身的稳定数据,来给你更合适的用药建议;
或者你支付宝绿着的健康码,那也是无数数据交合计算后,给你发出的“通行证”。
“ 我们可以慷慨的释放出 自己的所有数据吗?”------不会
生活中我们常常被反复问候对“理财”“课程”“房子”等等物件的购买欲,这些推销电话,大多是你未曾主动询价过的,那电话对面那位是如何拿到你的信息?
对于敏感信息,个人与企业有一套类似的保护方式,个人会通过“信息包装、关联表达、绑定知情关系”等方式;企业则称之为数据加密、数据标识关联、有效授权等技术应用。以个人隐私数据为例,图中提到的隐私内容,其中“爸妈的结婚纪念日”一旦被获取,再经过几次试错后,这个房门密码其实是可以被反推出来的。
02 “可用不可见”的技术发展
针对数据流通后被反推和滥用的风险,“可用不可见”的隐私计算正是解决这一问题的技术突破口,包括基于密码学原理的多方安全计算,基于AI技术的联邦学习工具、与基于可信硬件的高效计算方案。
(多方安全计算技术框架)
多方安全计算,是较早出现的能够用多种加密技术保障隐私数据不泄漏的情况下,共同参与计算。在既定计算逻辑场景中,可以使用多方安全计算方案来解决“密文计算”问题。
在多次应用之后也会发现多方安全计算方案,以密码学为单一技术基础,会使其应用场景方面有所局限。
(联邦学习技术框架)
联邦学习是基于人工智能,通过各参与方的模型信息交换,来避免明文外流从而增加安全设计,使构建的全局模型既能确保数据安全又能充分利用多方数据计算,是目前解决“可用不可见”使用率较高的方式。通过联邦学习方案可以解决企业数据协同计算过程中的数据安全和隐私保护问题,驱动业务增长。
联邦学习方案的设计原理“数据不动模型动”在应对实际应用中出现的各参与方的模型信息质量参差不齐情况时,应用场景同样会出现局限性,并且计算难度过大也会降低计算质量与效率。
多方安全计算与联邦学习,这两种技术其实阿里云很早就已经实现了,在不断的进行技术改进与融合后,2021年4月,正式发布阿里云隐私增强计算平台。
基于硬件可信执行环境技术,综合使用安全多方计算和联邦学习方案,使得密码学的方案也能得到硬件级的安全防护保障。同时阿里云也实现了虚拟化的可信执行环境技术,使得可信执行环境的应用场景更加丰富。
(阿里云增强计算平台技术架构)
基于芯片提供一个可信、安全的执行空间,把计算应用程序的安全计算过程安全封装在隔离环境中。阿里云还自研了神龙Enclave虚拟化可信执行环境,为代码和数据的机密性与完整性加强保护装置。
阿里云DataTrust隐私增强计算平台有以下特点:
安全等级更高。将硬件层安全虚拟映射到整个目标环境,形成软硬结合体。综合使用可信执行环境、多方安全计算、联邦学习方案,从硬件可信基的角度优化数据交合环境的可信与存储安全问题,使得密码学的方案也能得到硬件级的安全防护保障;
计算效率更快。基于新一代SGX2.0技术实现公共云SaaS化部署,满足TB级以上数据进行复杂计算的处理,高效解决算法逻辑之间加解密困难、数据量过大等问题;
场景方案解决能力更强。基于底层TEE计算方案,并综合MPC、联邦学习能力解决方案,适配性更广;
“ 在更广泛的场景,
可靠、高效的解决流通瓶颈。 ”
03 “隐私增强”计算的N种场景
场景一:联合风控
想象一个场景,A找B借钱,B的疑问是,借钱的风险有多高?
于是B会找CDEF等人商量:各位对于A的看法是什么
对于CDEF而言,他们给出真实的看法的前提是用户的数据不能被泄漏,而又能让A做出正确的判断,于是他们在自己“数据不出域”的情况下给出真实建议。
“ 足不出户,数不出域,
云上安全封装操作,安全性更高 ”
场景二:智慧医疗
疫情防控与临床研究
个人数据的加密后,云上交互出防控筛查模型,得到传染路径与传播源
云上TB级数据,呈分布式在可信环境中,密文式:建模+分析,最终得到关于医疗方式可行性分析等医疗研究成果
“ 融合阿里云数据安全解决方案,
KMS云上一键加密,
海量数据高效计算流转,速度更快 ”
场景三:构建营销模型
把需要交互的标签、特征、梯度等数据,通过可信的传输层,在云上交互
进行密码学处理与封装,基于密文进行计算得到一个营销模型,某视频与某电商可以得到一个,更用户画像更精准的营销数据
“ 大数据时代,营销更精准,
推广手段更强 ”
深圳2020年全国GDP增速第一,直观看深圳主要产业为高新行业,受疫情与全球环境影响较小,深入思考下,这高歌猛进的GDP背后,是一串串流动的数据在无限创造价值。
根据KPMG《隐私计算行业研究报告》预测,接下来几年国内隐私计算市场规模将快速发展,三年后技术服务营收有望触达100-200亿人民币的空间,甚至将撬动千万亿级的数据平台运营收入空间。隐私计算技术行业的市场空间,装载的是数据流通的价值。
阿里云助力企业高分过等保测评
与传统的数据流通方案相比,阿里云隐私增强计算的数据保护标准更有利于满足合规要求。
用户通过购买可信ECS等方式天然开通基础版系统可信,针对国家等级保护2.0规范要求,高分助力用户计算环境通过合规测评。
对于处理个人数据而言,目前我国个人信息处理的合规路径主要是匿名化和授权同意,隐私计算技术可以控制原始数据不出域,满足匿名化“不可识别,不可复原”方案的重要一环。
对于非个人数据而言,只传递梯度等数据的特质也有助于满足《数据安全法》和《网络安全法》等要求的安全保护义务。减轻数据主体的泄漏风险,充分挖掘数据流通价值
**阿里云第七代ESC-让可信成为标配
云上数据应用更安全**
第七代 ECS 实例全量搭载SGX2.0,业界首创 “多层可信验证”与“双效加密计算“防护措施,让可信成为标配,云上数据应用更安全。
极致用云 安全先行