企业数字化转型进入深水区,数据量呈现指数级增长,在云端落地的数据种类也越发复杂多样,安全管理难度大大增加。
2020年全球范围的重大数据泄漏事件中,单起事件造成的平均损失预估为2500万人民币,约为2019年的两倍。
——IBM《2020年数据泄露成本报告》
为了帮助客户更好的应对不断加剧的数据安全挑战,2021年1月28日,阿里云整合敏感数据保护(SDDP)等产品,全面升级数据安全防护能力,正式发布数据安全中心,为客户提供全域一体化的云上数据安全防护服务。
数据安全中心参考了Gartner提出的“以数据为中心的审计与防护”概念,通过统一的管理平台,为企业提供从非结构化、半结构化到结构化数据的云上全域数据安全治理能力,基于数据的生命周期做好全链路管控,让客户通过一个平台就能管好企业所有数据,防止重要数据泄露等安全事件的发生。
针对客户需求,全新升级后的数据安全中心具备三大核心能力:
1. 元数据视角更加精准的自动识别与分类分级
数据识别与分类分级是企业开展数据治理工作的核心之一,但在这个过程中,经常会发生业务元数据与安全元数据割裂的情况,导致数据分类分级不准确,数据治理难度增加。
什么是元数据?
是描述数据的数据(Data About Data),记录着数据的基本属性,比如数据的存储位置、与其相关的数据信息等,是一种电子式目录,从而实现协助数据检索的目的。
阿里云数据安全中心通过提供接口的方式,从元数据视角打通各类数据,赋能客户以更全局、更精准的视角,审视自身业务数据中存在的安全隐患,并针对性的落地防泄漏措施。
客户基于产品能力可统计获得的资产地图示意
本次升级亮点
- 完成云上常见数据源的全面覆盖,实现一站式云上数据资产盘点;
- 自动识别能力支持对隐私图片、文本与压缩文件中的个人与金融信息、企业关键数据表、云AK及基于OCR的图片敏感信息识别等各种类型;
- 自动分类分级支持定制化改造,从而快速锁定保护对象。
2. 面向不同场景自适应的数据脱敏防护
《个人信息保护法》草案中对数据匿名化和去标识化提出了明确要求,但在落地过程中,由于应用开发与数据使用场景的复杂多样,通常很难形成标准化的脱敏防护体系。
阿里云数据安全中心通过多年的内部沉淀,为广大云上开发者提供了近30种数据匿名化和去标识化算法,无论是应用开发人员,还是数据安全管理者,都可以根据实际业务场景灵活选择,自定义参数,做到个性化数据脱敏。
数据脱敏防护示例
本次升级亮点
数据安全中心提供了自定义脱敏模板能力,真正做到安全自适应。
企业应用开发人员可以通过自定义算法模板,以API形式调用云端脱敏接口,在应用层面实现敏感数据的自动化敏感度降级处理,大大提升应用可扩展性和算法的可维护性;
企业数据安全管理者可以通过自适应的脱敏解决方案,完成各类不同场景的数据脱敏分发,例如定期从生产环境向开发测试环境脱敏,不同数据类型(如OSS中的csv向RDS的数据表)之间的异构脱敏,数据库层面的原库/原表脱敏等等。
3. 从静态检测到动态感知进化的全域数据审计
《等保》2.0 针对数据安全提出了“安全审计”和“个人信息保护”的相关要求。随着数字化转型的深入发展,企业重要数据已经从传统单一的数据库存储扩大到各类数据存储、大数据和数据中台等,统一的数据安全审计成为管理难题。
数据安全中心可以实现对云上各类数据源的安全审计,并在此基础上深耕防泄漏场景,帮助客户实现全域数据的风险感知。
动态感知数据安全风险
本次升级亮点
利用机器学习技术,为数据的访问行为建立安全基线,在发生潜在数据风险,例如异常时间或地点访问时,及时预警并提供针对性的溯源能力和防护建议,化静态检测为动态感知,帮助客户快速应对突发的数据安全事件,提升整体响应能力;
上线数据水印能力,支持客户对泄密信息进行溯源,满足相关合规要求的同时,做到数据泄露事件的真正有据可查。
通过上述三大核心能力,满足客户数据安全防护的核心诉求:
1. 提升治理能力
2. 降低泄露风险
3. 保障安全合规
截止目前,阿里云数据安全中心已经累计为云上客户运行了数以万计的脱敏任务,实现了几百亿字段的脱敏。同时,数据安全中心累计帮助云上客户防范了上百起潜在的数据泄漏事件。