数据脱敏不再难,阿里云数据安全中心帮您轻松搞定!

本文涉及的产品
云安全中心 免费版,不限时长
简介: 阿里云正式发布数据安全中心

2021年1月28日,阿里云正式发布数据安全中心,在整合敏感数据保护(SDDP)等产品能力基础上,为客户提供全域一体标准化的云上数据安全防护服务。

数据安全中心防护能力涵盖非结构化、半结构化及结构化等不同类型数据,尤其在数据加密和脱敏领域,面向全体云上开发者,提供了便捷,灵活,标准化的能力支持。

1.png

数据安全中心能力概述

2020年中发布的《个人信息保护法》草案中,对数据匿名化和去标识化提出了明确要求,但在落地过程中,由于应用开发与数据使用场景的复杂多样,通常很难形成标准化的脱敏防护体系。

阿里云数据安全中心通过多年的内部沉淀,为广大云上开发者提供了丰富的数据匿名化和去标识化算法,可以根据实际业务场景灵活选择,自定义参数,做到个性化数据脱敏。

正文配图02新.jpg

数据脱敏效果示例

小知识

· 动态脱敏
典型场景:主要用于直接访问生产数据的数据脱敏使用场景,例如前端页面展示或应用使用数据的过程中进行脱敏。
适合人员:应用与数据开发人员,通过开发和应用接口实现数据防护。
关于数据安全中心提供的动态脱敏能力,可以参考以下文档:
https://help.aliyun.com/document_detail/173158.html

· 静态脱敏
典型场景:主要用于将数据抽离生产环境并进行分发和共享的场景,例如生产环境向开发测试环境的数据脱敏导出。
适合人员:数据库与数据安全管理者,定期实现数据防护。
关于数据安全中心提供的静态脱敏能力,可以参考以下文档:
https://help.aliyun.com/document_detail/124295.html

截屏2021-02-02 下午9.17.07.png

数据脱敏方式比较示例

数据安全中心提供了自定义脱敏模板:
企业应用开发人员可以通过自定义算法模板,以API形式调用云端脱敏接口,在应用层面实现敏感数据的自动化敏感度降级处理,大大提升应用可扩展性和算法的可维护性。
有关自适应脱敏模板的介绍,可以参考以下文档:
https://help.aliyun.com/document_detail/155870.html

企业开发人员可以通过自适应的脱敏模板,完成各类不同场景的数据脱敏分发,例如定期从生产环境向开发测试环境脱敏,不同数据类型(如OSS中的csv向RDS的数据表)之间的异构脱敏,数据库层面的原库/原表脱敏等等。

脱敏场景举例:在页面展示时进行个人身份证号和手机号的脱敏
描述:通过数据安全中心提供的SDK与API实现敏感数据的动态脱敏。

步骤1:明确需要脱敏的数据。

对于常规的页面展示服务,一般会通过【Web页面-应用-数据库】的访问形式进行数据流的传输,动态脱敏无需更改数据库底层数据,而是在应用中内嵌SDK,调用云端API,实现敏感数据的脱敏。
本例中需要脱敏的字段为身份证号码和手机号码,存放数据的数据表列名分别为:
【身份证号码】 - 列名【person id】
【手机号码】 - 列名【phone number】

步骤2:确定需要的脱敏算法。

一般对于敏感数据,都有相对比较通用的脱敏算法可供使用,本例中主要使用遮盖算法进行脱敏处理:
【身份证号码】:一般为18位数据,展示时一般仅展示最后6位,其余通过*进行遮盖。
例如:123456
算法选择:【遮盖脱敏】-【保留自x至y】-【x=13,y=18】

【手机号码】:国内一般为11位数字,通常会保留前三位和后四位,其余通过*进行遮盖。
例如:138**1234
算法选择:【遮盖脱敏】-【遮盖自x至y】-【x=4,y=7】

使用哪种脱敏算法,一般需要根据实际业务场景进行选择:
对于无需还原和二次处理的数据,一般使用匿名化方式,如遮盖、哈希、取整等;
对于需要二次处理的数据,一般使用混淆,随机替换,加密等方式进行处理。
阿里云数据安全中心目前提供了多达30种脱敏算法,供开发者在各种场合根据业务需要进行选择和使用。相关算法可以参考:
https://help.aliyun.com/document_detail/125498.html

步骤3:配置脱敏模板。

(前提:需要通过阿里云账号开通阿里云数据安全中心服务)
记录下应用连接数据库过程中数据表中存放敏感数据的表字段名称。
例如:身份证列名:【person id】;手机号:【phone number】

在数据安全中心控制台选择新建一个脱敏模板,匹配方式选择字段名称(敏感类型目前仅支持静态脱敏),在界面上分别填入列名和在步骤二中确定的脱敏算法,如下图:

截屏2021-02-02 下午9.18.18.png

确认后记录下模板ID,在SDK中引用时能够使用。

截屏2021-02-02 下午9.19.04.png

步骤4:在应用程序中引用SDK和脱敏函数,编写代码。

在应用中构造API Request,通过API请求的方式,获得脱敏结果。以Python代码举例:

截屏2021-02-02 下午9.19.52.png

API调用示例,目前支持公共云的API请求,如果需要云内部请求,可以联系数据安全产品团队:

截屏2021-02-02 下午9.20.17.png

关于数据安全中心提供的ExecDatamask脱敏接口,可以参考以下文档:
https://help.aliyun.com/document_detail/157173.html

注意:在client连接中使用的accessKeyId和accessSecret能够通过使用RAM Role进行更安全的授权,避免在应用中直接写入AK/SK,降低泄漏风险。

【输入参数】:

截屏2021-02-02 下午9.20.56.png

TemplateId选择模板ID,上例中为步骤三中记录的303;
Data部分目前支持json的格式的输入,能够根据数据库结构构造:

截屏2021-02-02 下午9.21.30.png

【输出结果】
json格式的脱敏结果:

截屏2021-02-02 下午9.21.56.png

截止目前,阿里云数据安全中心已经累计为云上客户运行了数以万计的脱敏任务,实现了几百亿字段的脱敏。同时,数据安全中心累计帮助云上客户防范了上百起潜在的数据泄漏事件。

除了脱敏能力的升级,阿里云数据安全中心还在下列能力上进行了扩充,为企业安全管理员提供如下能力:

· 元数据视角更加精准的自动识别与分类分级

阿里云数据安全中心通过提供接口的方式,从元数据视角打通各类数据,赋能客户以更全局、更精准的视角,审视自身业务数据中存在的安全隐患,并针对性的落地防泄漏措施。

· 从静态检测到动态感知进化的全域数据审计

数据安全中心可以实现对云上各类数据源的安全审计,并在此基础上深耕防泄漏场景,帮助客户实现全域数据的风险感知。

通过上述三大核心能力,数据安全中心能够满足企业在数据安全防护的核心诉求:

1. 提升治理能力
2. 降低泄露风险
3. 保障安全合规

还在等待什么?快来免费试用阿里云数据安全中心吧!
https://www.aliyun.com/product/security/sddp

附上阿里云SDK下载链接:
https://next.api.aliyun.com/api-tools/sdk/Sddp?version=2019-01-03&language=python

相关文章
|
1月前
|
关系型数据库 MySQL 数据挖掘
阿里云 SelectDB 携手 DTS ,一键实现 TP 数据实时入仓
DTS 作为阿里云核心的数据交互引擎,以其高效的实时数据流处理能力和广泛的数据源兼容性,为用户构建了一个安全可靠、可扩展、高可用的数据架构桥梁。阿里云数据库 SelectDB 通过与 DTS 联合,为用户提供了简单、实时、极速且低成本的事务数据分析方案。用户可以通过 DTS 数据传输服务,一键将自建 MySQL / RDS MySQL / PolarDB for MySQL 数据库,迁移或同步至阿里云数据库 SelectDB 的实例中,帮助企业在短时间内完成数据迁移或同步,并即时获得深度洞察。
阿里云 SelectDB 携手 DTS ,一键实现 TP 数据实时入仓
|
1月前
|
SQL 人工智能 数据挖掘
阿里云DMS,身边的智能化数据分析助手
生成式AI颠覆了人机交互的传统范式,赋予每个人利用AI进行低门槛数据分析的能力。Data Fabric与生成式AI的强强联合,不仅能够实现敏捷数据交付,还有效降低了数据分析门槛,让人人都能数据分析成为可能!阿里云DMS作为阿里云统一的用数平台,在2021年初就开始探索使用Data Fabric理念构建逻辑数仓来加速企业数据价值的交付,2023年推出基于大模型构建的Data Copilot,降低用数门槛,近期我们将Notebook(分析窗口)、逻辑数仓(Data Fabric)、Data Copilot(生成式AI)进行有机组合,端到端的解决用数难题,给用户带来全新的分析体验。
110125 118
阿里云DMS,身边的智能化数据分析助手
|
2月前
|
存储 数据可视化 数据管理
基于阿里云服务的数据平台架构实践
本文主要介绍基于阿里云大数据组件服务,对企业进行大数据平台建设的架构实践。
716 2
|
6月前
|
存储 安全 机器人
如何下载阿里云视频点播数据
如何下载阿里云视频点播(VOD)数据
250 0
|
5月前
|
存储 人工智能 Cloud Native
耳朵经济快速增长背后,喜马拉雅数据价值如何释放 | 创新场景
喜马拉雅和阿里云的合作,正走在整个互联网行业的最前沿,在新的数据底座之上,喜马拉雅的AI、大数据应用也将大放光彩。本文摘自《云栖战略参考》
46463 5
耳朵经济快速增长背后,喜马拉雅数据价值如何释放 | 创新场景
|
1月前
|
消息中间件 编解码 运维
阿里云 Serverless 异步任务处理系统在数据分析领域的应用
本文主要介绍异步任务处理系统中的数据分析,函数计算异步任务最佳实践-Kafka ETL,函数计算异步任务最佳实践-音视频处理等。
175305 348
|
1月前
|
存储 数据采集 Apache
众安保险 CDP 平台:借助阿里云数据库 SelectDB 版内核 Apache Doris 打破数据孤岛,人群圈选提速4倍
随着业务在金融、保险和商城领域的不断扩展,众安保险建设 CDP 平台以提供自动化营销数据支持。早期 CDP 平台依赖于 Spark + Impala + Hbase + Nebula 复杂的技术组合,这不仅导致数据分析形成数据孤岛,还带来高昂的管理及维护成本。为解决该问题,众安保险引入 Apache Doris,替换了早期复杂的技术组合,不仅降低了系统的复杂性,打破了数据孤岛,更提升了数据处理的效率。
众安保险 CDP 平台:借助阿里云数据库 SelectDB 版内核 Apache Doris 打破数据孤岛,人群圈选提速4倍
|
3月前
|
大数据 数据管理 云计算
瓴羊联合阿里云、大数据技术标准推进委员会发布《基于数据资产全生命周期估值与实践报告》
瓴羊联合阿里云、大数据技术标准推进委员会发布《基于数据资产全生命周期估值与实践报告》
419 0
瓴羊联合阿里云、大数据技术标准推进委员会发布《基于数据资产全生命周期估值与实践报告》
|
3月前
|
JSON 机器人 数据格式
阿里云RPA支持将序列化的JSON数据作为输入参数传递给机器人应用程序
【1月更文挑战第7天】【1月更文挑战第33篇】阿里云RPA支持将序列化的JSON数据作为输入参数传递给机器人应用程序
206 1
|
4月前
|
大数据 流计算
掌阅科技基于阿里云实时计算Flink构建数据基建平台
掌阅科技专注于数字阅读,是全球领先的数字阅读平台之一。基于数字阅读平台的海量用户,掌阅通过阿里云实时计算Flink等大数据计算和分析服务,搭建商业化、用户增长、推荐服务等数据基建平台,实现商业化增值与用户阅读体验的结合。
402 0