如何基于Dataphin实现敏感数据保护

本文涉及的产品
智能数据建设与治理Dataphin,200数据处理单元
简介: 在企业的发展过程中,如果不重视敏感数据的保护,和数据安全体系的建设,那么一旦发生了敏感数据泄漏事件,轻则企业口碑受损,业务受影响;重则会直接触法律,受到主管部门的处罚和制裁。本文将以一个最常见的场景:消费者隐私数据保护,展示如何利用Dataphin的安全能力,保障企业的数据安全。

作者:龙裔


《基于数据分类分级和敏感数据保护,保障企业数据安全》一文中,我们讲解了Dataphin中资产安全的主要应用场景和基本概念,那么如何利用Dataphin的安全能力,来保障企业的数据安全呢?


我们来看一个最常见的案例:消费者隐私数据保护。


场景介绍


近几年,随着消费者个人意识的崛起和对隐私的重视,数据安全成为了一个越来越热门的话题,国家也陆续发布了一些相关规定,来规范数据的采集和使用。在企业的发展过程中,如果不重视敏感数据的保护,不重视数据安全体系的建设,那么一旦发生了敏感数据泄漏事件,轻则企业口碑受损,业务受影响;重则会直接触法律,受到主管部门的处罚和制裁。


而在企业领域的敏感信息中,个人敏感信息是绝对的大头,包括个人的身份信息(姓名、身份证号码)、联系方式(手机、邮箱、地址)、个人财产信息、生物识别信息等等,都属于个人敏感数据。这些数据一旦泄漏,对用户的个人生活以及对企业的业务运行,都会产生非常大的损害,所以在企业的业务运转中,要对消费者的个人隐私数据进行脱敏保护。

图片:支付宝中,对用户姓名与用户账号的脱敏保护


主要流程


首先,我们回顾一下在Dataphin上,实现敏感数据保护的主要流程:


在Dataphin中,实现敏感数据保护,主要可以分为以下三个步骤:


1、识别敏感数据:即设定数据分类、数据分级、识别规则等内容

2、设置敏感数据保护方式:为识别的敏感数据选择合适的脱敏算法、设定脱敏规则

3、数据消费:在即席查询、开发数据写生产等场景进行数据消费时脱敏


详细步骤


接下来,我们以用户敏感信息中,最常见的用户姓名为例,展示如何一步步的首先用户姓名的识别和脱敏保护。


1、识别敏感数据

假设我们已经建立好了数据分类和数据分级(Dataphin会内置通用的分类和分级标准,支持开箱即用),我们直接进入新建识别规则的模拟步骤:


新建一个【用户姓名】的识别规则;

扫描范围选择【全部】;

扫描方式选择【内置识别】-【名字】(如果用户姓名的字段都叫【name】,也可以配置正则规则【^name$】);

数据分类选择【个人数据(C)】;

数据分级选择【机密数据(L3)】(根据自己企业的情况灵活调衡);

优先级选择【3】(中间优先级,根据自己企业的情况灵活调整);


配置完成识别规则后,我们可以触发一次【手动规则扫描】,或者等到第二天,系统会自动执行一次全局扫描。最终敏感数据识别的结果,都可以在【识别记录】页面看到:



2、设置敏感数据保护方式

识别到敏感数据之后,下一步就是给敏感数据设置合适的保护方式,从而保证数据不泄漏。


Dataphin当前内置了多种遮盖脱敏规则(如【张三】,显示成【*三】)、哈希脱敏规则(如【张三】,显示为【615DB57AA314529AAA0FBE95B3E95BD3】),可以满足大部分业务场景下的数据保护需求,并在未来支持加解密算法和用户自定义脱敏算法。


这里建议大家根据业务需求,选择合适的算法。比如对于用户姓名,在大部分的业务场景中(如支付宝转账),都是不能显示完整的名称,但是可以显示一部分,用于身份确认,这样就可以选择内置的【中文姓名】的脱敏算法



选择好合适的脱敏算法之后,我们就可以配置动态脱敏规则了,还是以用户姓名为例:


新建一个【用户姓名脱敏】的脱敏规则;

绑定已经建好的敏感数据识别规则【用户姓名】;

应用场景选择【写开发表】、【即席查询】;

脱敏方式选择【遮盖掩码-中文姓名】;

生效范围选择【全部】


至此,我们的敏感数据识别和保护就已经完全配置完成了,接下来在数据消费的过程中,就可以对数据进行保护了。


3、数据消费

下面已即席查询为例,展示敏感数据识别和脱敏的效果:


可以看到,我们开始往表格里写入的数据是【张三】,因为写入了敏感数据【name】字段,也就是【用户姓名】,所以在数据读取的时候,系统自动的进行了脱敏,操作的同学只能够看到【*三】,从而防止敏感数据泄漏,保护了数据安全。


结语


上面通过用户姓名这样一个非常很简单的案例,串讲了整个敏感数据识别和脱敏的主流程,相信能帮助您理解整个数据安全保护的机制;而在主流程之外,还有数据分类分级的制定、审核识别记录并手动修改、脱敏白名单等流程。同时,在企业实际的数据安全保护中,还有更多的系统工作要做,比如制定符合企业的数据分类分级体系、建立完整的数据识别体系等等。



了解产品更多内容可以戳入:https://dp.alibaba.com/product/dataphin



数据中台是企业数智化的必经之路,阿里巴巴认为数据中台是集方法论、工具、组织于一体的,“快”、“准”、“全”、“统”、“通”的智能大数据体系。

目前正通过阿里云对外输出系列解决方案,包括通用数据中台解决方案零售数据中台解决方案金融数据中台解决方案互联网数据中台解决方案政务数据中台解决方案等细分场景。

其中阿里云数据中台产品矩阵是以Dataphin为基座,以Quick系列为业务场景化切入,包括:

官方站点:

数据中台官网 https://dp.alibaba.com

钉钉沟通群和微信公众号

钉钉群二维码.png

相关实践学习
使用CLup和iSCSI共享盘快速体验PolarDB for PostgtreSQL
在Clup云管控平台中快速体验创建与管理在iSCSI共享盘上的PolarDB for PostgtreSQL。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
27天前
|
数据采集 运维 Kubernetes
Dataphin
Dataphin
51 2
|
5月前
|
存储 数据采集 安全
什么是Dataphin
Dataphin是阿里巴巴集团OneData数据治理方法论内部实践的云化输出,一站式提供数据采、建、管、用全生命周期的大数据能力,以助力企业显著提升数据治理水平,构建质量可靠、消费便捷、生产安全经济的企业级数据中台。Dataphin兼容多种计算平台,并开放可拓展的能力,以适应不同行业客户的平台技术架构和特定诉求。
118 0
|
10月前
|
监控 供应链
Dataphin资产专题助力您打造精品数据
随着数据量的不断增长以及消费场景的多样化,当前单一的数据目录已经很难满足数据管理者和消费者对于资产管理和查找的需求。 种种困难和吐槽的背后,核心原因是缺少一套有效的资产管理及运营体系,数据难以与业务形成有效连接,数据资产价值无法发挥放大。基于此背景,Dataphin 全新推出资产专题功能,希望打造面向主题的精品数据资产建设和运营生态,提升数据生产者和消费者的工作效率。 通过专题,您可以灵活高效地组织、管理并运营精品数据资产,交流并沉淀业务知识,形成数据与业务更多更强的连接,让数据更好地驱动业务。
730 1
|
10月前
|
SQL 数据挖掘 Java
Dataphin
Dataphin 是阿里云推出的一款数据智能化开发平台,主要面向企业级用户,提供了数据开发、数据治理、数据服务、数据分析等一系列功能,支持多种数据源和数据类型,旨在帮助用户快速构建数据中台和数据智能化应用。
307 0
|
12月前
|
安全 数据安全/隐私保护
瓴羊Dataphin隐私计算:数据安全流通方案-Dataphin隐私计算详解-Dataphin产品介绍
瓴羊Dataphin隐私计算:数据安全流通方案-Dataphin隐私计算详解-
|
安全 调度 数据安全/隐私保护
数据安全最佳实践(6):敏感数据实时识别与批量保护【Dataphin V3.9】
在DataphinV3.9版本中,我们支持了敏感数据实时识别的能力,能够实时发现敏感数据并进行保护,形成了手动上传+周期识别+实时识别的完整敏感数据识别体系。 同时,我们在DataphinV3.9版本中,支持了给敏感数据批量配置脱敏策略,可以给没有单独配置脱敏策略的敏感数据进行批量的脱敏保护,从而确保敏感数据不泄露。
数据安全最佳实践(6):敏感数据实时识别与批量保护【Dataphin V3.9】
|
数据安全/隐私保护
Dataphin权限体系(6):自定义用户组【Dataphin V3.9】
在日常的权限管理中,用户组是一个重要的概念。用户一般用于对权限的精确管控,而用户组一般用于对拥有相似权限和职责的一组用户的权限进行批量的进行管控。Dataphin在V3.9版本正式支持了用户组,可以较好的提升权限管理的效率。
Dataphin权限体系(6):自定义用户组【Dataphin V3.9】
|
安全 数据管理 数据处理
数据安全最佳实践(5):手动指定敏感数据【Dataphin V3.8】
在基于数据分类分级和敏感数据保护,保障企业数据安全、如何基于Dataphin实现敏感数据保护(以消费者隐私保护为例)中,我们讲了通过对敏感数据进行分类分级的识别和通过脱敏进行敏感数据的保护。这里面最基础的工作,就是完成敏感数据的识别,并尽量保证数据识别的准确性。 Dataphin V3.8在原来按照规则自动识别敏感数据的基础之上,新增了手动指定敏感数据的能力,方便快速指定核心敏感数据和批量进行敏感数据管理。
数据安全最佳实践(5):手动指定敏感数据【Dataphin V3.8】
Dataphin权限体系(3):权限审计能力介绍【Dataphin V3.5】
在正常的企业运行中,除了申请、授权的业务需求,还有一类很重要的就是对权限的管理需求。不论是从国家对数据监管的加强,要求重点企业数据系统的权限进行备案;还是企业自查异常权限、清点离职人员等场景,权限审计都是非常常见的需求。 Dataphin从3.5版本开始支持权限审计功能,支持对数据表、数据源的授权情况、授权操作等进行在产品上进行审计,同时支持审计详情的导出备案和进一步分析。
Dataphin权限体系(3):权限审计能力介绍【Dataphin V3.5】
|
分布式计算 数据处理 MaxCompute
Dataphin V3.4 - 租户管理
在Dataphin V3.4中,我们发布了多租户的功能。本文将提供一个简单的视频演示如果做租户的管理。
449 0

相关产品

  • 智能数据建设与治理 Dataphin