在阿里云 DataWorks 中实现数据脱敏配置的流程如下:
前提条件:配置数据脱敏节点前,需要先配置好相应的输入节点。
操作步骤:
在阿里云DataWorks中实现数据脱敏配置的流程如下:
登录DataWorks:
进入数据开发:
选择数据脱敏:
配置数据源和表:
添加脱敏规则:
保存和应用规则:
验证和测试:
启用和监控:
持续管理:
配置脱敏规则
登录DataWorks控制台:
登录阿里云账号,访问DataWorks管理控制台。
选择工作空间:
在控制台中选择对应的工作空间(项目空间)。
进入数据安全中心:
导航至相关的安全与合规模块,找到“数据安全中心”入口。
配置脱敏规则:
进入“数据隐私保护”或“风险治理”相关菜单,找到“数据脱敏”功能。
在“脱敏规则”页面,您可以新建脱敏规则。
新建脱敏模板:
在“脱敏模板”页签下点击“新建模板”。
根据需求选择相应的脱敏算法,如哈希脱敏、遮盖脱敏、替换脱敏等。
配置模板参数,比如指定脱敏字段、脱敏规则(如保留几位数字、字符替换规则等)、是否启用等。
配置脱敏细节:
对每个待脱敏的字段,设定具体的脱敏策略,包括但不限于:
明确脱敏的表和字段。
设置脱敏后的显示格式。
若需要,还可以设置条件脱敏,比如仅对部分满足条件的数据进行脱敏。
保存并测试:
完成脱敏模板配置后,保存并测试验证脱敏效果,确认数据在经过脱敏处理后符合预期的安全标准。
关联业务流程:
将脱敏模板应用到相应的数据导出、查询或者其他涉及敏感数据流转的业务流程中,确保在整个数据生命周期中,敏感数据得到妥善处理。
登录 DataWorks 控制台,进入相应的工作空间和项目。
在项目首页中,选择"数据开发",进入数据开发页面。
在数据开发页面中,选择要进行脱敏配置的表,进入表详情页面。
在表详情页面中,选择"脱敏配置"标签页,可以看到表的脱敏配置信息。
在脱敏配置页面中,可以选择需要脱敏的字段,并设置相应的脱敏规则。可以选择的脱敏规则包括:
姓名脱敏:将姓名的部分字符替换为“*”号。
身份证号脱敏:将身份证号的部分字符替换为“*”号。
手机号脱敏:将手机号的部分字符替换为“*”号。
地址脱敏:将地址的部分字符替换为“*”号。
自定义脱敏:根据需要自定义脱敏规则。
设置完脱敏规则后,可以点击"预览"按钮,预览脱敏后的数据。
如果预览数据无误,可以点击"提交"按钮,保存脱敏配置。
要实现DataWorks脱敏配置,可以按照以下流程进行操作:
创建数据源:首先,在DataWorks中创建数据源,将要处理的数据源连接到DataWorks平台。
创建表:在DataWorks中创建目标表,用于存储脱敏后的数据。
创建数据开发节点:在DataWorks中创建数据开发节点,用于编写数据处理代码。
编写脱敏代码:在数据开发节点中编写脱敏代码。根据具体需求,选择相应的脱敏算法和规则,对敏感数据进行脱敏处理,并将结果写入目标表。
配置调度参数:为数据开发节点配置调度参数,确定数据处理的时间和频率。
运行节点:将数据开发节点提交并运行,开始执行数据脱敏的过程。
监控和调试:监控数据处理任务的运行状态,并根据需要进行调试和优化。
验证结果:在目标表中查看脱敏后的数据,并验证是否符合脱敏要求和规则。
定期维护:定期检查和维护数据脱敏配置,确保数据持续脱敏的效果和正确性。
以上流程仅为一般参考,实际操作可能会因不同的系统和需求而有所变化。在具体操作过程中,您可能需要参考DataWorks的文档或向相关技术支持人员咨询以获得更详细的指导。
下面以全局配置(_default_scene_code)为例,介绍数据脱敏配置的流程,Hologres展示脱敏、DataWorks展示脱敏和DataWorks数据分析脱敏、MaxCompute底层脱敏场景的操作步骤参考全局配置场景。在数据脱敏管理页面,选择脱敏场景为全局配置(_default_scene_code)。(可选)选择脱敏对象并授权。说明 仅Hologres展示脱敏和MaxCompute底层脱敏需要配置。单击选择脱敏project或选择脱敏database,根据界面提示选择脱敏的project或database并选择同意授权。新建数据脱敏规则。在数据脱敏配置页面,单击右上方的新建规则。在新建规则对话框中,选择需要设置的脱敏规则和脱敏方式。脱敏规则可选择已有的数据识别规则,数据识别规则详情可参见数据识别规则。 DataWorks支持的脱敏方式包括假名、HASH和掩盖三种方式。不同脱敏规则支持的脱敏方式也不同,请根据界面展示实际结果进行配置。假名假名脱敏会将一个值替换成一个具有相同特征的脱敏信息。使用假名脱敏时,需要选择是否开启数据水印,并选择安全域。数据水印:数据水印可提供数据溯源能力,发生数据泄漏后,可以帮您定位到可能的泄漏源。安全域:可选范围0~9,不同安全域的脱敏策略规则不一致,即相同的待脱敏数据在不同的安全域脱敏出来的结果信息不一致。例如,原始数据为a123,安全域设置为0时,脱敏成b124,安全域设置为1时,脱敏成c234。原始数据相同时,如果安全域相同则脱敏后的数据也是相同的。HASHHASH脱敏需要是否开启数据水印,并选择安全域。数据水印:数据水印可提供数据溯源能力,发生数据泄漏后,可以帮您定位到可能的泄漏源。安全域:可选范围0~9,不同安全域的脱敏策略规则不一致,即相同的待脱敏数据在不同的安全域脱敏出来的结果信息不一致。例如,原始数据为a123,安全域设置为0时,脱敏成b124,安全域设置为1时,脱敏成c234。原始数据相同时,如果安全域相同则脱敏后的数据也是相同的。掩盖掩盖脱敏是使用*对部分信息进行掩盖,达到脱敏的效果,是一种比较常用的脱敏方式。参数 描述 推荐方式 为身份证、银行卡等常用的数据类型提供掩盖脱敏策略。 自定义 自定义设置提供了更加灵活的设置方式,可以在前中后三段设置是否脱敏,以及需要脱敏(或者不脱敏)的字符长度。单击保存 https://help.aliyun.com/document_detail/103077.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。