DataWorks中如何配置数据脱敏规则?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks中,可以通过以下步骤配置数据脱敏规则:
登录DataWorks控制台,选择数据开发 > 数据脱敏,进入数据脱敏管理页面。
在数据脱敏管理页面中,选择需要脱敏的数据源和表,点击“添加规则”按钮。
在添加规则页面中,选择需要脱敏的字段,选择脱敏方式和脱敏规则。目前DataWorks支持的脱敏方式包括替换、随机替换、脱敏函数、加密等,可以根据实际情况选择不同的脱敏方式。脱敏规则则是根据不同的脱敏方式自动生成的,可以根据实际情况进行调整。
配置完成后,点击“保存”按钮,保存脱敏规则。
在数据脱敏管理页面中,可以查看已经配置的脱敏规则,并可以修改或删除规则。
在DataWorks中配置数据脱敏规则可以确保数据安全和隐私保护。以下是一些常见的脱敏规则和相应的配置方法:
替换:替换是一种常用的脱敏方式,可以将敏感数据替换为其他值或字符。在DataWorks中,可以配置替换规则,选择需要替换的字段,并设置替换的值或字符。例如,可以将姓名中的姓氏替换为“*”,将敏感信息替换为“None”等。 模糊:模糊是一种脱敏方式,可以将敏感数据模糊或隐藏。在DataWorks中,可以配置模糊规则,选择需要模糊的字段,并设置模糊的方式和范围。例如,可以将手机号码的前面几位或后面几位模糊,将身份证号码中的部分信息隐藏等。 删除:删除是一种脱敏方式,可以将敏感数据直接删除。在DataWorks中,可以配置删除规则,选择需要删除的字段,并设置删除的长度或范围。例如,可以将身份证号码中的出生日期字段删除,将地址中的详细信息删除等。 加密:加密是一种保护数据安全的方式,可以对敏感数据进行加密处理。在DataWorks中,可以选择使用加密算法对数据进行加密处理,例如使用AES算法对数据进行加密。同时,还需要配置密钥管理和分发机制,以确保只有授权用户可以访问解密后的数据。 数据水印:数据水印是一种保护数据来源和追踪数据泄露的方式,可以在数据中添加特定的水印信息。在DataWorks中,可以配置数据水印规则,选择需要添加水印的字段和水印类型,并设置水印参数和可见性。例如,可以给关键字段添加水印,以便在数据泄露时可以追踪来源和责任人。
在DataWorks中配置数据脱敏规则通常需要按照以下步骤进行操作:
登录DataWorks控制台。
在项目列表中选择要处理的项目,并进入该项目的工作空间。
在工作空间页面左侧的导航栏中,点击“数据开发”选项。
在数据开发页面中,选择需要配置脱敏规则的表或者数据处理节点,并右键点击。
在弹出的菜单中,选择“脱敏规则配置”。
在脱敏规则配置页面中,你可以看到已经配置好的脱敏规则列表。如果列表为空,说明还没有配置过脱敏规则。
点击“新增”按钮,进入脱敏规则配置界面。
在脱敏规则配置界面中,填写规则名称、选择字段和选择脱敏方式。脱敏方式可以是模糊化、替换、屏蔽等。
根据具体的脱敏需求,设置相应的参数,如替换字符、屏蔽位置等。
确认配置无误后,点击保存按钮。
回到脱敏规则配置页面,可以看到刚刚添加的脱敏规则已经生效。
通过以上步骤,你可以在DataWorks中配置数据脱敏规则来保护敏感信息。请注意,具体的操作步骤可能会因DataWorks版本和权限设置而有所不同,请根据实际情况进行操作。
在数据脱敏管理页面,选择脱敏场景为DataWorks数据集成脱敏(dataworks_data_integration_desense_code)。新建数据脱敏规则。在数据脱敏配置页面,单击右上方的新建规则。在脱敏规则对话框中,选择需要设置的敏感数据类型、脱敏规则名称、脱敏方式、安全域和替换字符集。 配置基础信息参数 描述 敏感数据类型 脱敏规则名称 该文本框会自动代入用户填写的敏感数据类型(输入字符限制1~30字,包括:中文、英文、数字),您也可以在该敏感数据类型下新增脱敏规则名称,当与该租户下所有用户创建的脱敏规则出现重名时,提示规则名称重复。配置脱敏方式与规则:DataWorks支持的脱敏方式包括假名、HASH和掩盖三种方式。假名假名脱敏会将一个值替换成一个具有相同特征的脱敏信息。脱敏后数据和脱敏前数据的格式保持一致。当选择的敏感数据类型为内置敏感数据类型(手机号、身份证号、银行卡号、邮箱_内置、IP、车牌号、 邮政编码、座机号、MAC地址、地址、姓名、公司名)时,用户需要配置安全域。 安全域:可选范围0~9,不同安全域的脱敏策略规则不一致,即相同的待脱敏数据在不同的安全域脱敏出来的结果信息不一致。例如,原始数据为a123,安全域设置为0时,脱敏成b124,安全域设置为1时,脱敏成c234。原始数据相同时,如果安全域相同则脱敏后的数据也是相同的。当选择的敏感数据类型为非内置时,用户需要配置替换字符集。 替换字符集:遇到字符集中的字符,即会被替换为其他相同类型的字符,不支持中文,若需要脱敏的数据不符合字符集范围则不脱敏(可输入大写字母、小写字母、和数字,多个字符请用英文逗号隔开),例如,敏感数据脱敏前是0~3的数字和a~d的字母组成,那么脱敏后也会脱敏成在这个范围内的数字和字母。哈希 可将原始数据加密成固定长度的数据。HASH脱敏方式需要选择安全域。 安全域:可选范围0~9,不同安全域的脱敏策略规则不一致,即相同的待脱敏数据在不同的安全域脱敏出来的结果信息不一致。例如,原始数据为a123,安全域设置为0时,脱敏成b124,安全域设置为1时,脱敏成c234。原始数据相同时,如果安全域相同则脱敏后的 https://help.aliyun.com/document_detail/103077.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。