DataWorks中如何配置数据脱敏规则?

DataWorks中如何配置数据脱敏规则?

展开
收起
真的很搞笑 2023-07-01 15:59:53 267 分享 版权
4 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    DataWorks中,可以通过以下步骤配置数据脱敏规则:

    登录DataWorks控制台,选择数据开发 > 数据脱敏,进入数据脱敏管理页面。

    在数据脱敏管理页面中,选择需要脱敏的数据源和表,点击“添加规则”按钮。

    在添加规则页面中,选择需要脱敏的字段,选择脱敏方式和脱敏规则。目前DataWorks支持的脱敏方式包括替换、随机替换、脱敏函数、加密等,可以根据实际情况选择不同的脱敏方式。脱敏规则则是根据不同的脱敏方式自动生成的,可以根据实际情况进行调整。

    配置完成后,点击“保存”按钮,保存脱敏规则。

    在数据脱敏管理页面中,可以查看已经配置的脱敏规则,并可以修改或删除规则。

    2023-07-31 20:18:25
    赞同 展开评论
  • 在DataWorks中配置数据脱敏规则可以确保数据安全和隐私保护。以下是一些常见的脱敏规则和相应的配置方法:

    替换:替换是一种常用的脱敏方式,可以将敏感数据替换为其他值或字符。在DataWorks中,可以配置替换规则,选择需要替换的字段,并设置替换的值或字符。例如,可以将姓名中的姓氏替换为“*”,将敏感信息替换为“None”等。 模糊:模糊是一种脱敏方式,可以将敏感数据模糊或隐藏。在DataWorks中,可以配置模糊规则,选择需要模糊的字段,并设置模糊的方式和范围。例如,可以将手机号码的前面几位或后面几位模糊,将身份证号码中的部分信息隐藏等。 删除:删除是一种脱敏方式,可以将敏感数据直接删除。在DataWorks中,可以配置删除规则,选择需要删除的字段,并设置删除的长度或范围。例如,可以将身份证号码中的出生日期字段删除,将地址中的详细信息删除等。 加密:加密是一种保护数据安全的方式,可以对敏感数据进行加密处理。在DataWorks中,可以选择使用加密算法对数据进行加密处理,例如使用AES算法对数据进行加密。同时,还需要配置密钥管理和分发机制,以确保只有授权用户可以访问解密后的数据。 数据水印:数据水印是一种保护数据来源和追踪数据泄露的方式,可以在数据中添加特定的水印信息。在DataWorks中,可以配置数据水印规则,选择需要添加水印的字段和水印类型,并设置水印参数和可见性。例如,可以给关键字段添加水印,以便在数据泄露时可以追踪来源和责任人。

    2023-07-04 21:10:31
    赞同 展开评论
  • 在DataWorks中配置数据脱敏规则通常需要按照以下步骤进行操作:

    1. 登录DataWorks控制台。

    2. 在项目列表中选择要处理的项目,并进入该项目的工作空间。

    3. 在工作空间页面左侧的导航栏中,点击“数据开发”选项。

    4. 在数据开发页面中,选择需要配置脱敏规则的表或者数据处理节点,并右键点击。

    5. 在弹出的菜单中,选择“脱敏规则配置”。

    6. 在脱敏规则配置页面中,你可以看到已经配置好的脱敏规则列表。如果列表为空,说明还没有配置过脱敏规则。

    7. 点击“新增”按钮,进入脱敏规则配置界面。

    8. 在脱敏规则配置界面中,填写规则名称、选择字段和选择脱敏方式。脱敏方式可以是模糊化、替换、屏蔽等。

    9. 根据具体的脱敏需求,设置相应的参数,如替换字符、屏蔽位置等。

    10. 确认配置无误后,点击保存按钮。

    11. 回到脱敏规则配置页面,可以看到刚刚添加的脱敏规则已经生效。

    通过以上步骤,你可以在DataWorks中配置数据脱敏规则来保护敏感信息。请注意,具体的操作步骤可能会因DataWorks版本和权限设置而有所不同,请根据实际情况进行操作。

    2023-07-01 18:31:39
    赞同 展开评论
  • 在数据脱敏管理页面,选择脱敏场景为DataWorks数据集成脱敏(dataworks_data_integration_desense_code)。新建数据脱敏规则。在数据脱敏配置页面,单击右上方的新建规则。在脱敏规则对话框中,选择需要设置的敏感数据类型、脱敏规则名称、脱敏方式、安全域和替换字符集。image.png 配置基础信息参数 描述 敏感数据类型 脱敏规则名称 该文本框会自动代入用户填写的敏感数据类型(输入字符限制1~30字,包括:中文、英文、数字),您也可以在该敏感数据类型下新增脱敏规则名称,当与该租户下所有用户创建的脱敏规则出现重名时,提示规则名称重复。配置脱敏方式与规则:DataWorks支持的脱敏方式包括假名、HASH和掩盖三种方式。假名假名脱敏会将一个值替换成一个具有相同特征的脱敏信息。脱敏后数据和脱敏前数据的格式保持一致。当选择的敏感数据类型为内置敏感数据类型(手机号、身份证号、银行卡号、邮箱_内置、IP、车牌号、 邮政编码、座机号、MAC地址、地址、姓名、公司名)时,用户需要配置安全域。 安全域:可选范围0~9,不同安全域的脱敏策略规则不一致,即相同的待脱敏数据在不同的安全域脱敏出来的结果信息不一致。例如,原始数据为a123,安全域设置为0时,脱敏成b124,安全域设置为1时,脱敏成c234。原始数据相同时,如果安全域相同则脱敏后的数据也是相同的。当选择的敏感数据类型为非内置时,用户需要配置替换字符集。 替换字符集:遇到字符集中的字符,即会被替换为其他相同类型的字符,不支持中文,若需要脱敏的数据不符合字符集范围则不脱敏(可输入大写字母、小写字母、和数字,多个字符请用英文逗号隔开),例如,敏感数据脱敏前是0~3的数字和a~d的字母组成,那么脱敏后也会脱敏成在这个范围内的数字和字母。哈希 可将原始数据加密成固定长度的数据。HASH脱敏方式需要选择安全域。 安全域:可选范围0~9,不同安全域的脱敏策略规则不一致,即相同的待脱敏数据在不同的安全域脱敏出来的结果信息不一致。例如,原始数据为a123,安全域设置为0时,脱敏成b124,安全域设置为1时,脱敏成c234。原始数据相同时,如果安全域相同则脱敏后的 https://help.aliyun.com/document_detail/103077.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-07-01 16:04:59
    赞同 展开评论

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

还有其他疑问?
咨询AI助理