开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks中CDH hive同步的表数据脱敏的话这里的project指的是什么, hive?

问题1:DataWorks中CDH hive同步的表数据脱敏的话这里的project指的是什么, hive表里的database吗?image.png 问题2:所以CDH的格式里的project就是指 database吗,比如CDH 同步hive元数据,那么数据脱敏就是填 hive里的 databases.table.column吗?

展开
收起
cuicuicuic 2023-07-01 17:33:10 46 0
3 条回答
写回答
取消 提交回答
  • 在 DataWorks 中,"project" 是指数据开发项目,通常用于组织和管理数据处理任务。每个项目可以包含多个数据表或数据处理任务的集合。

    当你在 DataWorks 中进行 CDH Hive 同步的表数据脱敏时,"project" 可以指代你当前的数据开发项目,其中涉及到对 Hive 表数据进行脱敏处理。

    通过 DataWorks 平台,你可以创建和管理不同的项目,每个项目有自己的配置、权限和资源隔离。在一个项目中,你可以定义并操作多个 Hive 表,使用相应的转换逻辑来实现数据脱敏。

    所以,在这种上下文中,"project" 是指 DataWorks 平台中的数据开发项目,用于组织和管理 CDH Hive 同步表数据脱敏的任务。

    2023-07-31 21:27:28
    赞同 展开评论 打赏
  • 北京阿里云ACE会长

    在DataWorks中,CDH Hive同步的表数据脱敏时,"project"一词通常指的是DataWorks项目空间,而不是Hive项目空间。

    具体来说,当需要对CDH Hive同步的表数据进行脱敏时,可以在DataWorks项目空间中创建数据集成任务,选择Hive作为数据源,将Hive表同步到MaxCompute表中,并在同步任务中进行数据脱敏处理。在数据脱敏处理时,可以使用DataWorks提供的脱敏函数库和脱敏规则,对敏感数据进行脱敏处理。

    需要注意的是,在进行数据脱敏处理时,需要根据脱敏要求和规则进行合理的规划和调度,以保证数据脱敏任务能够稳定、高效地运行。

    2023-07-31 21:19:34
    赞同 展开评论 打赏
  • 回答1:参考这里的格式image.png ,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-07-01 17:42:25
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 相关电子书

    更多
    Hive Bucketing in Apache Spark 立即下载
    spark替代HIVE实现ETL作业 立即下载
    2019大数据技术公开课第五季—Hive迁移到MaxCompute最佳实践 立即下载

    相关实验场景

    更多