开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

业务库进行数据归档(物理删除),但是数仓想保留这部分数据,odps上要怎么处理呀

业务库进行数据归档(物理删除),但是数仓想保留这部分数据,odps上要怎么处理呀

展开
收起
游客3oewgrzrf6o5c 2022-07-08 17:06:43 615 0
1 条回答
写回答
取消 提交回答
  • 全栈JAVA领域创作者

    如果您的业务库进行了数据归档(物理删除),但是数仓想保留这部分数据,您可以考虑使用ODPS的数据仓库特性来实现数据的保留。具体来说,您可以使用ODPS的数据仓库特性来创建一个数据仓库,将业务库中的数据导入到数据仓库中,并进行数据清洗、转换等操作。这样,您就可以在数据仓库中保留业务库中的数据,同时又不影响业务库的数据归档。
    例如,您可以使用ODPS的load命令将业务库中的数据导入到数据仓库中。例如,以下命令演示了如何将业务库中的数据导入到数据仓库中:

    $ODPS_HOME/bin/odps load -c com.example.HelloWorld -p /path/to/my/jar.jar -f /path/to/data.json -o /path/to/data.warehouse/mydb/mytable
    

    在上面的命令中,-c参数指定了要执行的Java类的名称,com.example.HelloWorld是您要执行的Java类的名称。-p参数指定了jar包的路径,/path/to/my/jar.jar是您要执行的jar包的路径。-f参数指定了要导入的数据文件的路径,/path/to/data.json是您要导入的数据文件的路径。-o参数指定了导入数据的目标数据仓库和表的名称,/path/to/data.warehouse/mydb/mytable是您要导入数据的目标数据仓库和表的名称。
    需要注意的是,由于业务库进行了数据归档(物理删除),您需要在数据仓库中保留数据的完整性。例如,如果您在业务库中删除了某些数据,您需要在数据仓库中也删除这些数据。同时,您还需要在数据仓库中对数据进行数据清洗、转换等操作,以便在数仓中使用这些数据。

    2023-08-12 19:52:57
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

热门讨论

热门文章

相关电子书

更多
DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载