DataWorks如何备份?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks 提供了多种数据备份与恢复的能力,以确保用户的数据安全性和可靠性。以下是关于 DataWorks 数据备份的具体方法和操作步骤:
MaxCompute 是 DataWorks 的核心计算引擎之一,支持自动备份数据的历史版本,并允许用户自定义备份保留周期。
设置备份保留天数
用户可以通过以下命令设置 MaxCompute 表数据的备份保留天数:
setproject odps.timemachine.retention.days=days;
days
的取值范围为 [0,30]
,默认值为 1
。0
表示关闭备份功能。数据恢复
在备份保留周期内,用户可以将当前版本恢复至任意一个历史备份版本。此功能通过云原生底层存储实现三份副本备份,确保数据的高可用性。
对于使用 DataWorks 数据集成自定义资源组的场景,如果涉及 DataX 组件的 log4j 问题,可以通过以下步骤修复并确保组件的安全性:
log4j-core
文件(例如 log4j-core-2.17.1.jar
)。/tmp/
)。/home/admin/datax3/
),确认并备份原有的 log4j-core
文件。DataWorks 提供了迁移助手功能,支持用户定期备份任务代码,避免因误删项目导致的损失。
DataWorks 集成了操作审计(ActionTrail)功能,支持查看和检索最近 90 天内的操作记录。
支持的操作类型
包括但不限于:
数据恢复与回滚
对于注册至 DataWorks 的 CDH 或 CDP 集群,用户需要上传相关配置文件以确保集群任务的正常运行。
配置文件备份
包括但不限于以下文件:
用户可根据实际需求上传这些文件,并在必要时进行备份。
DataWorks 的数据保护伞功能支持对敏感数据进行分类分级管理,并提供风险识别与报警功能。
通过以上方法,您可以全面保障 DataWorks 中的数据安全与可靠性。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。