大数据计算MaxCompute 9点之前的运行历史到哪去了?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在MaxCompute中,运行历史数据的存储和查询方式与元数据视图的时效性或保留周期密切相关。根据知识库中的信息,以下是对您问题的详细解答:
MaxCompute通过Information Schema
提供元数据视图来记录作业的运行情况,包括资源消耗、运行时长、数据处理量等指标。然而,这些视图的数据存在一定的延迟和保留周期: - 延迟说明:元数据视图(如TASKS_HISTORY
)与在线数据之间可能存在约3小时的延迟。 - 保留周期:超过保留周期的历史数据将无法直接通过Information Schema
访问。
因此,如果您需要查询9点之前的运行历史数据,可能需要检查是否超出了默认的保留周期。
为了查询运行历史数据,您可以按照以下步骤操作:
TASKS_HISTORY
视图TASKS_HISTORY
视图是专门用于记录作业运行历史的元数据视图。建议在每天6:00:00之后查询前一天的数据,以避免查询当天的数据导致输入量过大。
示例SQL查询:
SELECT *
FROM information_schema.TASKS_HISTORY
WHERE start_time < '2023-10-01 09:00:00'
AND start_time >= '2023-10-01 00:00:00';
如果需要长期保存运行历史数据,建议定期将TASKS_HISTORY
视图中的数据导出到本地表中进行备份。为了避免新增字段导致备份失败,建议显式选择视图的字段名称,而不是使用SELECT *
的方式。
示例导出SQL:
INSERT INTO my_backup_table
SELECT task_id, start_time, end_time, status, latency
FROM information_schema.TASKS_HISTORY
WHERE start_time < '2023-10-01 09:00:00';
TASKS_HISTORY
视图存在约3小时的延迟,建议在数据生成后至少等待3小时再进行查询。Information Schema
视图会产生查询费用。建议优化查询条件以减少输入量,从而降低费用。Information Schema
视图,需要项目所有者授予Read
权限。授权语法如下:
GRANT READ ON PACKAGE Information_Schema.systables TO USER <user_name>;
如果通过上述方法仍无法找到9点之前的运行历史数据,可能的原因包括: - 数据已超出默认保留周期,无法通过Information Schema
访问。 - 查询条件设置不当,导致未匹配到相关数据。
要查找9点之前的运行历史数据,建议优先使用TASKS_HISTORY
视图,并确保查询时间范围和权限设置正确。如果需要长期保存历史数据,请定期导出到本地表中进行备份。
MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。