MaxCompute操作报错合集之出现无法在 information_schema.TASKS_HISTORY 表中查询到特定类型的 DI 上线任务记录，该怎么办-阿里云开发者社区

MaxCompute操作报错合集之出现无法在 information_schema.TASKS_HISTORY 表中查询到特定类型的 DI 上线任务记录，该怎么办

2024-06-23 340

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： MaxCompute是阿里云提供的大规模离线数据处理服务，用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时，可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。

问题一：大数据计算MaxCompute中dhour 传参是获取当前的年月日小时，例如当前的为：帮忙看看？

大数据计算MaxCompute中dhour 传参是获取当前的年月日小时，例如当前的为：2024022914 to_char(dateadd(to_date('dhour′,′yyyymmddhh′),1,′hh′),′yyyymmddhh′)是在在当前年月日小时的基础上加一个小时用这个传参的时候，selecttochar(dateadd(todate(′{dhour}','yyyymmddhh'),1,'hh'),'yyyymmddhh') 是在在当前年月日小时的基础上加一个小时用这个传参的时候， select to_char(dateadd(to_date('{dhour}','yyyymmddhh'),1,'hh'),'yyyymmddhh') ; 这条代码是可以实现我要的；报错：alter table A partition ( dp ='dhour′)renametopartition(dp=tochar(dateadd(todate(′{dhour}') rename to partition (dp = to_char(dateadd(to_date('{dhour}','yyyymmddhh'),1,'hh'),'yyyymmddhh') );

参考回答：

在MaxCompute中，可以使用dateadd函数来对日期进行加减操作，并使用to_char函数将结果转换为指定格式的字符串。

具体来说，这个表达式的作用是将输入的日期字符串（格式为'yyyymmddhh24'）加上1小时，并将结果转换为'yyyymmddhh'格式的字符串。

以下是该表达式的解析：

new_dhour = to_char(dateadd(to_date('$[yyyymmddhh24]', 'yyyymmddhh'), 1, 'hh'), 'yyyymmddhh')

to_date('$[yyyymmddhh24]', 'yyyymmddhh')：将输入的日期字符串转换为日期类型。
dateadd(..., 1, 'hh')：对转换后的日期加上1小时。
to_char(..., 'yyyymmddhh')：将加小时后的日期转换为'yyyymmddhh'格式的字符串。

请注意，在实际使用时，需要将$[yyyymmddhh24]替换为具体的日期字符串。

关于本问题的更多回答可点击原文查看：

https://developer.aliyun.com/ask/600771

问题二：大数据计算MaxCompute有一组di上线任务，数据源是hdfs，每天都运行，是什么原因呢？

大数据计算MaxCompute有一组di上线任务，数据源是hdfs，每天都运行，但是在information_schema.TASKS_HISTORY查不到运行记录，是什么原因呢？

select * from(

select distinct owner_name, get_json_object(settings,'$.SKYNET_NODENAME') as task_name

from information_schema.TASKS_HISTORY

where ds>='20240226' and task_schema = 'xxxxxx'

) where task_name='xxxxxxx'

其他di类型可以查到

参考回答：

可能的原因有以下几点：

任务没有成功执行。请检查任务的执行情况，确保任务已经成功执行。
任务的历史记录被清除了。请检查MaxCompute的任务历史保留策略，确保任务的历史记录没有被清除。
查询条件不正确。请检查查询条件是否正确，确保能够查询到任务的运行记录。

建议按照以下步骤进行排查：

登录MaxCompute控制台，查看任务的执行情况，确保任务已经成功执行。
检查MaxCompute的任务历史保留策略，确保任务的历史记录没有被清除。
修改查询条件，确保能够查询到任务的运行记录。例如，可以尝试使用*代替distinct owner_name, get_json_object(settings,'$.SKYNET_NODENAME') as task_name，以便查看所有字段的信息。

关于本问题的更多回答可点击原文查看：

https://developer.aliyun.com/ask/600769

问题三：大数据计算MaxCompute这是什么问题？

大数据计算MaxCompute这是什么问题？failed: ODPS-0110061: Failed to run ddltask - Modify DDL meta encounter exception : ODPS-0010000:System internal error - Metastore processing exception - Batch modify failed. ots2.0 processing error because of [ErrorCode]:OTSOutOfTransactionDataSizeLimit, [Message]:batchWriteRow partially failed, one of its errors: Transaction size exceeds the limit.RowSize:2804.TotalSize:4194614.Limit:4194304., [RequestId]:00061273-f0b1-fc5d-e623-150a6577b849, [TraceId]:null, [HttpStatus:]0 (Inner exception: batchWriteRow partially failed, one of its errors: Transaction size exceeds the limit.RowSize:2804.TotalSize:4194614.Limit:4194304.)

参考回答：

这个问题是由于MaxCompute的事务数据大小限制导致的。在执行批量写入操作时，事务的总大小超过了限制。具体来说，单个行的大小为2804字节，总大小为4194614字节，而限制为4194304字节。

要解决这个问题，您可以尝试以下方法：

减小单行数据的大小：检查您的数据模型和业务需求，看是否可以通过减少某些字段的大小或优化数据结构来减小单行数据的大小。
增加事务数据大小限制：如果您确实需要处理大量数据，可以考虑与阿里云技术支持联系，申请增加事务数据大小限制。请注意，这可能需要额外的费用和资源投入。
分批处理数据：将数据分成较小的批次进行处理，以适应当前的事务数据大小限制。这可以通过编写自定义脚本或使用MaxCompute提供的内置函数来实现。

关于本问题的更多回答可点击原文查看：

https://developer.aliyun.com/ask/600767

问题四：大数据计算MaxCompute这个报错会有啥问题吗？

大数据计算MaxCompute这个报错会有啥问题吗？warning:[0,0] It is hardly to accurately estimate io size of scanning data files for upsertable transactional table on post paid scene%EF%BC%8Ctable name is Orange_DataWarehouse_1.ods_lj_paymentdetail_rt

参考回答：

这个报错信息表示在MaxCompute中，对于名为Orange_DataWarehouse_1.ods_lj_paymentdetail_rt的可更新事务表，很难准确估计扫描数据文件时的I/O大小。这可能会导致性能问题或资源浪费。

该警告通常出现在使用后付费模式的场景下，即根据实际使用的计算资源进行计费。在这种情况下，系统可能无法准确地估算出扫描数据文件所需的I/O大小，从而无法提供准确的计费信息。

要解决这个问题，您可以考虑以下几种方法：

优化查询：检查您的查询语句是否可以进一步优化，以减少扫描的数据量和I/O操作。例如，通过添加合适的过滤条件、限制返回的结果集等来减少需要处理的数据量。
调整资源：根据您的需求和预算，考虑增加MaxCompute集群的资源，如内存、CPU等，以提高查询性能和I/O效率。
分区和分桶：将大表按照某个字段进行分区或分桶，可以减少需要扫描的数据量。通过指定分区或分桶键，您可以只扫描与查询条件匹配的分区或分桶，从而提高查询效率。
索引：为需要频繁查询的列创建索引，可以加速查询操作。索引可以帮助系统快速定位到符合条件的数据，而无需扫描整个表。
物化视图：如果您经常执行相同的查询，并且查询结果不经常变化，可以考虑使用物化视图。物化视图是预先计算好的查询结果集，可以像普通表一样进行查询。通过创建物化视图，您可以将查询结果缓存起来，避免每次查询都进行计算。

请注意，以上方法仅供参考，具体解决方案可能需要根据您的具体情况进行调整和优化。

关于本问题的更多回答可点击原文查看：

https://developer.aliyun.com/ask/600753

MaxCompute操作报错合集之出现无法在 information_schema.TASKS_HISTORY 表中查询到特定类型的 DI 上线任务记录，该怎么办

问题一：大数据计算MaxCompute中dhour 传参是获取当前的年月日小时，例如当前的为：帮忙看看？

问题二：大数据计算MaxCompute有一组di上线任务，数据源是hdfs，每天都运行，是什么原因呢？

问题三：大数据计算MaxCompute这是什么问题？

问题四：大数据计算MaxCompute这个报错会有啥问题吗？

大数据计算 MaxCompute

热门文章

最新文章

相关产品

相关课程

相关电子书

MaxCompute操作报错合集之出现无法在 information_schema.TASKS_HISTORY 表中查询到特定类型的 DI 上线任务记录，该怎么办

问题一：大数据计算MaxCompute中dhour 传参是 获取当前的年月日小时，例如当前的为：帮忙看看？

问题二：大数据计算MaxCompute有一组di上线任务，数据源是hdfs，每天都运行，是什么原因呢？

问题三：大数据计算MaxCompute这是什么问题？

问题四：大数据计算MaxCompute这个报错会有啥问题吗？

大数据计算 MaxCompute

热门文章

最新文章

相关产品

相关课程

相关电子书

问题一：大数据计算MaxCompute中dhour 传参是获取当前的年月日小时，例如当前的为：帮忙看看？