DataHub同步问题
-
DataHub同步到opds没有同步进去?
- 检查同步状态是否为EXECUTING,EXECUTING表示同步状态正常,一般情况下为数据没有写入导致,点击shard页面查看数据写入情况进行确认
- 检查同步状态为HANG,请点击问号按钮查看错误详情,会有详细的原因解释
- 检查同步状态为ERROR,请点击问号查看原因,尝试重启归档
-
DataHub同步到下游数据量不一致
- 点击同步详情,查看同步点位和脏数据量,各个shard的同步点位之和代表同步到下游的数据量,脏数据量代表没有同步到下游的数据量
-
DataHub同步延迟很大,不符合5min/64m归档一次
- 检查数据同步状态,若为EXECUTING代表同步任务正常
- 可能原因:数据同步点位设置有误,页面创建默认从当前时间创建
- 如何解决:创建同步时指定时间为数据最早写入时间
-
Odps partition not in partition config. partition:
- MaxCompute中对应的分区信息不在DataHub的分区信息中。这个多见于使用SystemTime或者EventTime模式同步的方式,这种方式,需要MaxCompute中固定存在三级分区分别是ds/hh/mm,分区类型为String,如果匹配不上,就会报这个错误。
-
maxcompute新加字段流程
- 首先Topic schema需要使用appendField新加字段,然后connector也需要新加字段,最后调用connector reload方法进行重启,具体所用到的方法见https://help.aliyun.com/document_detail/158841.html?spm=a2c4g.11186623.6.589.6f621a12k5u2ia#h2-connector-10
-
数据同步脏数据会自动清理的吗
- 脏数据指的是在datahub里,写不到下游的数据下游产品无法接收,同步时候会自动跳过
-
datahub里面在配置数据同步的页面的时候,出现了字段信息太多的问题,导致后面的页面无法上翻
- 全屏即可下翻