开发者社区> 问答> 正文

DATAX hdfsreader读取hive orc 写入mongodb读取端丢数

有张分区每个分区后 5000kw 的表,并行导了几天的数进mongodb, 部分日期 出现 数据丢失。
整个过程 datax无报错 ,有的日期丢失超过1000w数据。
导入过程后两天出现过 hdfs空间满的情况,
也就是 导入时 空间使用率很高,预计超过95%

是否现有机制下,在空间不足时读失败,无对应日志记录?

展开
收起
bulbcat 2018-12-14 16:35:56 4392 0
0 条回答
写回答
取消 提交回答
问答排行榜
最热
最新

相关电子书

更多
开源数据库 MongoDB 专场 MongoDB疑难杂症分析及优化 立即下载
阿里云MongoDB云服务构建 立即下载
饿了么高级架构师陈东明:MongoDB是如何逐步提高可靠性的 立即下载