暂无个人介绍
2024年04月
2024年03月
2024年01月
2023年12月
2023年11月
2023年10月
2023年07月
2023年06月
2023年05月
2023年04月
2023年03月
2023年02月
2023年01月
2022年12月
Region 过大会发生多次 compaction,将数据读一遍并重写一遍到 hdfs 上, 占用 io,region 过小会造成多次 split,region 会下线,影响访问服务, 最佳的解决方法是调整 hbase.hregion. max.filesize 为 256m。
1)不支持细粒度的写和更新操作(如网络爬虫),spark 写数据是粗粒度的。所谓粗粒度,就是批量写入数据,为了提高效率。但是读数据是细粒度的也就是说可以一条条的读。
2)不支持增量迭代计算,Flink 支持