开发者社区> 问答> 正文

什么是有界数据集?

什么是有界数据集?

展开
收起
令人无语的八阿哥 2021-10-29 16:08:50 523 0
来自:华章出版社
1 条回答
写回答
取消 提交回答
  • 有界数据集具有时间边界,在处理过程中数据一定会在某个时间范围内起始和结束,有可能是一分钟,也有可能是一天内的交易数据。对有界数据集的数据处理方式被称为批计算(Batch Processing),例如将数据从RDBMS或文件系统等系统中读取出来,然后在分布式系统内处理,最后再将处理结果写入存储介质中,整个过程就被称为批处理过程。而针对批数据处理,目前业界比较流行的分布式批处理框架有Apache Hadoop和Apache Spark等。

    资料来源:《Flink原理、实战与性能优化》,文章链接:https://developer.aliyun.com/article/724685

    2021-10-29 16:18:47
    赞同 展开评论 打赏
问答地址:
来源圈子
更多
收录在圈子:
+ 订阅
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载