备案控制台

开发者社区问答正文

实时计算的程序高可用性，数据可靠性具体怎么处理呢

比如 Spark + Hbase 。

展开

收起

hbase小助手 2018-11-21 19:09:37 2197 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

巴客

研究spark/hive/hbase相关技术

对于一些输入数据源（比如Kafka），Spark Streaming可以对已经接收的数据进行确认。输入的数据首先被接收器（receivers ）所接收，然后存储到Spark中（默认情况下，数据保存到2个执行器中以便进行容错）。数据一旦存储到Spark中，接收器可以对它进行确认（比如，如果消费Kafka里面的数据时可以更新Zookeeper里面的偏移量）

2019-07-17 23:15:45

赞同展开评论

问答分类：

分布式计算分布式数据库 Spark 流计算 Hbase 实时计算 Flink版云数据库HBase版

问答标签：

实时计算 Flink版数据实时计算 Flink版程序

问答地址：

开发者社区 > 大数据 > 问答

相关问答

Flink CDC程序怎么配置log4j日志输出到mysql吗？

253

1

0

Flink CDC为啥会出现程序正常运行，然后消费binlog不动了的情况？

105

0

0

Flink有没有那种不同数据库之间DDL 语句转换的脚本或程序？

357

7

0

Flink cdc同步mysql。从2.3切换到2.4，程序一直created,用2.3就一切正常？

142

1

0

Flink CDC这个是什么原因，我之前同步的是全量，改成增量了就不行了？有没有遇到程序停止后pg

181

3

0

Flink之前有个程序就是一直重启，导致数据库的连接数都爆满了。把人家线上的业务都搞坏了，怎么办？

225

1

0

一般如果想从代码中，直接把flink程序提交到集群中，这种要怎么操作呢？

184

1

0

Flink CDC 大佬们，cdc2.2.1采集oracle 19c时程序能运行，又不报错，但是拉取

551

0

0

各位大佬，请教一下，如果在flink cdc sql客户端使用SQL查询表，怎么能记录原系统的数据

2135

1

0

各位大佬，请教个问题，使用flink cdc读取数据时，如果配置一个表，数据过滤是发生在server

2003

3

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

PolarDB这个PXD部署这个端口可以指定吗？

通义灵码启动异常，可点击按钮进行一键修复，如仍无法解决，请参考[问题排查指南](https://he

关于idea lingma欺骗的对话。请开发者尽快修复

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

相关文章

只靠国产算力与开源数据，端侧模型预训练行不行？我们做到了全流程开源

MaxCompute SQL AI 超轻体验

MaxCompute SQL AI 超轻体验：

现场回顾｜PolarDB数据库沙龙：AI时代的数据底座

告别代码焦虑：MaxCompute SQL AI 让你的数据“开口说话”

还有其他疑问?