备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

各位，以下问题有社么好的解决办法呢？

各位，请教个问题：batch任务，想往hive表里插入group by的结果。但是提示hive does not support consuming update and delete change，有什么好的解决办法吗？

展开

收起

圆葱猪肉包 2023-03-27 14:22:41 403 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

筝樾
如果一个表要实现update和delete功能，该表就必须支持ACID，而支持ACID，就必须满足以下条件：

1、表的存储格式必须是ORC（STORED AS ORC）；

2、表必须进行分桶（CLUSTERED BY (col_name, col_name, ...) INTO num_buckets BUCKETS）；

3、Table property中参数transactional必须设定为True（tblproperties('transactional'='true')）；

4、以下配置项必须被设定：
```
 Client端：
```
hive.support.concurrency – true hive.enforce.bucketing – true hive.exec.dynamic.partition.mode – nonstrict
hive.txn.manager – org.apache.hadoop.hive.ql.lockmgr.DbTxnManager
服务端：

hive.compactor.initiator.on – true hive.compactor.worker.threads – 1 hive.txn.manager – org.apache.hadoop.hive.ql.lockmgr.DbTxnManager（经过测试，服务端也需要设定该配置项）注意：上述配置项必须区分Client端和服务端。在Cloudera Manager上可以分别添加（hive—>配置—>高级），在更新部署配置信息的时候需要勾选部署客户端配置（默认是勾选的）。
2023-03-28 14:36:37

赞同展开评论

问答分类：

SQL HIVE 实时计算 Flink版

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

购买阿里国外的云服务器是否可以访问谷歌？

83762

47

0

请问下我访问接口不通什么原因 Provisional headers are shown

3768

1

0

this xml file does not appear to have any style in

51915

10

0

重启Docker后报错：Error response from daemon

2326

0

0

sql server的用户名和密码怎么查啊？

37543

21

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60943

32

0

OSS的endpoint如何查看

37515

6

0

LoRa的网络覆盖能力范围是怎么样的？

3204

1

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3679

1

0

阿里云服务器如何重置系统？

24738

4

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

Apache Doris 4.0.2 版本正式发布

智能数据库运维大脑 DAS Agent 使用全攻略

别让 AIOps 变成“闭眼修系统”——说说可解释 AIOps 如何防止二次事故

线程池：故障梳理总结

XXLJOB：超长定时任务慢节点优化实践

热门讨论

热门文章

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC 人大金仓能作为source吗？支持bin-log吗？

flink cdc source端能降低消费速度嘛？

flink cdc同步的源表，一定要有主键么？

Flink CDC把主表先全量同步到索引中更新到索引中这种怎么搞？

我使用flink cdc StartupOptions.latest() 采最新的日志。要是程序挂了

Flink CDC中mysqlcdc 2.4.1 出现这个问题？

flink datastream ，向clickhouse插入数据时怎么关闭插入时更新,

请问一下Flink mysqlcdc获取到数据之后关联结果不更新这个怎么办?

展开全部

数据仓库介绍与实时数仓案例

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Flink Checkpoint 问题排查实用指南

Flink SQL 功能解密系列 —— 数据去重的技巧和思考

深入了解 Flink 网络栈（二）：监控、指标和处理背压

Apache Flink 漫谈系列(06) - 流表对偶(duality)性

Flink on YARN（上）：一张图轻松掌握基础架构与启动流程

Flink 1.9 实战：使用 SQL 读取 Kafka 并写入 MySQL

展开全部

还有其他疑问?