《CDP企业数据云平台从入门到实践》——Hive3 新特性 (4) https://developer.aliyun.com/article/1228361?groupCode=ClouderaCDP
2. Hive3 的 Merge
详细步骤如下:
1) 创建数据库、创建表
CREATEDATABASEmerge_dataCREATTABLEmerge_data.transactionCREATTABLEmerge_data.merge_source
2) 向两个表中插入记录
INSERTINTOmerge_data.transactionPARTITION (tran_date) VALUESINSERTINTOmerge_data.merge_sourceVALUES
3) 进行 merge 操作
MERGEINTOmerge_data.transactionsASTUSINGmerge_data.merge_sourceASSONT.ID=S.IDandT.tran_date=S.tran_dateWHENMATCHEDAND (T.TranValue!=S.TranValueANDS.TranValueISNOTNULL) THENUPDATESETTranValue=S.TranValue, last_update_user=‘merge_update’WHENMATCHEDANDS.TranValueISNULLTHENDELETEWHENNOTMATCHEDTHENINSERTVALUES (S.ID, S.TranValue, ‘merge_insert’, S.tran_date)
查看 merge 后的数据
另外,在 CDP 中,无论是 Hive、Spark 和 Impala,都是通过 Ranger 来管理的,在Ranger 的 Hadoop SQL 里进行设置。