如何将json格式按字段同步进es？

环境信息

canal version mysql version

问题描述

操作流程是deployer >> kafka >>logstash >> es

我的logstash配置是 input{ kafka{ bootstrap_servers => ["192.168.10.200:9092"] consumer_threads => 5 auto_offset_reset => "earliest" topics => ["xxx"] codec => "json" } }

output{ elasticsearch{ hosts => ["192.168.10.110:9200"] index => "mysql-json" } }

在es index中出现了很多mysqlType.字段，这些字段实际用途吗？然后有个data字段内容是表的数据，但是同一个字段中内容分了好几块，如何将这些字段解析成mapping？ { "fvlineplus": null, "fkeyarea": "3303", "fproductionno": null, "fgroupprice": null, "fmaterialname": "H749L", }, { "fvlineplus": null, "fkeyarea": "3303", "fproductionno": null, "fgroupprice": null, "fmaterialname": "L537C",

}, { "fvlineplus": null, "fkeyarea": "3303", "fproductionno": null, "fgroupprice": null, "fmaterialname": "J434C", 大概是这样的信息，这种内容是update的数据吗？有没有办法直接合并数据？我希望数据能展示成在数据库中那样。

原提问者GitHub用户wajika

展开

收起

古拉古拉 2023-05-08 13:34:24 172 版权

2 条回答

写回答

取消提交回答

函数计算小白

可以按照canal.adapter来实现es mapping的工作

原回答者GitHub用户agapple

2023-05-09 17:42:21

赞同展开评论
LittlePenguin

随心分享，欢迎友善交流讨论：）

解决方案

关于mysqlType.字段：这些字段是由canal传递给logstash的元数据，指示字段的数据类型和其他属性。在es中索引这些字段通常不需要，您可以在logstash中使用mutate过滤器删除它们。

关于data字段：数据字段的内容可能分为多个块，因为它们是由canal传递并由logstash接收的。您可以使用logstash中的json插件解析数据字段并将其转换为合适的数据格式，然后将其发送到elasticsearch。

更新数据的问题：如果数据字段包含更新数据，您可以在elasticsearch中使用upsert操作将其与原始记录合并，或者使用logstash中的aggregate过滤器在单个事件中合并更新数据。具体取决于您的要求和数据量。

数据展示问题：如果您希望在es中显示与数据库中相同的结构，可以使用logstash中的mutate和rename过滤器更改字段名称和结构。这可以根据您的要求进行自定义。

2023-05-08 13:36:02

赞同展开评论

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

如何将json格式按字段同步进es？

相关文章