使用 elasticdump 跨版本迁移 ES 数据

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 使用 elasticdump 跨版本迁移 ES 数据

1、elasticdump 用途介绍

elasticdump 是一个在 Github 开源的 Elasticsearch 的数据迁移工具,项目 Github 地址:[传送门](Github 地址:https://github.com/elasticsearch-dump/elasticsearch-dump)


elasticdump 支持跨版本导出和导入数据,用法简单,安装方便。


elasti开发者用了下面一张图来形象的描述了 elasticdump 的作用



0.jpeg

elasticdump 具有以下特点

  • 安装方便、使用简单
  • 免费
  • 支持导出为数据文件,亦支持从文件导入到索引
  • 可以直接从 source service 导入到 target service


2、安装 node

使用 node 安装 elasticdump 非常方便。

node 官网:传送门


3、安装 elasticdump

3.1 基于本地安装

本地安装:使用时较为麻烦,不推荐

npm install elasticdump

Mac 系统下默认安装位置为:/Users/<user_name>/node_modules/elasticdump

启动

./bin/elasticdump

3.2 基于全局安装(推荐)

sudo npm install elasticdump -g


4、准备数据源服务和目标服务

博主准备了以下两个服务,将在本文第 6 小节演示数据的迁移

具体信息如下:


源数据服务:source
目标数据服务:data
版本号 7.13 8.5
服务地址 http://localhost:9213/ http://localhost:9200/
索引名称 test_index test_index


5、使用方法

5.1 一行代码看懂用法

elasticdump --input <源数据> --output <目标数据> --type=<数据类型>


5.2 数据源或者目标数据可以是文件或者 URL

源数据服务或者目标数据服务配置方法如下

Elasticsearch:

File:

  • format: {FilePath}
  • example: /Users/evantahler/Desktop/dump.json


5.3 重要选项

  • input:源数据的位置,此项为必须项
  • output:目标数据的保存位置:此项为必须项
  • type:默认为 data,


支持以下可选项:

  • settings
  • analyzer
  • data
  • mapping
  • policy
  • alias
  • template
  • component_template,
  • index_template


6、案例

6.1 以数据文件形式迁移

以文件方式导入导出,如过数据量很大,会占用很大的磁盘空间

6.1.1 导出源数据的 mapping 和 data

1:导出源数据索引的 mapping

在导出数据的时候,需要指定导出的数据类型

elasticdump --input http://localhost:9213/test_index --output /Users/wu/Desktop/test_index_mappin

2:导出指定索引的 data 为文件

elasticdump --input http://localhost:9213/test_index --output /Users/wu/Desktop/test_


6.1.2 将导出的数据文件导入至目标索引

1:创建目标索引的空索引

// curl -XPUT http:localhost:9200/test_index
PUT test_index


2:导入 mapping 至目标索引

elasticdump --input /Users/wu/Desktop/test_index_mapping.json --output http://localhost


3:导入 data 至目标索引

$ elasticdump --input /Users/wu/Desktop/test_index.json --output http://localhost:9200/ --type=


6.2 从数据源直接导入到目标集群

6.2.1 迁移 mapping

elasticdump --input http://localhost:9213/test_index --output http://localhost:9200/

6.2.2 迁移 data

elasticdump --input http://localhost:9213/test_index --output http://localhost:9200/ --t
相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
8月前
|
SQL 关系型数据库 MySQL
Hive跨集群和版本迁移
Hive跨集群和版本迁移
|
数据安全/隐私保护
在服务器迁移中心中导入迁移源
在服务器迁移中心中导入迁移源
88 3
|
存储 SQL 关系型数据库
MySQL5.7到8.0的升级迁移!高效的MySQL跨版本迁移技术解读
NineData是一种高效、稳定且易于使用的迁移工具,可帮助用户将MySQL 5.7迁移到MySQL 8.0。由于MySQL 5.7已经结束生命周期并不再获得技术支持,因此迁移至MySQL 8.0是必要的。NineData提供了数据复制功能,包括数据迁移和实时同步,还支持双向复制。与传统迁移方法相比,NineData具有简单易用、数据一致、强劲性能和高可靠性的优势。它提供了完善的观测和干预能力,保障迁移的成功。此外,NineData还提供了对比功能,确保数据的一致性。通过简单的配置过程,用户可以实现自动化的数据迁移。NineData还提供了完善的观测和干预能力,帮助用户追踪迁移进展并诊断和修复
1385 3
|
JSON 安全 数据安全/隐私保护
elasticdump迁移ES数据详解
elasticdump迁移ES数据详解
|
Ubuntu
跨版本升级
跨版本升级
288 0
跨版本升级
|
缓存 Kubernetes Linux
安装K8S集群1.17版本(euleros系统通用)
安装K8S集群1.17版本(euleros系统通用)
409 0
|
Kubernetes API 调度
关于k8s 集群版本升级的一些笔记(不能跨次要版本升级)
分享一些 K8s 集群版本升级的笔记 博文为根据官方文档的版本升级记录 理解不足小伙伴帮忙指正
895 0
|
分布式计算 前端开发 Hadoop
环境篇 ES 集群的配置|学习笔记
快速学习环境篇 ES 集群的配置
319 0
|
JSON JavaScript API
Elasticsearch 跨集群数据迁移方案总结
Elasticsearch 跨集群数据迁移方案总结
658 0
Elasticsearch 跨集群数据迁移方案总结
|
存储 编解码 JSON
Elasticsearch 跨网络、跨集群同步选型指南
1、两个同步实战问题 问题1:我想从目前的阿里云上6.7版本的es商业版,迁移到自己的7.10的自建环境,证书不一样,无法远程 无法ccr,有没有实时同步的工具呀?还是只能用logstash ? 问题2:es 2个索引数据同步有什么组件或者方案吗?
1154 0
Elasticsearch 跨网络、跨集群同步选型指南

热门文章

最新文章