使用 elasticdump 跨版本迁移 ES 数据

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 使用 elasticdump 跨版本迁移 ES 数据

1、elasticdump 用途介绍

elasticdump 是一个在 Github 开源的 Elasticsearch 的数据迁移工具,项目 Github 地址:[传送门](Github 地址:https://github.com/elasticsearch-dump/elasticsearch-dump)


elasticdump 支持跨版本导出和导入数据,用法简单,安装方便。


elasti开发者用了下面一张图来形象的描述了 elasticdump 的作用



0.jpeg

elasticdump 具有以下特点

  • 安装方便、使用简单
  • 免费
  • 支持导出为数据文件,亦支持从文件导入到索引
  • 可以直接从 source service 导入到 target service


2、安装 node

使用 node 安装 elasticdump 非常方便。

node 官网:传送门


3、安装 elasticdump

3.1 基于本地安装

本地安装:使用时较为麻烦,不推荐

npm install elasticdump

Mac 系统下默认安装位置为:/Users/<user_name>/node_modules/elasticdump

启动

./bin/elasticdump

3.2 基于全局安装(推荐)

sudo npm install elasticdump -g


4、准备数据源服务和目标服务

博主准备了以下两个服务,将在本文第 6 小节演示数据的迁移

具体信息如下:


源数据服务:source
目标数据服务:data
版本号 7.13 8.5
服务地址 http://localhost:9213/ http://localhost:9200/
索引名称 test_index test_index


5、使用方法

5.1 一行代码看懂用法

elasticdump --input <源数据> --output <目标数据> --type=<数据类型>


5.2 数据源或者目标数据可以是文件或者 URL

源数据服务或者目标数据服务配置方法如下

Elasticsearch:

File:

  • format: {FilePath}
  • example: /Users/evantahler/Desktop/dump.json


5.3 重要选项

  • input:源数据的位置,此项为必须项
  • output:目标数据的保存位置:此项为必须项
  • type:默认为 data,


支持以下可选项:

  • settings
  • analyzer
  • data
  • mapping
  • policy
  • alias
  • template
  • component_template,
  • index_template


6、案例

6.1 以数据文件形式迁移

以文件方式导入导出,如过数据量很大,会占用很大的磁盘空间

6.1.1 导出源数据的 mapping 和 data

1:导出源数据索引的 mapping

在导出数据的时候,需要指定导出的数据类型

elasticdump --input http://localhost:9213/test_index --output /Users/wu/Desktop/test_index_mappin

2:导出指定索引的 data 为文件

elasticdump --input http://localhost:9213/test_index --output /Users/wu/Desktop/test_


6.1.2 将导出的数据文件导入至目标索引

1:创建目标索引的空索引

// curl -XPUT http:localhost:9200/test_index
PUT test_index


2:导入 mapping 至目标索引

elasticdump --input /Users/wu/Desktop/test_index_mapping.json --output http://localhost


3:导入 data 至目标索引

$ elasticdump --input /Users/wu/Desktop/test_index.json --output http://localhost:9200/ --type=


6.2 从数据源直接导入到目标集群

6.2.1 迁移 mapping

elasticdump --input http://localhost:9213/test_index --output http://localhost:9200/

6.2.2 迁移 data

elasticdump --input http://localhost:9213/test_index --output http://localhost:9200/ --t
相关实践学习
利用Elasticsearch实现地理位置查询
本实验将分别介绍如何使用Elasticsearch7.10版本进行全文检索、多语言检索和地理位置查询三个Elasticsearch基础检索子场景的实现。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
数据安全/隐私保护
在服务器迁移中心中导入迁移源
在服务器迁移中心中导入迁移源
67 3
|
JSON 安全 数据安全/隐私保护
elasticdump迁移ES数据详解
elasticdump迁移ES数据详解
|
Ubuntu
跨版本升级
跨版本升级
252 0
跨版本升级
|
缓存 Kubernetes Linux
安装K8S集群1.17版本(euleros系统通用)
安装K8S集群1.17版本(euleros系统通用)
336 0
|
Kubernetes API 调度
关于k8s 集群版本升级的一些笔记(不能跨次要版本升级)
分享一些 K8s 集群版本升级的笔记 博文为根据官方文档的版本升级记录 理解不足小伙伴帮忙指正
806 0
|
存储 编解码 JSON
Elasticsearch 跨网络、跨集群同步选型指南
1、两个同步实战问题 问题1:我想从目前的阿里云上6.7版本的es商业版,迁移到自己的7.10的自建环境,证书不一样,无法远程 无法ccr,有没有实时同步的工具呀?还是只能用logstash ? 问题2:es 2个索引数据同步有什么组件或者方案吗?
1020 0
Elasticsearch 跨网络、跨集群同步选型指南
|
缓存
「OushuDB」版本升级 二进制替换升级步骤
请注意需要留下足够的升级与测试时间,避免升级出现问题需要回退到老版本。另外,请在升级前做好数据的备份工作,防止出现意外。
92 0
|
安全 Java Linux
上线必备 | 高性能ES5.X部署配置清单
题记 网上当前(截止20170914)流传的各种配置文件普通存在以下问题: 1)版本低,不能和当前版本5.X匹配。 2)5.X的配置本身较1.X,2.X就有很大不同,原有配置已不适用。 3)ES英文、中文文档也没有及时更新。 现在,确保ES5.X的高性能到底需要哪些配置越发令人神往。 以下清单内容参考了ES官网文档,且都是在ES5.4.0的环境中验证过的,请放心使用。
212 0
|
监控 安全 网络协议
【最佳实践】3分钟学会使用Elasticsearch跨集群复制功能(CCR)
当您需要将本地Elasticsearch集群中的索引数据迁移到一个远程集群中,或者将一个远程集群中的索引数据迁移到本地集群,可通过跨集群复制CCR(Cross Cluster Replication)功能实现。本文介绍具体的实现方法。
2437 0
【最佳实践】3分钟学会使用Elasticsearch跨集群复制功能(CCR)