Elasticsearch 可搜索快照

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: Elasticsearch 可搜索快照

可搜索快照可以让快照以非常经济高效的方式搜索不常访问的只读数据。Cold tier 和 frozen tier 使用可搜索的 快照来降低存储和运营成本。


可搜索的快照不需要分片副本,理想情况下,可为数据存储节省一半所需的本地存储空间。可搜索快照依赖于已用于备份的相同快照机制,并且对快照存储库存储成本的影响最小。


可搜索快照非常适合管理大量历史数据存档。历史信息的搜索频率通常低于最近的数据,因此可能不需要副本来获得性能优势。对于更复杂或更耗时的搜索,可以结合异步搜索一起使用。


1 支持的存储库


2 挂载快照

POST /_snapshot/my_backup/snapshot_1/_mount?wait_for_completion=true 
{
  "index": "product",
  "renamed_index": "product_bak",
  "index_settings": {
    "index.number_of_replicas": 0
  }
}


3 工作原理


如果持有其中一个分片的节点出现故障,Elasticsearch 会自动将受影响的分片分配到另一个节点上,该节点会从存储库中恢复相关的分片数据。不需要副本,也不需要复杂的监控或编排来恢复丢失的分片。虽然可搜索快照索引默认没有副本,但可以通过调整 index.number_of_replicas. 可搜索快照分片的副本通过从快照存储库复制数据来恢复,就像可搜索快照分片的主分片一样。相反,常规索引的副本是通过从主索引复制数据来恢复的。


当从快照挂载索引时,Elasticsearch 会将其分片分配给集群内的数据节点。然后,数据节点会根据指定的挂载选项,自动将存储库中的相关分片数据检索到本地存储 中。如果可能,搜索使用本地存储中的数据。如果数据在本地不可用,Elasticsearch 会从快照存储库下载它需要的数据。


4 可靠性

7414672ec78ce99aa2374c7717167e3c.png


可搜索快照索引中数据依赖于存储在存储库中的底层快照拷贝。如果存储库故障或快照内容损坏,那么数据就会丢失。尽管 Elasticsearch 可能已将数据副本复制到本地存储中,但这些副本可能不完整,并且无法在存储库故障后用于恢复任何数据。您必须确保您的存储库是可靠的,并且可以防止数据在存储库中静止时损坏。

相关实践学习
利用Elasticsearch实现地理位置查询
本实验将分别介绍如何使用Elasticsearch7.10版本进行全文检索、多语言检索和地理位置查询三个Elasticsearch基础检索子场景的实现。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
2月前
|
安全 Linux 开发工具
Elasticsearch 搜索入门技术之一
Elasticsearch 搜索入门技术之一
236 1
|
2月前
|
存储 JSON 自然语言处理
Elasticsearch 利用API进行搜索
Elasticsearch 利用API进行搜索
44 0
|
2月前
|
存储 缓存 数据库
PB数据毫秒级搜索之Elasticsearch(二)基础了解
PB数据毫秒级搜索之Elasticsearch(二)基础了解
101 0
|
2月前
|
JSON Prometheus Cloud Native
Grafana 系列 - 统一展示 -8-ElasticSearch 日志快速搜索仪表板
Grafana 系列 - 统一展示 -8-ElasticSearch 日志快速搜索仪表板
|
1月前
|
搜索推荐 开发者
如何在 Elasticsearch 中选择精确 kNN 搜索和近似 kNN 搜索
【6月更文挑战第8天】Elasticsearch 是一款强大的搜索引擎,支持精确和近似 kNN 搜索。精确 kNN 搜索保证高准确性但计算成本高,适用于对精度要求极高的场景。近似 kNN 搜索则通过牺牲部分精度来提升搜索效率,适合大数据量和实时性要求高的情况。开发者应根据业务需求和数据特性权衡选择。随着技术发展,kNN 搜索将在更多领域发挥关键作用。
39 4
|
14天前
|
运维 监控 Java
在大数据场景下,Elasticsearch作为分布式搜索与分析引擎,因其扩展性和易用性成为全文检索首选。
【7月更文挑战第1天】在大数据场景下,Elasticsearch作为分布式搜索与分析引擎,因其扩展性和易用性成为全文检索首选。本文讲解如何在Java中集成Elasticsearch,包括安装配置、使用RestHighLevelClient连接、创建索引和文档操作,以及全文检索查询。此外,还涉及高级查询、性能优化和故障排查,帮助开发者高效处理非结构化数据。
26 0
|
19天前
|
缓存 Java API
在生产环境中部署Elasticsearch:最佳实践和故障排除技巧——聚合与搜索(三)
在生产环境中部署Elasticsearch:最佳实践和故障排除技巧——聚合与搜索(三)
|
20天前
|
存储 自然语言处理 NoSQL
D7 Elasticsearch-Mongodb(搜索记录)
D7 Elasticsearch-Mongodb(搜索记录)
10 0
|
24天前
|
存储 数据采集 负载均衡
Elasticsearch系列---搜索执行过程及scroll游标查询
Elasticsearch系列---搜索执行过程及scroll游标查询
|
2月前
|
存储 自然语言处理 搜索推荐
分布式搜索引擎ElasticSearch
Elasticsearch是一款强大的开源搜索引擎,用于快速搜索和数据分析。它在GitHub、电商搜索、百度搜索等场景中广泛应用。Elasticsearch是ELK(Elasticsearch、Logstash、Kibana)技术栈的核心,用于存储、搜索和分析数据。它基于Apache Lucene构建,提供分布式搜索能力。相比其他搜索引擎,如Solr,Elasticsearch更受欢迎。倒排索引是其高效搜索的关键,通过将词条与文档ID关联,实现快速模糊搜索,避免全表扫描。
143 4