3-Elasticsearch基本概念及操作

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: Elasticsearch使用时需要注意的基本概念

1、http端口默认为9200,tcp端口默认为9300,默认情况下elastic只允许本地访问,开启远程访问需设置elasticsearch.yml中的network.host;

2、复制副本只有在集群状态为green才可用,如果集群状态为red,则将会有些数据无法访问;

3、索引文档,使用put请求并制定唯一ID,请求体使用json格式的key-value格式即可,若索引中无记录则新增,存在则更新;

4、文档批量索引要比单个索引快很多,不过这也取决于文档的大小及复杂程度,索引及搜索的负载以及系统可用的资源;

$ curl-H"Content-Type: application/json"-XPOST"http://127.0.0.1:9200/bank/_bulk?pretty&refresh"--data-binary"@accounts.json"

5、默认查询仅返回前10条记录,若想指定返回条数,指定参数from和size;

GET /bank/_search
{
"query": {
"match_all": {}
  },
"sort": [
    {
"account_number": {
"order": "desc"      }
    }
  ],
"from": 0,
"size": 20}

6、若想查询指定的字典值,可以使用match语句,指定单个单词;若想查询词组的话,可以使用match_phase;若想构造更复杂的查询的话,可以使用bool查询,其中可以指定必须满足条件(must match),可满足条件(should match),必须不满足(must not match);

7、must/should/must_not在bool查询中作为查询子句,其中must或should查询子句会贡献文档查询相关分数,而must_not只作为查询过滤条件,不参与文档分数评估;除此之外,bool查询中还可以直接使用过滤器查询;

8、聚合函数可以组合成更复杂的查询语句,实现更复杂的统计功能;

9、可以使用terms聚合的内嵌聚合结果进行排序来取代针对结果的sort排序;

10、Es启动时可以指定以守护进程启动并记录pid,同时也可在启动时指定环境参数;

$ ./bin/elasticsearch -d-p pidfile
$ ./bin/elasticsearch -d-Ecluster.name=my_cluster -Enode.name=node_1

11、Es中配置的三个位置:elasticsearch.yml、jvm.options、log4j2.properties;

12、Es关键配置参数:

1)、path.data和path.logs

2)、cluster.name

3)、node.name

4)、network.host

13、线程池:Es针对不同的操作使用多种线程池进行处理;

相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
目录
相关文章
|
6月前
|
JSON 自然语言处理 Java
Java原生操作Elasticsearch
Java原生操作Elasticsearch
144 0
|
6月前
|
安全 大数据 API
elasticsearch|大数据|elasticsearch的api部分实战操作以及用户和密码的管理
elasticsearch|大数据|elasticsearch的api部分实战操作以及用户和密码的管理
292 0
|
1月前
|
存储 分布式计算 大数据
大数据-169 Elasticsearch 索引使用 与 架构概念 增删改查
大数据-169 Elasticsearch 索引使用 与 架构概念 增删改查
57 3
|
20天前
|
测试技术 API 开发工具
ElasticSearch核心概念:倒排索引
ElasticSearch核心概念:倒排索引
50 6
|
1月前
|
JSON 关系型数据库 API
ElasticSearch 的概念解析与使用方式(二)
ElasticSearch 的概念解析与使用方式(二)
25 1
|
1月前
|
存储 搜索推荐 Java
ElasticSearch 的概念解析与使用方式(一)
ElasticSearch 的概念解析与使用方式(一)
58 1
|
3月前
|
存储 运维 搜索推荐
运维开发.索引引擎ElasticSearch.倒序索引的概念
运维开发.索引引擎ElasticSearch.倒序索引的概念
52 1
|
5月前
|
JSON DataWorks 关系型数据库
DataWorks操作报错合集之同步Elasticsearch数据报错:Cat response did not contain a JSON Array,是什么导致的
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
|
4月前
|
监控 搜索推荐 Go
万字详解!在 Go 语言中操作 ElasticSearch
本文档通过示例代码详细介绍了如何在Go应用中使用`olivere/elastic`库,涵盖了从连接到Elasticsearch、管理索引到执行复杂查询的整个流程。
99 0
|
6月前
|
Kubernetes 关系型数据库 MySQL
实时计算 Flink版产品使用合集之在Kubernetes(k8s)中同步MySQL变更到Elasticsearch该怎么操作
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStreamAPI、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。