Elasticsearch——Rest API中的常用用法

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介:

本篇翻译的是Elasticsearch官方文档中的一些技巧,是使用Elasticsearch必不可少的必备知识,并且适用于所有的Rest Api。

返回数据格式化

当在Rest请求后面添加?pretty时,结果会以Json格式化的方式显示。另外,如果添加?format=yaml结果会以树的形式显示,默认都是Flase.

449064-20160321210915698-1840639997.png

返回数据的易读性

结尾添加?human=true,返回的数据会有很好的可读性,比如:

  • time:3600 会显示为 time:1h
  • size:1024 会显示为 1kb

常用的Date Math

在Elasticsearch中日期数学表达式是很常用的,在查询中经常会通过它来作为检索条件,比如range或者daterange。表达式通常会有下面几种操作:

  • +1h ,表示加上一个一个小时
  • -1d,表示减去一天
  • /d,表示向一天取整

支持的单位也很多,比如

  • y,代表一年
  • M,代表一个月
  • w,代表一周
  • d,代表一天
  • h,代表一个小时
  • m,代表一分钟
  • s,代表一秒钟
  • ms,代表毫秒

举个例子:

  • now+1h,表示当前时间加上一个小时,即一个小时后
  • now+1h+1m,表示当前时间加上一个小时零一分钟,即一个小时一分钟后
  • now+1h/d,表示当前时间加上一个小时,并向一天取整。
  • 2015-01-01||+1M/d,2015-01-01加上一个月,并向一天取整

返回的内容过滤

有时候我们可能并不想返回所有的数据,因为这样会浪费一定的空间和时间,因此需要对查询返回的结果进行过滤。所有的API都接受一个参数——filter_path,这个参数支持逗号分隔,可以同时填写多个值。

例如,如果只想要返回查询的时间、事件的id和分值,可以像下面这样:

curl -XGET 'localhost:9200/_search?pretty&filter_path=took,hits.hits._id,hits.hits._score'
{
  "took" : 3,
  "hits" : {
    "hits" : [
      {
        "_id" : "3640",
        "_score" : 1.0
      },
      {
        "_id" : "3642",
        "_score" : 1.0
      }
    ]
  }
}

也支持*来忽略对某个字段的过滤:

curl -XGET 'localhost:9200/_nodes/stats?filter_path=nodes.*.ho*'
{
  "nodes" : {
    "lvJHed8uQQu4brS-SXKsNA" : {
      "host" : "portable"
    }
  }
}

使用**则会忽略最大长度的路径,与Spring MVC的Url匹配差不多。

curl 'localhost:9200/_segments?pretty&filter_path=indices.**.version'
{
  "indices" : {
    "movies" : {
      "shards" : {
        "0" : [ {
          "segments" : {
            "_0" : {
              "version" : "5.2.0"
            }
          }
        } ],
        "2" : [ {
          "segments" : {
            "_0" : {
              "version" : "5.2.0"
            }
          }
        } ]
      }
    },
    "books" : {
      "shards" : {
        "0" : [ {
          "segments" : {
            "_0" : {
              "version" : "5.2.0"
            }
          }
        } ]
      }
    }
  }
}

注意,elasticsearch一般会直接返回一条数据的原始信息,即_source字段。如果要对_source进行过滤,可以参考下面的用法:

curl -XGET 'localhost:9200/_search?pretty&filter_path=hits.hits._source&_source=title'
{
  "hits" : {
    "hits" : [ {
      "_source":{"title":"Book #2"}
    }, {
      "_source":{"title":"Book #1"}
    }, {
      "_source":{"title":"Book #3"}
    } ]
  }
}

扁平化

设置flat_settings 为true,会以扁平化的方式返回数据:

{
  "persistent" : { },
  "transient" : {
    "discovery.zen.minimum_master_nodes" : "1"
  }
}

关于参数

在Elastcisearch的使用中,往往要接触到各种数据类型。如果某个字段设置了固定的类型,那么当执行查询或者索引时,一些数据会发生自动的类型转换。

Boolean

在Es中,false、no、0、off这些值都代表false,其他的值都是true.

Number

所有的API都支持以字符串的方式代表JSON中的数字类型。

Date

支持的类型上面都说过了...

Geo

Geo类型主要用于地图一类的数据,这里就先不介绍了。使用方法可以参考

模糊查询

有的时候一些需要允许一定的模糊度,比如检索hallo可以查询到hello,这就要支持模糊查询。模糊查询可以使用fuzziness参数,它有点像range:

-fuzziness <= fieldValue <= +fuzziness

并且可以设置一定的模糊度,比如:

比如,长度为:

  • 0..2,必须完全匹配
  • 3..5,可以有一个编辑距离的模糊度
  • >5,可以有两个编辑距离的模糊度

返回结果——驼峰式

所有的API都接受一个case参数,如果设置为camelCase,那么所有的名称都会以驼峰式的形式返回。

查询的请求体

除了POST请求外,其他的请求时没有请求体的。这个时候如果要执行查询,可以把参数放在Url后面。

参考

官方文档
编辑距离,wiki百科

本文转自博客园xingoo的博客,原文链接:Elasticsearch——Rest API中的常用用法,如需转载请自行联系原博主。

相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
25天前
|
JSON API 开发工具
【Azure 应用服务】调用Azure REST API来获取 App Service的访问限制信息(Access Restrictions)以及修改
【Azure 应用服务】调用Azure REST API来获取 App Service的访问限制信息(Access Restrictions)以及修改
|
26天前
|
存储 API 网络架构
【Azure 存储服务】调用REST API获取Stroage Account Table中所有的Entity计数 -- Count
【Azure 存储服务】调用REST API获取Stroage Account Table中所有的Entity计数 -- Count
|
25天前
|
存储 JSON API
【Azure 存储服务】使用REST API操作Azure Storage Table,删除数据(Delete Entity)
【Azure 存储服务】使用REST API操作Azure Storage Table,删除数据(Delete Entity)
【Azure 存储服务】使用REST API操作Azure Storage Table,删除数据(Delete Entity)
|
19天前
|
XML 安全 API
REST 和 SOAP API 有什么区别?
【8月更文挑战第31天】
22 0
|
19天前
|
JSON API 数据安全/隐私保护
哇塞!Django REST framework 太逆天啦!构建 API 服务从未如此轻松,你还不来试试?
【8月更文挑战第31天】Django REST framework(DRF)是基于Django框架的高效Web API开发工具,提供序列化、视图集、路由等功能,简化API构建流程。使用DRF可轻松实现数据的序列化与反序列化,并支持权限管理和认证机制以保障API安全。安装DRF只需通过`pip install djangorestframework`命令。要创建基本项目,先安装Django并创建新应用,定义模型、序列化器及视图集,最后配置路由。测试API时,可通过Postman发送HTTP请求验证功能。无论项目大小,DRF均能提供强大支持。
23 0
|
24天前
|
中间件 API 网络架构
Django后端架构开发:从匿名用户API节流到REST自定义认证
Django后端架构开发:从匿名用户API节流到REST自定义认证
13 0
|
25天前
|
API 网络架构 C++
【Azure Key Vault】使用REST API调用Azure Key Vault Secret的示例步骤
【Azure Key Vault】使用REST API调用Azure Key Vault Secret的示例步骤
|
26天前
|
API 网络架构 开发者
【Azure 环境】调用Azure RunCommand 的REST API 设置虚拟机的环境变量(SetEnvironmentVariable)
【Azure 环境】调用Azure RunCommand 的REST API 设置虚拟机的环境变量(SetEnvironmentVariable)
|
26天前
|
API 网络架构
【Azure 环境】用 PowerShell 调用 AAD Token, 以及调用Azure REST API(如资源组列表)
【Azure 环境】用 PowerShell 调用 AAD Token, 以及调用Azure REST API(如资源组列表)
|
26天前
|
API 网络架构
【Azure Developer】如何通过Azure REST API 获取到虚拟机(VM)所使用的公共IP地址信息
【Azure Developer】如何通过Azure REST API 获取到虚拟机(VM)所使用的公共IP地址信息