Elasticsearch 字段别名 field-alias-阿里云开发者社区

Elasticsearch 字段别名 field-alias

2024-02-20 298

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Elasticsearch 字段别名 field-alias

环境

Elasticsearch 8.1
Kibana 8.1
MacOS 10.14.6

简介

首先我们还是先了解一下，什么是字段别名？大家可能听说过索引别名，通过索引的别名可以轻松的切换所需的数据来源与哪一个索引，那么什么是字段别名呢？所谓字段别名，就是索引mapping定义时的备用字段，通过字段别名可以替换搜索请求中的目标字段，字段别名可以用于搜索，排序，聚合，高亮，docvalue_fields，stored_fields，suggestions，下面我们一起来看一下字段别名的详细使用过程

使用

定义字段别名规范

必须是一个明确的字段，不能是一个对象或者指向另一个字段别名
在创建字段别名时，字段别名指向的目标字段必须已经存在
如果定义了嵌套的对象，则字段别名必须具有同样的嵌套范围

字段别名只能指向一个字段，不能同时指向多个字段；

但是可以通过修改mapping中的字段别名设置指向另一个新字段

不支持使用字段别名的API

首先是不能在写入数据的时候使用字段别名，因为本身字段别名是虚拟的，不存在的，所以不支持写入，同样也不能用于 copy_to
因为字段的别名是不存在 _source中的，所以搜索请求时的过滤字段也是不会生效的

测试

创建索引，定义字段别名
其中创建了索引blog1和blog2,各自定义了两个字段别名public_count和public_content,在blog1索引中，public_count指向doc.count,public_content指向doc.content;在blog2索引中，public_count指向doc_count,public_content指向doc_content;

PUT blog1
{
  "mappings": {
    "properties": {
      "doc": {
        "properties": {
          "count": {
            "type": "long"
          },
          "content": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword"
              }
            }
          }
        }
      },
      "creater": {
        "type": "keyword"
      },
      "public_count": {
        "type": "alias",
        "path": "doc.count"
      },
      "public_content": {
        "type": "alias",
        "path": "doc.content"
      }
    }
  }
}
PUT blog2
{
  "mappings": {
    "properties": {
      "doc_count": {
        "type": "long"
      },
      "doc_content": {
        "type": "text",
        "fields": {
          "keyword": {
            "type": "keyword"
          }
        }
      },
      "creater": {
        "type": "keyword"
      },
      "public_count": {
        "type": "alias",
        "path": "doc_count"
      },
      "public_content": {
        "type": "alias",
        "path": "doc_content"
      }
    }
  }
}

插入测试数据

POST _bulk
{ "index":{"_index":"blog1","_id":"1"}}
{"creater":"zuiyu1","doc.count":"100","doc.content":"zuiyu elasticsearch "}
{ "index":{"_index":"blog1","_id":"2"}}
{"creater":"zuiyu2","doc.count":"200","doc.content":"zuiyu vue"}
{ "index":{"_index":"blog1","_id":"3"}}
{"creater":"zuiyu3","doc.count":"300","doc.content":"java demo"}
{ "index":{"_index":"blog1","_id":"4"}}
{"creater":"zuiyu4","doc.count":"300","doc.content":"java demo plus"}
{ "index":{"_index":"blog1","_id":"5"}}
{"creater":"zuiyu5","doc.count":"300","doc.content":"java pro and elasticsearch"}
{ "index":{"_index":"blog2","_id":"1"}}
{"creater":"zuiyu1","doc_count":"10","doc_content":"醉鱼ES小白入门课"}
{ "index":{"_index":"blog2","_id":"2"}}
{"creater":"zuiyu2","doc_count":"550","doc_content":"醉鱼前端 vue 小白入门课"}
{ "index":{"_index":"blog2","_id":"3"}}
{"creater":"zuiyu3","doc_count":"60","doc_content":"醉鱼java小白入门课"}
{ "index":{"_index":"blog2","_id":"4"}}
{"creater":"zuiyu4","doc_count":"60","doc_content":"醉鱼MySQL8.0小白入门课"}
{ "index":{"_index":"blog2","_id":"5"}}
{"creater":"zuiyu5","doc_count":"60","doc_content":"醉鱼Redis小白入门课"}

搜索测试、聚合、排序、高亮、建议目标是实现搜索索引blog1和blog2中content内容中包含java的文档,因为两个索引的mapping结构完全不一样，所以使用定义的相同名称的public_count和public_content

聚合
使用public_count字段搜索索引blog1和blog2中public_count 大于100的文档，对public_count进行聚合分桶

GET blog*/_search?size=0
{
  "query": {
    "range": {
      "public_count": {
        "gte": 100
        }
    }
  },
  "aggs": {
    "all_agg": {
      "terms": {
        "field": "public_count"
      }
    }
  }
}

排序
使用public_count字段搜索索引blog1和blog2中public_count结果大于100的文档,对public_count进行降序输出

GET blog*/_search
{
  "query": {
    "range": {
      "public_count": {
        "gte": 100
        }
    }
  },
  "sort": [
    {
      "public_count": {
        "order": "desc"
      }
    }
  ]
}

高亮
使用public_content字段搜索索引blog1和blog2中包含java的，高亮输出，结果前后加上em标签

GET blog*/_search
{
  "query": {
    "wildcard": {
      "public_content": {
        "value": "*java*"
      }
    }
  },
  "highlight": {
    "fields": {
      "public_content": {
        "pre_tags": [
          "<em>"
        ],
        "post_tags": [
          "</em>"
        ]
      }
    }
  }
}

建议
使用public_count字段搜索索引blog1和blog2中搜索public_content中包含java的文档，输入一个错误单词jave,建议返回java

GET blog*/_search
{
  "query": {
    "wildcard": {
      "public_content": {
        "value": "*java*"
      }
    }
  },
  "suggest": {
    "YOUR_SUGGESTION": {
      "text": "jave",
      "term": {
        "field": "public_content"
      }
    }
  }
}

_source测试
使用_source测试返回字段public_count，public_content，因为字段别名是虚拟的，所以此时是没有返回结果的

GET blog*/_search
{
  "query": {
    "wildcard": {
      "public_content": {
        "value": "*java*"
      }
    }
  },
  "_source": [
    "public_count",
    "public_content"
  ]
}

使用docvalue_fields请求字段获取

GET blog*/_search
{
  "query": {
    "wildcard": {
      "public_content": {
        "value": "*java*"
      }
    }
  },
   "docvalue_fields": [
    "public_count"
  ]
}

使用场景

简单总结一下字段别名的使用场景：

文中的例子，可以对同一个人在不同博客网站上写的内容进行统计
获取采集的日志信息，不同的数据源，索引的日志mapping不一样，统计时就可以使用字段别名进行统一的统计

Elasticsearch 字段别名 field-alias

环境

简介

使用

定义字段别名规范

不支持使用字段别名的API

测试

使用场景

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Elasticsearch 字段别名 field-alias

环境

简介

使用

定义字段别名规范

不支持使用字段别名的API

测试

使用场景

热门文章

最新文章

相关课程

相关电子书