带你读《Elastic Stack 实战手册》之45：——3.5.4.Graph （下）-阿里云开发者社区

带你读《Elastic Stack 实战手册》之45：——3.5.4.Graph （下）

2023-05-25 385

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 带你读《Elastic Stack 实战手册》之45：——3.5.4.Graph （下）

《Elastic Stack 实战手册》——三、产品能力——3.5 进阶篇——3.5.4.Graph （上） https://developer.aliyun.com/article/1228725

Elasticsearch 的实现方式

Elasticsearch 的 Graph 功能始于 5.5 版本，属于 X-pack 的扩展功能组，从 API 的路径

/_graph/explore 可以看出，其定位更倾向于是探索分析，即在已有的索引上通过聚合的方式进行分析。

常规的 graph 查询可以理解为，先进行两层嵌套的 terms 聚合，再将查询结果以 vertexs 和connections 的数据模型进行返回。

在使用 Graph 功能时，有3个核心要素，分别是 vertices、connections、controls，前两者主要用于确定图查询中，前者通过哪些字段产生，后者用于控制一些查询细节。

如希望通过点击日志探查用户的搜索词和点击的产品间的关联，可通过如下查询

POST clicklogs/_graph/explore
{
  "query": {                  
    "match": {
      "query.raw": "midi"
    }
  },
  "vertices": [               
    {
      "field": "product"
    }
  ],
  "connections": {            
    "vertices": [
      {
        "field": "query.raw"
      }
    ]
  }
}

查询语句中

l vertices 用于指定对哪些字段的内容感兴趣，后续会作为 target 节点处理，对应的字段必须是已索引的字段。

l connections 用于指定希望哪些字段和 vetices 的内容进行关联，后续会作为 source 节点处理，connections 也支持使用 query 缩小关联内容的范围。

这个查询会以聚合的方式得到最终结果，会产生类似两层嵌套 aggs 的查询效果

"aggs": {
"vertices": {
 "terms": {
        "field": "product"
      },
      "aggs": {
        "connections": {
          "terms": {
            "field": "query.raw"
          }
        }
      }
        }
  }

查询结果会返回 vertices 和 connections 两个数组，通过这两部分数据，即可构成一个有向图（方向是由 connections 中设定的 query.raw 指向 vertices 中设定的 product）。

为了能更直观的反映每个节点，和每条边的重要程度，vertices 和 connections 的元素中均会额外返回一个 weight，这点也是 Elasticsearch Graph 区别于其他图数据库查询的功能点之一。

"vertices": [ 
      {
         "field": "query.raw",
         "term": "midi cable",
         "weight": 0.08745858139552132,
         "depth": 1
      },
      {
         "field": "product",
         "term": "8567446",
         "weight": 0.13247784285434397,
         "depth": 0
               }
],
"connections": [ 
      {
         "source": 0,
         "target": 1,
         "weight": 0.04802242866755111,
         "doc_count": 13
      }
]