使用阿里云Elasticsearch体验信息检索加速

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。

使用阿里云Elasticsearch体验信息检索加速


1. 创建资源

开始实验之前,您需要先创建Elasticsearch集群资源。

  1. 在实验室页面,单击创建资源
  2. (可选)在实验室页面左侧导航栏中,单击云产品资源列表,可查看本次实验资源相关信息(例如IP地址、用户信息等)。

说明:Elasticsearch集群资源创建过程需要30分钟,请您耐心等待。

2. 登录集群

  1. 双击打开远程桌面的Chromium网页浏览器
  2. 在RAM用户登录框中单击下一步,并复制粘贴页面左上角的子用户密码用户密码输入框,单击登录
  3. 复制下方地址,在Chromium网页浏览器打开新页签,粘贴并访问Elasticsearch控制台。
https://elasticsearch-cn-hangzhou.console.aliyun.com
  1. 在左侧导航栏中,单击Elasticsearch实例

  1. Elasticsearch实例页面,切换到华东2(上海)地域,找到云产品资源列表中的Elasticsearch实例。

说明:本实验资源区域限定为华东2(上海)

说明:本次实验已开通阿里云Elasticsearh 5.5.3 版本,仅做本次场景体验使用,如需作为测试环境或生产环境使用,可选择其他更高版本。

3. 登录Kibana,开启自动创建索引功能

  1. Elasticsearch实例页面,单击实例ID

说明:请选择云起实验室为您提供的Elasticsearch实例资源。

  1. 在左侧导航栏,选择配置与管理 > 可视化控制

  1. 在Kibana区域中,单击公网入口

复制左侧云产品资源列表下的Elasticsearch登录名Elasticsearch登录密码,至Kibana登录页面的账号和密码,单击登录

在左侧导航栏,单击Dev Tools(开发工具),再单击Go to work

  1. Console页签下,执行如下命令,开启阿里云ES实例的自动创建索引功能
PUT _cluster/settings
{
"persistent": {
"action.auto_create_index": "true" 
}
}

开启成功后,结果如下。

{
  "acknowledged" : true,
  "persistent" : {
    "action" : {
      "auto_create_index" : "true"
    }
  },
  "transient" : { }
}


4. 通过DataWorks将MySQL数据同步至ES

  1. 复制如下阿里云DataWorks控制台地址至浏览器地址栏,登录DataWorks控制台。
https://dataworks.console.aliyun.com/overview
  1. 在左侧导航栏,单击工作空间列表

  1. 工作空间列表页面,切换到华东2(上海)地域,找到目标工作空间,单击其右侧操作列下的进入数据集成

说明:您可在云产品资源列表中查看DataWorks的项目名称和地域。

  1. 数据集成首页,单击页面右上方的 图标。

  1. 在左侧导航栏中,单击数据源管理

  1. 数据源管理页面,单击新增数据源

  1. 新增数据源对话框中,单击MySQL

  1. 新增MySQL数据源对话框中,配置如下数据源信息

配置项

示例

说明

数据源类型

连接串模式

不可更改

数据源名称

mysql_data

可自定义

JDBC URL

jdbc:mysql://rm-uf60a5s3bhvj7c700eo.mysql.rds.aliyuncs.com:3306/mysql_data

不可更改

用户名

zltest

不可更改

密码

Elastic@123

不可更改

  1. 在资源组选项中,单击更多选项,在警告对话框单击确定

  1. 配置完成后,单击测试连通性,可与公共资源组进行连通性测试。 连通状态显示为可连通时,表示连通成功,再单击完成

  1. 使用同样的方式添加Elasticsearch数据源,配置数据源信息

配置项

示例

说明

数据源类型

连接串模式

不可更改

数据源名称

elasticsearch

可自定义

Endpoint

http://es-cn-*****************.public.elasticsearch.aliyuncs.com:9200

下划线处为ES公网地址,请进入Elasticsearch管理控制台,从Elasticsearch实例 > 基本信息复制

用户名

Elasticsearch登录名

不可更改

密码

Elasticsearch登录密码

不可更改

  1. 在资源组选项中,单击更多选项

  1. 配置完成后,单击测试连通性,可与公共资源组进行连通性测试。 连通状态显示为可连通时,表示连通成功,再点击完成

  1. 在左侧滑出窗口,单击DataStudio(数据开发)

  1. 在DataWorks的数据开发页面,右键业务流程,单击新建业务流程

  1. 在新建业务流程对话框,输入业务名称,单击新建

  1. 展开新建的业务流程,右键数据集成,选择新建节点>离线同步

  1. 在新建节点对话框中,输入节点名称(可自定义),单击提交

  1. 配置同步网络链接页面,分别配置数据来源数据去向,配置如下所示,然后单击下一步

说明:如果在配置离线同步节点时,您的配置页面跟下图显示不一样,请您关闭浏览器,重新登录并访问DataWorks控制台。

  1. 配置任务页面,在数据来源区域中选择表chinese_news,在数据去向区域中单击一键生成目标索引

  1. 完成如下配置,单击新建索引

  1. 配置任务页面,在数据来源区域中,单击无主键,然后单击下一步

  1. 配置调度页面,在时间属性区域中,实例生成方式选择发布后即时生成重跑属性选择运行成功或失败后皆可重跑,在调度依赖区域中,依赖的上游节点选择使用工作空间根节点,然后单击完成配置

  1. 提交任务。
  1. 单击图标,提交当前配置,并单击图标,运行任务。

  1. 任务运行过程中,可查看运行日志。运行成功后,显示如下结果。


5. 登录Kibana,体验信息检索加速

  1. 返回Kibana页面
  2. 在左侧导航栏,单击Dev Tools(开发工具)

  1. 复制如下代码
GET chinese_news/_search
{
  "query": {
    "bool": {
      "must": [
        {"match_phrase": {
          "content": "两个一百年"
        }
        },
        {
          "match_phrase":{
            "headline": "新华社长篇通讯"
          }
          }
      ],
      "filter": {
        "range": {
       "date": {
        "gte": "2017-01-18",
        "lte": "2022-12-18",
        "format": "yyyy-MM-dd"
      }
    }
      }
    }
  },
  "highlight" : {
        "fields" : {
            "content" : {}
        }
    }
}
  1. Console页签下,粘贴上一步的代码,执行命令,检索同时满足如下3个条件的新闻。
  1. 内容包含两个一百年,标题包含新华社长篇通讯的新闻;
  2. 过滤2017-01-182022-12-18期间的新闻;
  3. 对内容中匹配到的词高亮展示。

完成检索后,返回如下结果。

  1. 在左侧导航栏,单击Management

  1. 根据下图配置index pattern,单击Create

  1. 在左侧导航栏,单击Discover

  1. 在页面左上角单击Add a filter+,再单击Edit Query DSL

  1. Filter输入第3步中复制的命令,删除其中的如下命令,单击Save
GET chinese_news/_search

  1. 单击右上角时间范围,选择Last 5 years,即展示可视化检索的新闻数据。


6. 更多技术交流咨询,欢迎扫码入群

扫码入群,参与Elasticsearch技术交流


实验链接:https://developer.aliyun.com/adc/scenario/4ea641d7eca44034932eebeecfb087aa

相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
1月前
|
存储 监控 算法
|
17小时前
|
自然语言处理 搜索推荐
在Elasticsearch 7.9.2中安装IK分词器并进行自定义词典配置
在Elasticsearch 7.9.2中安装IK分词器并进行自定义词典配置
7 1
|
1天前
|
Java API 索引
必知的技术知识:Elasticsearch和Kibana安装
必知的技术知识:Elasticsearch和Kibana安装
|
2天前
|
存储 监控 搜索推荐
在生产环境中部署Elasticsearch:最佳实践和故障排除技巧——安装篇(一)
在生产环境中部署Elasticsearch:最佳实践和故障排除技巧——安装篇(一)
|
15天前
|
网络协议 Java
elasticsearch7.1 安装启动报错
elasticsearch7.1 安装启动报错
15 1
|
15天前
|
自然语言处理 数据可视化 Linux
ElasticSearch安装ik分词器_使用_自定义词典
ElasticSearch安装ik分词器_使用_自定义词典
16 1
|
15天前
Elasticsearch安装配置文件
Elasticsearch安装配置文件
15 0
|
15天前
|
安全
【Elasticsearch6】安装笔记
【Elasticsearch6】安装笔记
14 2
|
16天前
|
存储 自然语言处理 网络协议
【elastic search】下载安装、使用教程
【elastic search】下载安装、使用教程
22 1
|
21天前
|
存储 安全 数据管理
如何在 Rocky Linux 8 上安装和配置 Elasticsearch,帮助你快速搭建起这个强大的工具
【6月更文挑战第7天】本文档详细介绍了如何在Rocky Linux 8上安装和配置Elasticsearch,首先通过添加Elasticsearch仓库并使用yum安装。接着,配置Elasticsearch,包括修改`elasticsearch.yml`、设置内存和文件描述符,以及可选的安全设置。启动Elasticsearch后,通过验证日志和测试连接确保其正常运行。文章还列举了常见问题及解决方法,如启动失败、内存不足和网络问题。按照这些步骤,用户可以在Rocky Linux 8上成功部署Elasticsearch,为数据管理与分析提供强大支持。
35 5

相关产品

  • 检索分析服务 Elasticsearch版