阿里云ACE共创空间——大数据方案体验2 Elasticsearch

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介:

从阿里云的官方文档中先查看了下Elasticsearch这个产品的特点:

特点及优势

  • 分布式的实时文件存储,每个字段都被索引并可被搜索
  • 分布式的实时分析搜索引擎
  • 商业版X-pack插件,提供企业级权限管控、实时系统监控等强大服务
  • 可弹性扩展到上百台服务器规模,处理PB级结构化或非结构化数据
  • 支持IK analyzer插件
  • Elastic官方技术支持团队7*24小时技术支持

预置插件

阿里云Elasticsearch预置插件如下(包含但不完全包含):

  • IK Analyzer:IK Analyzer是一个开源的,基于java语言开发的中文分词工具包。是开源社区中处理中分分词非常热门的插件。

  • pinyin Analyzer:拼音分词器。

  • Smart Chinese Analysis Plugin:lucene默认的中文分词器。

  • ICU Analysis plugin:lucene自带的ICU分词,ICU是一套稳定、成熟、功能强大、轻便易用和跨平台支持Unicode 的开发包。

  • Japanese (Kuromoji) Analysis plugin:日文分词器。

  • Mapper Attachments Type plugin:附件类型插件,通过tika库将各种类型格式解析成字符串。


归纳下这个产品的几个特点供之后的试验中参考,这个产品最重要的特点是分布式和实时,在这个基础上可以做字段的搜索任务,搜索任务中的分词功能通过预置的插件完成的,按文档的说明目前支持中文、拼音和日文。因为实时是这个产品的重点所以对弹性的要求比较高,在之后的试验中也关注下这个弹性可以怎么配置。


进入管理控制台后首先需要创建实例,这个创建的过程和ECS非常类似,但是有个别地方还是有些区别,梳理了下整个实例创建过程如下:

1、付费方式:预付费和后付费,其中预付费方式只支持包月,和ECS不同。

2、地域和可用区的选择:按照自己的需求选择地域和可用区,不同的地域的费用可能会有不同。

3、X-Pack版本:按照文档对此产品的说明,商业版X-pack插件是提供企业级权限管控、实时系统监控等服务的插件,是本产品的核心插件,所以有两个版本可以供选择。

4、网络类型:只支持专用网络,也就是经典网络的架构方式是不支持的。既然是VPC下就需要选择虚拟交换机。

5、在实例挂载的数据盘选择上大部分的地域都能够选择云盘型和本地SATA盘型,仅有部分区域支持本地SSD盘。

6、实例的规格上有很多种可以选择,性能从低到高,但是目前1核2G规格的实例不提供售后保障,只能支持测试,不建议用于生产。

7、在实例的选择上可以选择专有主节点和协调节点来满足弹性需求,并且专有主节点和协调节点的实例规格可以不一样。

8、在存储方面只能选择云盘存储的方式,默认是SSD云盘,也可以选择高效云盘,根据IOPS可能的实际情况来进行选择。

9、按量付费的计算方式是按照小时来进行收费,收费根据地域、实例规格、存储、协调节点的数量而有差异。

相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
目录
相关文章
|
3月前
|
人工智能 数据管理 Serverless
阿里云数据库走向Serverless与AI驱动的一站式数据平台具有重大意义和潜力
阿里云数据库走向Serverless与AI驱动的一站式数据平台具有重大意义和潜力
410 2
|
3月前
|
人工智能 运维 Cloud Native
、你如何看待阿里云数据库走向Serverless与AI驱动的一站式数据平台?
、你如何看待阿里云数据库走向Serverless与AI驱动的一站式数据平台?
150 2
|
3月前
|
存储 数据可视化 数据管理
基于阿里云服务的数据平台架构实践
本文主要介绍基于阿里云大数据组件服务,对企业进行大数据平台建设的架构实践。
748 2
|
14天前
|
分布式计算 大数据 BI
MaxCompute产品使用合集之MaxCompute项目的数据是否可以被接入到阿里云的Quick BI中
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
14天前
|
分布式计算 大数据 MaxCompute
MaxCompute产品使用合集之使用pyodps读取OSS(阿里云对象存储)中的文件的步骤是什么
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
3月前
|
人工智能 数据管理 大数据
阿里云数据库走向Serverless与AI驱动的一站式数据平台是一个很有前景和意义的发展方向
阿里云数据库走向Serverless与AI驱动的一站式数据平台是一个很有前景和意义的发展方向
38 2
|
5天前
|
API 索引
近期,几个典型 Elasticsearch 8.X 问题及方案探讨
近期,几个典型 Elasticsearch 8.X 问题及方案探讨
23 3
|
6天前
|
存储 API 索引
Elasticsearch 8.X 防止 Mapping “爆炸”的三种方案
Elasticsearch 8.X 防止 Mapping “爆炸”的三种方案
13 0
|
6天前
|
存储 分布式计算 关系型数据库
Elasticsearch 8.X 导出 CSV 多种方案,一网打尽!
Elasticsearch 8.X 导出 CSV 多种方案,一网打尽!
10 0
|
6天前
|
存储 数据可视化 数据建模
阿里云大佬叮嘱我务必要科普这个 Elasticsearch API
阿里云大佬叮嘱我务必要科普这个 Elasticsearch API
13 0

热门文章

最新文章