分析你的数据-阿里云开发者社区

分析你的数据

2023-05-13 92

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

检索分析服务 Elasticsearch 版，2核4GB开发者规格 1个月

简介： 分析你的数据

分析你的数据分析你的数据分析你的数据
Elasticsearch聚合使您能够构建复杂的数据总结，并洞察关键指标、模式和趋势。不只是寻找众所周知的“大海捞针”，聚合使您能够回答这样的问题:

How many needles are in the haystack?
What is the average length of the needles?
What is the median length of the needles, broken down by manufacturer?
How many needles were added to the haystack in each of the last six months?
您还可以使用聚合来回答更微妙的问题，例如

What are your most popular needle manufacturers?
Are there any unusual or anomalous clumps of needles?
因为聚合利用了用于搜索的相同数据结构，所以它们也非常快。这使您能够实时分析和可视化数据。您的报告和仪表板会随着数据的更改而更新，因此您可以根据最新的信息采取行动。

What’s more, aggregations operate alongside search requests. You can search documents, filter results, and perform analytics at the same time, on the same data, in a single request. And because aggregations are calculated in the context of a particular search, you’re not just displaying a count of all size 70 needles, you’re displaying a count of the size 70 needles that match your users' search criteria—for example, all size 70 non-stick embroidery needles

可伸缩性和弹性: 集群、节点和分片
Elasticsearch始终可用，并可根据您的需求进行扩展。它通过自然分配来做到这一点。您可以将服务器(节点)添加到集群中以增加容量，Elasticsearch会自动将您的数据和查询负载分布到所有可用的节点上。Elasticsearch不需要彻底检查应用程序，它知道如何平衡多节点集群以提供规模化和高可用性。节点越多越快乐

这是如何工作的呢?实际上，Elasticsearch索引只是一个或多个物理碎片的逻辑分组，其中每个碎片实际上是一个自包含的索引。通过将索引中的文档分布到多个分片上，并将这些分片分布到多个节点上，Elasticsearch可以确保冗余，既可以防止硬件故障，又可以随着节点添加到集群中而增加查询容量。随着集群的增长(或收缩)，Elasticsearch会自动迁移碎片来重新平衡集群

有两种类型的分片:基本分片和复制分片。索引中的每个文档都属于一个主分片。复制分片是主分片的副本。副本提供数据的冗余副本，以防止硬件故障，并增加服务读取请求(如搜索或检索文档)的容量。

索引中主分片的数量在索引创建时是固定的，但是复制分片的数量可以在不中断索引或查询操作的情况下随时改变。

作者：我_976b
链接：https://www.jianshu.com/p/a74f29b753b3
来源：简书
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

相关实践学习

使用阿里云Elasticsearch体验信息检索加速

通过创建登录阿里云Elasticsearch集群，使用DataWorks将MySQL数据同步至Elasticsearch，体验多条件检索效果，简单展示数据同步和信息检索加速的过程和操作。

ElasticSearch 入门精讲

ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示，Elasticsearch是最受欢迎的企业搜索引擎，其次是Apache Solr（也是基于Lucene）。 ElasticSearch的实现原理主要分为以下几个步骤：用户将数据提交到Elastic Search 数据库中通过分词控制器去将对应的语句分词，将其权重和分词结果一并存入数据当用户搜索数据时候，再根据权重将结果排名、打分将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索，具有接近实时的搜索，并支持多租户。

分析你的数据

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

分析你的数据

热门文章

最新文章

相关课程

相关电子书

相关实验场景