阿里云双11访谈之Elasticsearch

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 阿里云宣布与Elastic公司建立了合作伙伴关系,并在云栖大会上联合发布阿里云Elasticsearch产品。在阿里云双11访谈Elasticsearch专场中,阿里云大数据Elasticsearch资深产品经理洪阳为大家简单介绍了阿里云Elasticsearch的基本情况,并且分享了阿里云Elasticsearch的优势以及在日志处理分析、搜索以及安全等领域实际应用。
摘要:阿里云宣布与Elastic公司建立了合作伙伴关系,并在云栖大会上联合发布阿里云Elasticsearch产品。在阿里云双11访谈Elasticsearch专场中,阿里云大数据Elasticsearch资深产品经理洪阳为大家简单介绍了阿里云Elasticsearch的基本情况,并且分享了阿里云Elasticsearch的优势以及在日志处理分析、搜索以及安全等领域实际应用。


双11第一波,红包领不停,点击看详情:https://promotion.aliyun.com/ntms/act/pre20171111.html


以下内容根据访谈视频整理而成。

阿里云Elasticsearch简介
阿里云Elasticsearch是阿里云投入了大量资源开发的重磅产品。在杭州云栖大会期间,阿里云与Elasticsearch官方进行了联合发布,在云栖大会上,Elasticsearch的创始人、Elastic 公司CEO Shay Banon也不远万里亲临现场与大家分享他与Elasticsearch共同经历的那段历史,他表示非常期待Elasticsearch社区能够在中国与阿里云碰撞出不同的火花。目前阿里云Elasticsearch产品已经正式商业化了,大家可以登录阿里云官方获取关于Elasticsearch的更详细信息。

接下来分享一下阿里云Elasticsearch的功能和特性。目前很多用户都在ECS上自建了Elasticsearch,与这种自建的方案相比,阿里云的Elasticsearch在刚开始定义这款产品的时候都没有打算更换新名字,最主要的原因就是希望能够基于Elasticsearch的一整套开源技术栈去实现云化处理,进而为用户提供服务。所以阿里云Elasticsearch产品的底层是与开源社区实现了完全匹配的,大家可以理解成与开源社区完全兼容。在此基础之上,阿里云Elasticsearch本身还提供了Kibana以及X-Pack这样商业化插件的预置,为了使用户的使用更加顺畅,还提供了像ik等的分词插件。因为在用户长期的使用过程当中,随着业务不断发展的过程往往会涉及到存储的弹性扩容的需求,阿里云Elasticsearch对于这些都基于阿里云的底层平台进行了处理,所以相对于自建而言,阿里云Elasticsearch在这些方面会节约了大量的运维和部署成本。同时,阿里云与Elasticsearch官方进行了战略合作,Elasticsearch官方会提供7*24小时的技术支持,所以相比于自建而言,阿里云Elasticsearch在售后方面也具有非常大的优势。总结而言,阿里云Elasticsearch产品有三个亮点:功能更加丰富、成本更加低廉、能够提供更多服务支持。

阿里云Elasticsearch产品在日志分析领域的应用
目前,无论是在国内还是国外,Elasticsearch的应用场景其实都是非常广的,很多中小型公司甚至一些大型的公司都在使用ELK框架,而ELK框架所解决的核心问题就是日志分析。大家在做日志分析的时候通常都会遇到几个比较棘手的问题,比如在日志收集和存储方面,一般而言像异构数据源太多,对接的数据搬迁任务比较重的时候也会涉及到很多的适配性问题,这也是比较痛苦的。而且ELK框架中的Logstash其实是可以做具有较高适配性的数据同步功能的,对于关系型数据库以及增量数据和离线数据的搬迁都是有非常好的支持的,包括与非常火的Hadoop之间也存在ES-Hadoop插件做双向的数据搬迁的工作,所以在这个方面Elasticsearch还是比较强大的。

此外,在日志处理上面还会涉及到搜索。对于日志搜索而言,Elasticsearch本身提供全文检索的能力是非常强大的。另外Elasticsearch还能够提供元数据或者指标搜索这样的功能。Elasticsearch本身还能够提供基于地理坐标的搜索能力,现在很多基于地图这部分的场景的搜索也是可以应用到的。在日志搜索之后还会有一些分析等的需求,一般而言,无论是使用Hadoop进行分析还是使用关系型数据库进行分析都是可以的,Elasticsearch的框架里面也提供了很多强大的聚合分析能力。在Elasticsearch 5.X版本中,X-Pack插件还提供了更为丰富的数据可视化以及机器学习的功能,在数据分析以及挖掘方面还是可以提供给大家很多能力的。除此之外,在日志分析的结果出来之后,对于查看权限以及安全管控部分,阿里云的Elasticsearch集成了X-Pack,并且还提供了一个RDBC模型的权限管控的能力。最后因为阿里云具有弹性伸缩的优势,用户不需要去关心业务增长过程当中去采购机器、采购节点再进行数据备份等繁琐的问题。总而言之,阿里云Elasticsearch的这些优点就刚好将日志分析场景下的诉求全部解决掉了。

阿里云Elasticsearch的实际落地
在像共享单车、共享汽车等这样的很多用户的业务场景中都会涉及到地理位置信息,比如每个用户消费的时候都会产生一些经纬度、路线以及支付方式等数据。一般情况下,大部分公司都会有一些诉求,希望看到某个区域内在某个时间点的数据是怎样的,那么Elasticsearch本身就可以去支持的。当这些数据归档到Elasticsearch中成为索引之后,无论是基于地理信息进行搜索还是进行全文匹配,还是基于关键字去做搜索最终形成一些聚合的数据报表出来都是非常方便的。

阿里云Elasticsearch在安全领域的应用
在安全领域,阿里云Elasticsearch也是在日志部分表现出非常强大的处理能力。在安全方面,一般分为事前的安全监控和预处理、事中的阻断侵入以及异常检测、事后的对于日志进行安全审计和有效信息的挖掘。我们可以使用Elasticsearch在事前监控一些端口,因为数据是实时的,所以可以进行实时的监控数据展现;在事中,使用Elasticsearch可以非常方便地实现安全事件分析和流量统计,并且能够非常迅速地给出反馈;在事后,还可以通过Elasticsearch对于安全日志进行审计检查以及搜索,还可以进行深度的挖掘和信息探查进而获得更好的结果反馈。所以Elasticsearch在安全领域也能够得到很好的利用。

阿里云Elasticsearch在搜索领域的应用
上面一直在谈论日志分析,其实大家都了解Elasticsearch也是一款搜索产品,其实在搜索场景下,Elasticsearch是一个老牌的服务,其全文检索的能力也是非常强大的。而阿里云的Elasticsearch携带了中文领域最火的ik分词,用户就可以基于这个分词插件做一些简单的中文的索引。接下来,阿里云Elasticsearch也会很快推出基于ik的自定义分词库,用户可以将专业场景的分词库预置到Elasticsearch里面去,获得更好的查询效果。

OpenSearch与Elasticsearch
提到全文检索,大家也都知道阿里云还有一款重磅产品叫做OpenSearch,这款产品是基于阿里巴巴淘系十多年来的搜索业务自己研发的产品。而很多用户都有一些困惑,就是如何在特定的场景下取舍OpenSearch和Elasticsearch。

其实OpenSearch和Elasticsearch这两款产品之间的定位虽然存在一定的重合,但是却不存在任何冲突。OpenSearch是阿里巴巴自研的,走的是阿里巴巴自己的技术栈,本身因为阿里巴巴主栈多年搜索经验的积累沉淀,OpenSearch会有很多比较优化的相关算法提供给用户,基于这些算法就能够使用户获得比较好的搜索结果。在未来的整体规划中,OpenSearch依然会在搜索场景上继续走下去,未来会提供一些个性化的搜索推荐,还会做一些相关行业的分词库提供给大家。而Elasticsearch产品的定位在日志分析和搜索,未来阿里云Elasticsearch会背靠生态在日志分析、挖掘以及可视化展现方面做更多的工作和努力,还会打通阿里云上的存储设备以及数据库产品之间数据的流通,更快地让阿里云上的客户的数据能够被Elasticsearch实现快速索引并提供服务。未来Elasticsearch也会在多可用区、服务稳定性、成本节约以及安全方面投入更多的精力,尽可能地降低用户的使用成本并提高使用体验和安全性。所以OpenSearch和Elasticsearch这两款产品之间并不会有很大的冲突。

阿里云Elasticsearch的“双11”特惠

目前阿里云Elasticsearch已经处于公开售卖阶段了,如果大家想要获得阿里云Elasticsearch这款产品可通过两个途径,一个是通过阿里云官网Elasticsearch服务页面,另外一个就是可以在阿里云大数据产品栏目中找到。在本次“双11”活动中,阿里云Elasticsearch也会为用户提供最大的优惠,请大家把握住本次机会。此外,因为阿里云与Elasticsearch官方达成了战略合作,未来也会邀请Elasticsearch资深专家为大家进行服务支持,并且也会举办技术培训等线下活动,具体情况请关注Elasticsearch产品的相关公告。


双11第一波,红包领不停,点击看详情:https://promotion.aliyun.com/ntms/act/pre20171111.html

相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
7月前
|
算法 索引
阿里云 Elasticsearch 使用 RRF 混排优化语义查询结果对比
Elasticsearch 从8.8版本开始,新增 RRF,支持对多种不同方式召回的多个结果集进行综合再排序,返回最终的排序结果。之前 Elasticsearch 已经分别支持基于 BM25 的相关性排序和向量相似度的召回排序,通过 RRF 可以对这两者的结果进行综合排序,可以提升排序的准确性。
1552 0
|
7月前
|
弹性计算 运维 监控
阿里云 Elasticsearch Serverless 全新发布,平均可省50%成本
阿里云 Elasticsearch Serverless 全新发布,平均可省50%成本,致力于为用户打造更低成本、弹性灵活、开放兼容、开箱即用的云上 Elasticsearch 使用体验。
1029 0
|
5月前
|
存储 弹性计算 运维
阿里云 Elasticsearch Severless 如何做到成本降低50%
阿里云 Elasticsearch Serverless 服务正式上线。全新产品形态,基于云原生 Serverless 技术,致力于为用户打造更低成本、弹性灵活、开放兼容、开箱即用的云上 Elasticsearch 使用体验。
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
国内首家!阿里云 Elasticsearch 8.9 版本释放 AI 搜索新动能
阿里云作为国内首家上线 Elasticsearch 8.9版本的厂商,在提供 Elasticsearch Relevance Engine™ (ESRE™) 引擎的基础上,提供增强 AI 的最佳实践与 ES 本身的混合搜索能力,为用户带来了更多创新和探索的可能性。
1433 1
|
7月前
|
存储 运维 监控
深度解读阿里云 Elasticsearch Serverless 服务如何实现超高性价比
阿里云 Elasticsearch Serverless 商业化版本正式上线,在帮助用户快速构建数据检索与分析应用的同时,提供按实际资源用量付费的付费体验,与自建相比大幅降低成本,助力用户快速上云!
2388 0
深度解读阿里云 Elasticsearch Serverless 服务如何实现超高性价比
|
9月前
|
存储 机器学习/深度学习 SQL
阿里云 Elasticsearch简介和购买流程
开源Elasticsearch是一个基于Lucene的实时分布式的搜索与分析引擎,是遵从Apache开源条款的一款开源产品,是当前主流的企业级搜索引擎。作为一款基于RESTful API的分布式服务,Elasticsearch可以快速地、近乎于准实时地存储、查询和分析超大数据集,通常被用来作为构建复杂查询特性和需求强大应用的基础引擎或技术。
|
10月前
|
存储 数据可视化 数据挖掘
阿里云Elasticsearch-趣味体验-仪表板
简述如何利用阿里云Elasticsearch以及 使用Kibana制作仪表板
|
29天前
|
Ubuntu JavaScript 关系型数据库
在阿里云Ubuntu 20.04服务器中搭建一个 Ghost 博客
在阿里云Ubuntu 20.04服务器上部署Ghost博客的步骤包括创建新用户、安装Nginx、MySQL和Node.js 18.x。首先,通过`adduser`命令创建非root用户,然后安装Nginx和MySQL。接着,设置Node.js环境,下载Nodesource GPG密钥并安装Node.js 18.x。之后,使用`npm`安装Ghost-CLI,创建Ghost安装目录并进行安装。配置过程中需提供博客URL、数据库连接信息等。最后,测试访问前台首页和后台管理页面。确保DNS设置正确,并根据提示完成Ghost博客的配置。
在阿里云Ubuntu 20.04服务器中搭建一个 Ghost 博客
|
1月前
|
存储 分布式计算 网络协议
阿里云服务器内存型r7、r8a、r8y实例区别参考
在阿里云目前的活动中,属于内存型实例规格的云服务器有内存型r7、内存型r8a、内存型r8y这几个实例规格,相比于活动内的经济型e、通用算力型u1实例来说,这些实例规格等性能更强,与计算型和通用型相比,它的内存更大,因此这些内存型实例规格主要适用于数据库、中间件和数据分析与挖掘,Hadoop、Spark集群等场景,本文为大家介绍内存型r7、r8a、r8y实例区别及最新活动价格,以供参考。
阿里云服务器内存型r7、r8a、r8y实例区别参考
|
1月前
|
SQL 弹性计算 安全
购买阿里云活动内云服务器之后设置密码、安全组、增加带宽、挂载云盘教程
当我们通过阿里云的活动购买完云服务器之后,并不是立马就能使用了,还需要我们设置云服务器密码,配置安全组等基本操作之后才能使用,有的用户还需要购买并挂载数据盘到云服务器上,很多新手用户由于是初次使用阿里云服务器,因此并不知道这些设置的操作流程,下面给大家介绍下这些设置的具体操作流程。
购买阿里云活动内云服务器之后设置密码、安全组、增加带宽、挂载云盘教程