带你读《企业级云原生白皮书项目实战》——5.1.1 产品介绍

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 带你读《企业级云原生白皮书项目实战》——5.1.1 产品介绍

第五章 大数据


大数据部分,我们分别从开发处理层、分析服务层和业务应用层共选取了四个典型的云原生大数据产品进行讲述。

近几年,大数据处理从离线、批量逐渐过渡到实时化、流式化,在金融,泛互联网等行业出现流批一体、大数据实时化等发展趋势。基于此,我们在开发处理层不仅会分享云数仓市场明星产品MaxCompute的最佳实践,同时会介绍实时计算Flink版,Flink近年已逐步演进为流处理的领军角色和事实标准。

分析服务层,我们选取的是全托管云原生的Elasticsearch搜索分析服务。云上全托管,一键部署运维集群,专业的数据安全组件,并且有阿里巴巴达摩院NLP分词器等加持,在云搜索市场具备极高竞争力。

分析报表作为最常用的大数据应用之一,我们在最后一章节将介绍这一场景的利器——QuickBI。Quick BI是一个专为云上用户量身打造的新一代智能BI服务平台。提供海量数据交互式查询分析,轻松完成数据分析、业务数据探查、报表制作等工作。

白皮书大数据部分限于篇幅,未能详尽阿里云所有大数据产品。旨在给读者提供部分核心产品的最佳实践参考,欢迎阅读、交流。


5.1 检索分析服务 Elasticsearch版


5.1.1 产品介绍


阿里云Elasticsearch是基于开源Elasticsearch构建的全托管Elasticsearch云服务,在100%兼容开源功能的同时,支持开箱即用、按需付费。不仅提供云上开箱即用的Elasticsearch、Logstash、Kibana、Beats在内的Elastic Stack生态组件,还与Elastic官方合作提供免费X-Pack(白金版高级特性)商业插件,集成了安全、SQL、机器学习、告警、监控等高级特性,被广泛应用于实时日志分析处理、信息检索、以及数据的多维查询和统计分析等场景。

开源Elasticsearch是一个基于Lucene的实时分布式的搜索与分析引擎,是遵从Apache开源条款的一款开源产品,是当前主流的企业级搜索引擎。而Lucene是一个开源的全文检索引擎工具包,最初由Doug Cutting开发,2002年在Lucene的基础上,和Apache开源伙伴合作,开发出一款可以代替当时主流搜索引擎的Nutch,后来基于google提出的分布式文件系统GFS和分布式计算模型MapReduce,开发出了hadoop,所以是可以说Lucene是hadoop的起源。

相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
2月前
|
Cloud Native API
微服务引擎 MSE 及云原生 API 网关 2024 年 9 月产品动态
微服务引擎 MSE 及云原生 API 网关 2024 年 9 月产品动态。
|
4月前
|
存储 API 数据库
检索服务elasticsearch索引(Index)
【8月更文挑战第23天】
70 6
|
4月前
|
存储 负载均衡 监控
检索服务elasticsearch节点(Node)
【8月更文挑战第23天】
63 5
|
4月前
|
Cloud Native 安全 大数据
云原生与大数据
【8月更文挑战第27天】云原生与大数据
70 5
|
4月前
|
存储 监控 负载均衡
检索服务elasticsearch集群(Cluster)
【8月更文挑战第23天】
71 3
|
5天前
|
弹性计算 运维 Serverless
超值选择:阿里云Elasticsearch Serverless在企业数据检索与分析中的高性能与灵活性
本文介绍了阿里云Elasticsearch Serverless服务的高性价比与高度弹性灵活性。
|
12天前
|
运维 Cloud Native 应用服务中间件
阿里云微服务引擎 MSE 及 云原生 API 网关 2024 年 11 月产品动态
阿里云微服务引擎 MSE 面向业界主流开源微服务项目, 提供注册配置中心和分布式协调(原生支持 Nacos/ZooKeeper/Eureka )、云原生网关(原生支持Higress/Nginx/Envoy,遵循Ingress标准)、微服务治理(原生支持 Spring Cloud/Dubbo/Sentinel,遵循 OpenSergo 服务治理规范)能力。API 网关 (API Gateway),提供 APl 托管服务,覆盖设计、开发、测试、发布、售卖、运维监测、安全管控、下线等 API 生命周期阶段。帮助您快速构建以 API 为核心的系统架构.满足新技术引入、系统集成、业务中台等诸多场景需要
|
11天前
|
Cloud Native API 微服务
微服务引擎 MSE 及云原生 API 网关 2024 年 11 月产品动态
微服务引擎 MSE 及云原生 API 网关 2024 年 11 月产品动态。
|
1月前
|
Cloud Native API 微服务
微服务引擎 MSE 及云原生 API 网关 2024 年 10 月产品动态
微服务引擎 MSE 及云原生 API 网关 2024 年 10 月产品动态。
|
23天前
|
人工智能 运维 Cloud Native
产品测评 | 云原生应用开发平台CAP快速使用体验
在2024年云栖大会上,阿里云发布了云应用开发平台CAP,这是一站式云原生应用开发及管理平台,提供丰富的Serverless + AI应用模板、先进的开发者工具和企业级应用管理功能,旨在降低开发门槛,提高开发效率,支持快速构建和迭代云上应用。CAP通过极低成本的模型托管服务、流程式开发工具、一键创建AI应用等功能,显著提升了开发者的研发、部署和运维效能。
下一篇
DataWorks