在大数据时代,无论是互联网信息还是企业内部信息,都在以指数级增长,在这些每天产生的海量数据中,如何快速找到有用的信息是一个很常见的需求。而一般企业的核心业务数据存储在关系型数据库中,但传统关系型数据库在深入使用后通常会遇到问题:单表记录不断增多,数据检索速度变慢,尤其是对中文的模糊查询。虽然数据库自身在不断完善,但效果有限且无法灵活扩展,复杂场景无法应对。此时,创建索引库就可以从根本上解决主库抗压问题,Elasticsearch就为该思路提供了完善的解决方案。
本场景通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
背景知识
阿里云检索分析服务Elasticsearch版100%兼容开源,提供云上全托管Elastic Stack生态组件,致力于信息检索、日志运维全观测、数据检索加速与分析等场景服务。基于免费X-Pack高级商业特性、云原生运管平台及引擎增强技术,支持集群一键高可用部署、弹性伸缩、高级监控与云上日志Serverless引擎,实现企业应用降本增效。
产品优势
- 关系型数据库接入:对接云上/自建主流关系型数据库(RDS、MySQL、Oracle等),提供准实时搜索能力。
- 自研NLP分词:基于淘宝海量大数据分词训练,为企业开发者提供文本分析/挖掘等核心能力。
- 自研向量检索:基于阿里巴巴达摩院自研,提供图像搜索、商品推荐、语音识别等检索服务。
- 平滑扩缩容:业务峰谷期,快速增加/减少计算资源,保障资源合理利用,降低成本。
- 集群智能运维:提供集群、节点、索引等二十余个诊断项的健康检测功能,探测集群潜在风险,寻找最佳解决方案。
- 开源生态兼容:支持完整的Elastic Stack 产品体系,兼容开源 RESTful API 及生态组件,支持用户自定义插件等原生功能。