实时引擎平台化总结

简介: 假期重新把之前在新浪博客里面的文字梳理了下,搬到这里。

1 新业务接入
 [a] dump
形式: 走DB、走云梯、走dump中心
 [b]
查询量和更新量:当查询比较平稳而更新较大,此时IO负载需要评估
 [c]
查询出现瓶颈时,可以考虑设置缓存,查看缓存命中率,可以在后台使用admin的相关请求查看
 [d]
新业务索引数据:
     --
尽量只保存DB的 索引字段,而不保存DB的全部信息,最大化发挥引擎性能
     --
尽量减少schema字段,合并或者stored=false索引字段,需要与业务方深入沟通
     --
或者引擎存DB索引字段,而记录内容存mongodbnosql系统
     
 [e]
新业务查询数据
     --
查询翻页,尽量走页面缓存,而不是每次查询
     --
尽量引入输入提示,引导query,引导流量,提升cache命中率和搜索准确性
     --
使用单字分词而不使用模糊匹配,在query解析的时候
     --
流量优先而数据规模增长缓慢的,可以直接使用lucene api 绕过solr解析,提升tps
     --
数据规模增长优先而查询缓慢增长,走普通模式
     --
查询时效性优先,走实时模式
     --
查询时效性优先,同时数据增长优先,走实时模式的 非中心化实现
     --
查询时效性优先,数据增量缓慢,走实时模式的     中心化实现
     -- facet
groupbyscore boost、模糊查询、区间查询、高亮等可以支持
     --
个性化分词策略支持
     --
区间查询比例大,走ecrm这种区间优化策略
     --
排行榜问题,走facet或者sort field

 [f]
预留备用机器,应对节假日高峰请求(高峰的读或者写)
 [g]
申请结点,考虑跨机房,至少cm3cm4 都有结点
 [h]
业务方需求尽量变更批量提交,而不是每一个小需求就立刻变更并立即部署

2
运行时关注问题
 [a]
文件句柄
 [b]
索引全量、增量exception
 [c]
磁盘空间
 [d] load io
情况
 [e] reload
unload core
 [f]
报警处理
 [g] jvm
参数
 [h] log
分析与log规范化

3
动态启停服务,支持平滑变更schema、变更dump逻辑
 [a] reload schema
 [b] reload jar
 [c] reload DB
连接信息
 [d] reload
全量、增量时间配置信息


4
后台系统
 [a]
自动化接入
 [b]
查询
 [c]
统计与报表

5
规范化
 [a] svn
管理
 [b]
文档管理
 [c]
业务管理

6
测试平台与辅助小工具------需要具体数值来量化
 [a]
独立引擎不依赖终搜的集中配置
 [b] dump
与查询本地验证工具
 [c]
系统时间轨迹
 [d]
系统内存轨迹
 [e]
系统tps与超时比例
 [f]
系统tps与数据规模
 [e]
系统tps与读写比例
 [g]
系统tps与内存
 [h]
系统tpscache设置

7
集群资源共享
 [a] dump
中心Index
 [b] dump
中心indexsearch
 [c]
配置推送或者配置常驻系统,只在数据到达后启动服务,最大化集群使用率
 [d]
推荐

目录
相关文章
|
9月前
|
消息中间件 存储 NoSQL
离线与实时数据开发方案
离线与实时数据开发方案
144 0
|
运维 大数据 网络安全
大厂案例 - 实时分析引擎
大厂案例 - 实时分析引擎
83 0
|
1月前
|
SQL 存储 运维
云端问道5期方案教学-基于 Hologres 轻量实时的高性能OLAP分析
本文介绍了基于Hologres的轻量实时高性能OLAP分析方案,涵盖OLAP典型应用场景及Hologres的核心能力。Hologres是阿里云的一站式实时数仓,支持多种数据源同步、多场景查询和丰富的生态工具。它解决了复杂OLAP场景中的技术栈复杂、需求响应慢、开发运维成本高、时效性差、生态兼容弱、业务间相互影响等难题。通过与ClickHouse对比,Hologres在性能、写入更新、主键支持等方面表现更优。文中还展示了小红书、乐元素等客户案例,验证了Hologres在实际应用中的优势,如免运维、查询快、成本节约等。
云端问道5期方案教学-基于 Hologres 轻量实时的高性能OLAP分析
|
1月前
|
DataWorks 关系型数据库 OLAP
云端问道5期实践教学-基于Hologres轻量实时的高性能OLAP分析
本文基于Hologres轻量实时的高性能OLAP分析实践,通过云起实验室进行实操。实验步骤包括创建VPC和交换机、开通Hologres实例、配置DataWorks、创建网关、设置数据源、创建实时同步任务等。最终实现MySQL数据实时同步到Hologres,并进行高效查询分析。实验手册详细指导每一步操作,确保顺利完成。
|
2月前
|
DataWorks 数据挖掘 大数据
方案实践测评 | DataWorks集成Hologres构建一站式高性能的OLAP数据分析
DataWorks在任务开发便捷性、任务运行速度、产品使用门槛等方面都表现出色。在数据处理场景方面仍有改进和扩展的空间,通过引入更多的智能技术、扩展数据源支持、优化任务调度和可视化功能以及提升团队协作效率,DataWorks将能够为企业提供更全面、更高效的数据处理解决方案。
|
5月前
|
安全 数据挖掘 关系型数据库
体验《基于hologres搭建轻量OLAP分析平台》解决方案并进行部署
《基于HoloGres搭建轻量OLAP分析平台》解决方案详尽介绍了HoloGres基础、OLAP原理及平台架构设计等内容。涵盖数据模型设计、加载流程、查询优化及安全性能考虑等多方面,适合有一定背景知识的读者深入理解和实践。然而,对于初学者而言,可能需要更多概念解释。方案在数据迁移、高级查询优化及安全配置等方面提供了指导,但仍需注意潜在的环境兼容性、配置错误及性能瓶颈等问题。通过参考官方文档和社区资源,用户可以解决常见问题并根据实际需求进行调整优化,以实现高效的数据分析。
|
5月前
|
运维 数据挖掘 OLAP
阿里云Hologres:一站式轻量级OLAP分析平台的全面评测
在数据驱动决策的今天,企业对高效、灵活的数据分析平台的需求日益增长。阿里云的Hologres,作为一站式实时数仓引擎,提供了强大的OLAP(在线分析处理)分析能力。本文将对Hologres进行深入评测,探讨其在多源集成、性能、易用性以及成本效益方面的表现。
265 7
|
5月前
|
存储 SQL 分布式计算
Hologres 与阿里云生态的集成:构建高效的数据处理解决方案
【9月更文第1天】随着大数据时代的到来,数据处理和分析的需求日益增长。阿里云作为国内领先的云计算平台之一,提供了多种数据存储和处理的服务,其中Hologres作为一款实时数仓产品,以其高性能、高可用性以及对标准SQL的支持而受到广泛关注。本文将探讨Hologres如何与阿里云上的其他服务如MaxCompute、DataHub等进行集成,以构建一个完整的数据处理解决方案。
130 2
|
6月前
|
存储 SQL 分布式计算
MaxCompute 近实时增全量处理一体化新架构和使用场景介绍
本文主要介绍基于 MaxCompute 的离线近实时一体化新架构如何来支持这些综合的业务场景,提供基于Delta Table的近实时增全量一体的数据存储和计算解决方案。
|
7月前
|
SQL Cloud Native 数据挖掘
Hologres:高性能实时数据分析引擎
Hologres:高性能实时数据分析引擎