实时引擎平台化总结

简介: 假期重新把之前在新浪博客里面的文字梳理了下,搬到这里。

1 新业务接入
 [a] dump
形式: 走DB、走云梯、走dump中心
 [b]
查询量和更新量:当查询比较平稳而更新较大,此时IO负载需要评估
 [c]
查询出现瓶颈时,可以考虑设置缓存,查看缓存命中率,可以在后台使用admin的相关请求查看
 [d]
新业务索引数据:
     --
尽量只保存DB的 索引字段,而不保存DB的全部信息,最大化发挥引擎性能
     --
尽量减少schema字段,合并或者stored=false索引字段,需要与业务方深入沟通
     --
或者引擎存DB索引字段,而记录内容存mongodbnosql系统
     
 [e]
新业务查询数据
     --
查询翻页,尽量走页面缓存,而不是每次查询
     --
尽量引入输入提示,引导query,引导流量,提升cache命中率和搜索准确性
     --
使用单字分词而不使用模糊匹配,在query解析的时候
     --
流量优先而数据规模增长缓慢的,可以直接使用lucene api 绕过solr解析,提升tps
     --
数据规模增长优先而查询缓慢增长,走普通模式
     --
查询时效性优先,走实时模式
     --
查询时效性优先,同时数据增长优先,走实时模式的 非中心化实现
     --
查询时效性优先,数据增量缓慢,走实时模式的     中心化实现
     -- facet
groupbyscore boost、模糊查询、区间查询、高亮等可以支持
     --
个性化分词策略支持
     --
区间查询比例大,走ecrm这种区间优化策略
     --
排行榜问题,走facet或者sort field

 [f]
预留备用机器,应对节假日高峰请求(高峰的读或者写)
 [g]
申请结点,考虑跨机房,至少cm3cm4 都有结点
 [h]
业务方需求尽量变更批量提交,而不是每一个小需求就立刻变更并立即部署

2
运行时关注问题
 [a]
文件句柄
 [b]
索引全量、增量exception
 [c]
磁盘空间
 [d] load io
情况
 [e] reload
unload core
 [f]
报警处理
 [g] jvm
参数
 [h] log
分析与log规范化

3
动态启停服务,支持平滑变更schema、变更dump逻辑
 [a] reload schema
 [b] reload jar
 [c] reload DB
连接信息
 [d] reload
全量、增量时间配置信息


4
后台系统
 [a]
自动化接入
 [b]
查询
 [c]
统计与报表

5
规范化
 [a] svn
管理
 [b]
文档管理
 [c]
业务管理

6
测试平台与辅助小工具------需要具体数值来量化
 [a]
独立引擎不依赖终搜的集中配置
 [b] dump
与查询本地验证工具
 [c]
系统时间轨迹
 [d]
系统内存轨迹
 [e]
系统tps与超时比例
 [f]
系统tps与数据规模
 [e]
系统tps与读写比例
 [g]
系统tps与内存
 [h]
系统tpscache设置

7
集群资源共享
 [a] dump
中心Index
 [b] dump
中心indexsearch
 [c]
配置推送或者配置常驻系统,只在数据到达后启动服务,最大化集群使用率
 [d]
推荐

目录
相关文章
|
6月前
|
消息中间件 存储 NoSQL
离线与实时数据开发方案
离线与实时数据开发方案
120 0
|
运维 大数据 网络安全
大厂案例 - 实时分析引擎
大厂案例 - 实时分析引擎
62 0
|
3月前
|
消息中间件 监控 关系型数据库
Serverless 应用的监控与调试问题之实时离线数仓一体化常用的解决方案有什么问题
Serverless 应用的监控与调试问题之实时离线数仓一体化常用的解决方案有什么问题
|
4月前
|
SQL Cloud Native 数据挖掘
Hologres:高性能实时数据分析引擎
Hologres:高性能实时数据分析引擎
|
6月前
|
存储 消息中间件 SQL
分钟级实时数据分析的背后——实时湖仓产品解决方案
袋鼠云在结合当前数据湖技术的基础上,建设实时湖仓平台,满足客户“快、精、准”的数据需求。本文将详细介绍实时湖仓产品解决方案,让企业能够更专注地去解决他们的业务价值。
148 0
|
11月前
|
存储 数据采集 安全
阿里云实时数仓的优势
阿里云实时数仓的优势
163 1
|
Prometheus 监控 Cloud Native
SigNoz,一款集日志、指标及追踪一体的开源平台
Hello folks,我是 Luga,今天我们来分享一下与云原生体系有关的话题- 云原生可观测性平台-SigNoz。 作为一个“核心”体系,可观测性在监控分布式微服务应用程序和云基础设施的可见性和控制自动化层面具有举足轻重的意义。
592 0
|
Serverless
Serverless应用场景——实时文件处理和数据 ETL 处理
Serverless应用场景——实时文件处理和数据 ETL 处理自制脑图
397 0
Serverless应用场景——实时文件处理和数据 ETL 处理
|
机器学习/深度学习 人工智能 分布式计算
离线实时一体化新能力解读| 学习笔记
快速学习离线实时一体化新能力解读
854 0
离线实时一体化新能力解读| 学习笔记
EMQ
|
SQL 存储 运维
流批结合计算以及更多原生分析能力支持
十月,eKuiper发布了1.7.0版本:引入了查询表和可更新Sink的概念,支持数据流与外部存储的数据一起计算,进一步完善了流批结合的实时计算能力。
EMQ
679 0
流批结合计算以及更多原生分析能力支持