实时引擎平台化总结

简介: 假期重新把之前在新浪博客里面的文字梳理了下,搬到这里。

1 新业务接入
 [a] dump
形式: 走DB、走云梯、走dump中心
 [b]
查询量和更新量:当查询比较平稳而更新较大,此时IO负载需要评估
 [c]
查询出现瓶颈时,可以考虑设置缓存,查看缓存命中率,可以在后台使用admin的相关请求查看
 [d]
新业务索引数据:
     --
尽量只保存DB的 索引字段,而不保存DB的全部信息,最大化发挥引擎性能
     --
尽量减少schema字段,合并或者stored=false索引字段,需要与业务方深入沟通
     --
或者引擎存DB索引字段,而记录内容存mongodbnosql系统
     
 [e]
新业务查询数据
     --
查询翻页,尽量走页面缓存,而不是每次查询
     --
尽量引入输入提示,引导query,引导流量,提升cache命中率和搜索准确性
     --
使用单字分词而不使用模糊匹配,在query解析的时候
     --
流量优先而数据规模增长缓慢的,可以直接使用lucene api 绕过solr解析,提升tps
     --
数据规模增长优先而查询缓慢增长,走普通模式
     --
查询时效性优先,走实时模式
     --
查询时效性优先,同时数据增长优先,走实时模式的 非中心化实现
     --
查询时效性优先,数据增量缓慢,走实时模式的     中心化实现
     -- facet
groupbyscore boost、模糊查询、区间查询、高亮等可以支持
     --
个性化分词策略支持
     --
区间查询比例大,走ecrm这种区间优化策略
     --
排行榜问题,走facet或者sort field

 [f]
预留备用机器,应对节假日高峰请求(高峰的读或者写)
 [g]
申请结点,考虑跨机房,至少cm3cm4 都有结点
 [h]
业务方需求尽量变更批量提交,而不是每一个小需求就立刻变更并立即部署

2
运行时关注问题
 [a]
文件句柄
 [b]
索引全量、增量exception
 [c]
磁盘空间
 [d] load io
情况
 [e] reload
unload core
 [f]
报警处理
 [g] jvm
参数
 [h] log
分析与log规范化

3
动态启停服务,支持平滑变更schema、变更dump逻辑
 [a] reload schema
 [b] reload jar
 [c] reload DB
连接信息
 [d] reload
全量、增量时间配置信息


4
后台系统
 [a]
自动化接入
 [b]
查询
 [c]
统计与报表

5
规范化
 [a] svn
管理
 [b]
文档管理
 [c]
业务管理

6
测试平台与辅助小工具------需要具体数值来量化
 [a]
独立引擎不依赖终搜的集中配置
 [b] dump
与查询本地验证工具
 [c]
系统时间轨迹
 [d]
系统内存轨迹
 [e]
系统tps与超时比例
 [f]
系统tps与数据规模
 [e]
系统tps与读写比例
 [g]
系统tps与内存
 [h]
系统tpscache设置

7
集群资源共享
 [a] dump
中心Index
 [b] dump
中心indexsearch
 [c]
配置推送或者配置常驻系统,只在数据到达后启动服务,最大化集群使用率
 [d]
推荐

目录
相关文章
|
7月前
|
消息中间件 存储 NoSQL
离线与实时数据开发方案
离线与实时数据开发方案
129 0
|
运维 大数据 网络安全
大厂案例 - 实时分析引擎
大厂案例 - 实时分析引擎
69 0
|
3月前
|
运维 数据挖掘 OLAP
阿里云Hologres:一站式轻量级OLAP分析平台的全面评测
在数据驱动决策的今天,企业对高效、灵活的数据分析平台的需求日益增长。阿里云的Hologres,作为一站式实时数仓引擎,提供了强大的OLAP(在线分析处理)分析能力。本文将对Hologres进行深入评测,探讨其在多源集成、性能、易用性以及成本效益方面的表现。
171 7
|
3月前
|
存储 SQL 分布式计算
Hologres 与阿里云生态的集成:构建高效的数据处理解决方案
【9月更文第1天】随着大数据时代的到来,数据处理和分析的需求日益增长。阿里云作为国内领先的云计算平台之一,提供了多种数据存储和处理的服务,其中Hologres作为一款实时数仓产品,以其高性能、高可用性以及对标准SQL的支持而受到广泛关注。本文将探讨Hologres如何与阿里云上的其他服务如MaxCompute、DataHub等进行集成,以构建一个完整的数据处理解决方案。
102 2
|
4月前
|
存储 SQL 分布式计算
MaxCompute 近实时增全量处理一体化新架构和使用场景介绍
本文主要介绍基于 MaxCompute 的离线近实时一体化新架构如何来支持这些综合的业务场景,提供基于Delta Table的近实时增全量一体的数据存储和计算解决方案。
|
4月前
|
消息中间件 监控 关系型数据库
Serverless 应用的监控与调试问题之实时离线数仓一体化常用的解决方案有什么问题
Serverless 应用的监控与调试问题之实时离线数仓一体化常用的解决方案有什么问题
|
5月前
|
SQL Cloud Native 数据挖掘
Hologres:高性能实时数据分析引擎
Hologres:高性能实时数据分析引擎
|
4月前
|
存储 JavaScript 前端开发
ShareDB:构建实时应用从未如此简单
ShareDB:构建实时应用从未如此简单
102 0
|
6月前
|
分布式计算 算法 关系型数据库
实时数仓 Hologres产品使用合集之如何优化查询性能
实时数仓Hologres的基本概念和特点:1.一站式实时数仓引擎:Hologres集成了数据仓库、在线分析处理(OLAP)和在线服务(Serving)能力于一体,适合实时数据分析和决策支持场景。2.兼容PostgreSQL协议:Hologres支持标准SQL(兼容PostgreSQL协议和语法),使得迁移和集成变得简单。3.海量数据处理能力:能够处理PB级数据的多维分析和即席查询,支持高并发低延迟查询。4.实时性:支持数据的实时写入、实时更新和实时分析,满足对数据新鲜度要求高的业务场景。5.与大数据生态集成:与MaxCompute、Flink、DataWorks等阿里云产品深度融合,提供离在线
|
7月前
|
存储 消息中间件 SQL
分钟级实时数据分析的背后——实时湖仓产品解决方案
袋鼠云在结合当前数据湖技术的基础上,建设实时湖仓平台,满足客户“快、精、准”的数据需求。本文将详细介绍实时湖仓产品解决方案,让企业能够更专注地去解决他们的业务价值。
160 0