分布式计算

首页 标签 分布式计算
# 分布式计算 #
关注
37846内容
|
6小时前
| |
别让大数据“全表扫描”掏空你:数据分区策略与分区裁剪的实战心经
别让大数据“全表扫描”掏空你:数据分区策略与分区裁剪的实战心经
|
11小时前
| |
来自: 数据库
较 Trino 省 67% 成本,速度快 10 倍,中通快递基于 SelectDB 的湖仓分析架构
中通快递基于 SelectDB 构建了湖仓分析架构,补齐 OLAP 分析能力。在离线场景中,实现 2000+ QPS 并发点查;在实时场景中,仅以 1/3 原集群机器数量覆盖所有业务,90% 分析任务从 10 分钟缩短至 1 分钟内,投入产出比大幅提升。
|
11小时前
|
如何做好SQL质量监控
SLS推出用户级SQL质量监控功能,集成于CloudLens for SLS,提供健康分、服务指标、运行明细、SQL Pattern分析及优化建议五大维度,助力用户全面掌握SQL使用情况,识别异常、优化性能,提升日志分析效率与资源管理能力。
|
13小时前
|
08 | 索引构建:搜索引擎如何为万亿级别网站生成索引?
针对超大规模数据场景,如搜索引擎需处理万亿级网页,倒排索引远超内存容量。解决方案是:先将文档分批,在内存中为每批构建小型倒排索引,再写入磁盘生成有序临时文件;最后通过多路归并技术合并临时文件,生成全局有序的最终倒排文件。此过程类似MapReduce思想,支持分布式加速。检索时,优先将词典加载至内存(可用哈希表或B+树),结合磁盘上的posting list进行高效查询,对过长的列表可采用分层索引或缓存优化。
|
13小时前
|
如何做好SQL质量监控
SLS推出SQL质量监控功能,集成于CloudLens for SLS,助力用户从健康分、服务指标、运行明细、SQL Pattern及优化建议五大维度,全面掌握SQL使用情况,提升查询效率与资源治理能力。
|
13小时前
|
XXLJOB:超长定时任务慢节点优化实践
本文针对ODPS大宽表任务运行慢、回刷成本高等问题,通过定位耗时卡点,发现数据倾斜与计算堆积是主因。结合视图落表、节点拆分、前置裁剪、mapjoin与distmapjoin优化等手段,将任务产出时间从13:00提前至8:30,节省超4小时,显著提升效率并降低资源消耗。
|
13小时前
|
XXLJOB:超长定时任务慢节点优化实践
该文针对ODPS大宽表任务运行缓慢问题,通过分析DAG图与耗时节点,定位数据倾斜和计算堆积等核心瓶颈。采用提升资源、加盐打散空值、视图落表、前置裁剪、MapJoin与DistMapJoin优化关联,并拆分节点降低回刷成本。最终产出时间从13:00提前至8:30,节省超4小时,显著提升效率与可维护性。
|
13小时前
|
如何做好SQL质量监控
SLS推出用户级SQL质量监控功能,集成于CloudLens for SLS,提供健康分、服务指标、运行明细、SQL Pattern分析及优化建议五大维度,助力用户全面掌握SQL使用情况,识别高耗业务,优化查询性能与资源管理。
|
13小时前
|
索引构建:搜索引擎如何为万亿级别网站生成索引?
针对超大规模数据,可通过分治与多路归并生成内存外倒排索引。先将文档分批在内存建索引,再写入有序临时文件,最后合并为全局索引。检索时结合内存哈希表、B+树及分层加载技术,高效处理词典与 posting list 的磁盘访问,提升查询性能。
|
13小时前
|
如何做好SQL质量监控
SLS推出SQL质量监控功能,集成于CloudLens for SLS,从健康分、服务指标、运行明细、SQL Pattern及优化建议5大维度,助力用户全面掌握SQL使用情况,提升查询效率与资源管理能力。
免费试用