分布式计算的搜索结果_文章-阿里云开发者社区

Echo_Wish

|

6小时前

|

博文

|

来自：大数据与机器学习

别让大数据“全表扫描”掏空你：数据分区策略与分区裁剪的实战心经

# SQL # 存储 # 分布式计算 # 大数据 # Spark

SelectDB

|

11小时前

|

博文

|

来自：数据库

较 Trino 省 67% 成本，速度快 10 倍，中通快递基于 SelectDB 的湖仓分析架构

中通快递基于 SelectDB 构建了湖仓分析架构，补齐 OLAP 分析能力。在离线场景中，实现 2000+ QPS 并发点查；在实时场景中，仅以 1/3 原集群机器数量覆盖所有业务，90% 分析任务从 10 分钟缩短至 1 分钟内，投入产出比大幅提升。

# SQL # 缓存 # 分布式计算 # BI # OLAP

游客g56qybn6r73dm

|

11小时前

|

博文

如何做好SQL质量监控

SLS推出用户级SQL质量监控功能，集成于CloudLens for SLS，提供健康分、服务指标、运行明细、SQL Pattern分析及优化建议五大维度，助力用户全面掌握SQL使用情况，识别异常、优化性能，提升日志分析效率与资源管理能力。

# SQL # 运维 # 分布式计算 # 监控 # 索引

t55cenhjuilvw

|

13小时前

|

博文

08 | 索引构建：搜索引擎如何为万亿级别网站生成索引？

针对超大规模数据场景，如搜索引擎需处理万亿级网页，倒排索引远超内存容量。解决方案是：先将文档分批，在内存中为每批构建小型倒排索引，再写入磁盘生成有序临时文件；最后通过多路归并技术合并临时文件，生成全局有序的最终倒排文件。此过程类似MapReduce思想，支持分布式加速。检索时，优先将词典加载至内存（可用哈希表或B+树），结合磁盘上的posting list进行高效查询，对过长的列表可采用分层索引或缓存优化。

# 存储 # 自然语言处理 # 分布式计算 # 搜索推荐 # 索引

游客hczfcno3z2ljo

|

13小时前

|

博文

如何做好SQL质量监控

SLS推出SQL质量监控功能，集成于CloudLens for SLS，助力用户从健康分、服务指标、运行明细、SQL Pattern及优化建议五大维度，全面掌握SQL使用情况，提升查询效率与资源治理能力。

# SQL # 运维 # 分布式计算 # 监控 # 索引

游客qbwohdg5vs6oq

|

13小时前

|

博文

XXLJOB：超长定时任务慢节点优化实践

本文针对ODPS大宽表任务运行慢、回刷成本高等问题，通过定位耗时卡点，发现数据倾斜与计算堆积是主因。结合视图落表、节点拆分、前置裁剪、mapjoin与distmapjoin优化等手段，将任务产出时间从13:00提前至8:30，节省超4小时，显著提升效率并降低资源消耗。

# SQL # 分布式计算 # 运维 # 调度 # MaxCompute

游客rgrjnscks5qhs

|

13小时前

|

博文

XXLJOB：超长定时任务慢节点优化实践

该文针对ODPS大宽表任务运行缓慢问题，通过分析DAG图与耗时节点，定位数据倾斜和计算堆积等核心瓶颈。采用提升资源、加盐打散空值、视图落表、前置裁剪、MapJoin与DistMapJoin优化关联，并拆分节点降低回刷成本。最终产出时间从13:00提前至8:30，节省超4小时，显著提升效率与可维护性。

# SQL # 分布式计算 # 运维 # 调度 # MaxCompute

游客kwr7ple66hwxa

|

13小时前

|

博文

如何做好SQL质量监控

SLS推出用户级SQL质量监控功能，集成于CloudLens for SLS，提供健康分、服务指标、运行明细、SQL Pattern分析及优化建议五大维度，助力用户全面掌握SQL使用情况，识别高耗业务，优化查询性能与资源管理。

# SQL # 运维 # 分布式计算 # 监控 # 索引

游客bjnjbvjj3nb64

|

13小时前

|

博文

索引构建：搜索引擎如何为万亿级别网站生成索引？

针对超大规模数据，可通过分治与多路归并生成内存外倒排索引。先将文档分批在内存建索引，再写入有序临时文件，最后合并为全局索引。检索时结合内存哈希表、B+树及分层加载技术，高效处理词典与 posting list 的磁盘访问，提升查询性能。

# 存储 # 自然语言处理 # 分布式计算 # 搜索推荐 # 索引

游客efxhx5k2btavk

|

13小时前

|

博文

如何做好SQL质量监控

SLS推出SQL质量监控功能，集成于CloudLens for SLS，从健康分、服务指标、运行明细、SQL Pattern及优化建议5大维度，助力用户全面掌握SQL使用情况，提升查询效率与资源管理能力。

# SQL # 运维 # 分布式计算 # 监控 # 索引

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

分布式计算