分布式计算的搜索结果_文章_第3页-阿里云开发者社区

游客rgrjnscks5qhs

|

4天前

|

博文

该文针对ODPS大宽表任务运行缓慢问题，通过分析DAG图与耗时节点，定位数据倾斜和计算堆积等核心瓶颈。采用提升资源、加盐打散空值、视图落表、前置裁剪、MapJoin与DistMapJoin优化关联，并拆分节点降低回刷成本。最终产出时间从13:00提前至8:30，节省超4小时，显著提升效率与可维护性。

# SQL # 分布式计算 # 运维 # 调度 # MaxCompute

游客kwr7ple66hwxa

|

4天前

|

博文

如何做好SQL质量监控

SLS推出用户级SQL质量监控功能，集成于CloudLens for SLS，提供健康分、服务指标、运行明细、SQL Pattern分析及优化建议五大维度，助力用户全面掌握SQL使用情况，识别高耗业务，优化查询性能与资源管理。

# SQL # 运维 # 分布式计算 # 监控 # 索引

游客bjnjbvjj3nb64

|

4天前

|

博文

索引构建：搜索引擎如何为万亿级别网站生成索引？

针对超大规模数据，可通过分治与多路归并生成内存外倒排索引。先将文档分批在内存建索引，再写入有序临时文件，最后合并为全局索引。检索时结合内存哈希表、B+树及分层加载技术，高效处理词典与 posting list 的磁盘访问，提升查询性能。

# 存储 # 自然语言处理 # 分布式计算 # 搜索推荐 # 索引

游客efxhx5k2btavk

|

4天前

|

博文

如何做好SQL质量监控

SLS推出SQL质量监控功能，集成于CloudLens for SLS，从健康分、服务指标、运行明细、SQL Pattern及优化建议5大维度，助力用户全面掌握SQL使用情况，提升查询效率与资源管理能力。

# SQL # 运维 # 分布式计算 # 监控 # 索引

游客bjnjbvjj3nb64

|

4天前

|

博文

如何做好SQL质量监控

SLS推出用户级SQL质量监控功能，集成于CloudLens for SLS，提供健康分、服务指标、运行明细、SQL Pattern分析及优化建议五大维度，帮助用户实时掌握SQL使用情况，识别高耗业务，优化查询性能，提升资源管理效率。

# SQL # 运维 # 分布式计算 # 监控 # 索引

游客7drugl3kyg7h6

|

4天前

|

博文

如何做好SQL质量监控

SLS推出用户级SQL质量监控功能，集成于CloudLens for SLS，提供健康分、服务指标、运行明细、SQL Pattern分析及优化建议五大维度，助力用户全面掌握SQL使用情况，提升日志分析效率与治理能力。

# SQL # 运维 # 分布式计算 # 监控 # 索引

阿里云开发者

|

4天前

|

博文

让AI真正懂数据：猫超Matra项目中的AI知识库建设之路

本文介绍猫超基于大模型的AI数据助手Matra实践，构建面向Data Agent的知识库体系，通过知识图谱与ReAct框架实现智能取数，提升数据研发效率与业务分析能力。

# SQL # 人工智能 # 自然语言处理 # 分布式计算 # 知识图谱

游客hxb2wskd57xio

|

4天前

|

博文

如何做好SQL质量监控

SLS推出用户级SQL质量监控功能，集成于CloudLens for SLS，提供健康分、服务指标、运行明细、SQL Pattern分析及优化建议五大维度，助力用户全面掌握SQL使用情况，提升查询效率与资源治理能力。

# SQL # 运维 # 分布式计算 # 监控 # 索引

游客hxb2wskd57xio

|

4天前

|

博文

索引构建：搜索引擎如何为万亿级别网站生成索引？

为此，工业界采用分治思想：先将文档集拆分为小块，在内存中为每块构建倒排索引并写入磁盘生成有序临时文件；随后通过多路归并技术合并临时文件，生成全局有序的最终倒排文件。此过程类似MapReduce框架，支持分布式并行处理，显著提升效率。检索时，优先将词典加载至内存（如哈希表或B+树），关键词查询后从磁盘读取对应posting list。若posting list过长，则采用分层索引（如跳表）或缓存机制（如LRU），仅加载必要数据块，减少IO开销。核心原则是：尽可能利用内存加速检索，同时结合磁盘存储与高效索引结构实现大规模倒排系统的高效构建与查询。

# 存储 # 自然语言处理 # 分布式计算 # 搜索推荐 # 索引

游客gmnoe2wafii2e

|

4天前

|

博文

如何做好SQL质量监控

SLS推出用户级SQL质量监控功能，集成于CloudLens for SLS，提供健康分、服务指标、运行明细、SQL Pattern分析及优化建议五大维度，助力用户全面掌握SQL使用情况，实现精细化管理与性能优化。

# SQL # 运维 # 分布式计算 # 监控 # 索引

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

分布式计算