索引

首页 标签 索引
# 索引 #
关注
66734内容
特别加餐 | 倒排检索加速(一):工业界如何利用跳表、哈希表、位图进行加速?
本文深入解析工业界倒排索引的优化技术,介绍跳表、哈希表和位图如何加速posting list求交集。结合相互二分查找、Roaring Bitmap等方案,展现基础数据结构在实际系统中的高效融合与应用。
特别加餐 | 高性能检索系统中的设计漫谈
本文系统梳理了高性能检索系统中的四大核心设计思想:索引与数据分离、减少磁盘IO、读写分离和分层处理。通过典型案例对比与深入分析,揭示其本质原理与通用优化经验,帮助开发者在实际场景中合理应用,提升系统性能与可维护性。(238字)
推荐引擎:没有搜索词,「头条」怎么找到你感兴趣的文章?
资讯类App通过“下拉刷新”精准推荐内容,背后依赖推荐引擎的检索技术。它基于用户行为数据构建用户画像与文章画像,结合协同过滤、内容召回等算法,实现个性化推荐,并通过多路召回与分层排序提升效率与准确性。
如何做好SQL质量监控
SLS推出用户级SQL质量监控功能,集成于CloudLens for SLS,提供健康分、服务指标、运行明细、SQL Pattern分析及优化建议五大维度,助力用户全面掌握SQL使用情况,识别异常、优化性能,提升日志分析效率与资源管理能力。
09-ELK环境搭建
基于ElasticSearch、Kibana、Filebeat构建日志系统,部署于192.168.xxx.xxx服务器。通过Filebeat采集应用日志,ES存储并解析,Kibana展示与搜索,结合Pipeline实现字段提取,配置ILM策略自动清理7天前日志,完成高效集中式日志管理。
|
5天前
|
用拉链法实现哈希表
本文深入讲解哈希表中拉链法的实现原理,通过简化版与完整版Java代码,演示如何用链表解决哈希冲突。涵盖泛型支持、动态扩容缩容、哈希函数设计及键值对增删查改操作,帮助理解哈希表底层机制。
|
5天前
|
学习数据结构和算法的框架思维
本文系统梳理数据结构与算法本质,主张“一切数据结构源于数组和链表”,“所有算法皆为穷举”。强调掌握遍历与访问的底层逻辑,提炼线性与非线性遍历框架,帮助读者建立框架思维,以不变应万变,高效应对算法问题。
广告系统:广告引擎如何做到在 0.1s 内返回广告信息?
广告系统是互联网公司核心营收支柱,如Google、Facebook超80%收入来自广告。其背后依赖高性能广告引擎,实现高并发、低延迟的精准投放。本文深入解析广告引擎架构,涵盖标签检索、向量匹配、打分排序与索引优化四大关键技术,揭示如何在0.1秒内完成从请求到返回的全流程,支撑千人千面的智能广告体验。
索引更新:刚发布的文章就能被搜到,这是怎么做到的?
本文介绍工业级倒排索引的高效更新机制。针对小规模内存索引,采用Double Buffer实现无锁读写;对于大规模索引,则使用“全量+增量”索引方案,结合删除列表处理删改操作,并通过完全重建、再合并或滚动合并策略管理增量数据增长,提升系统性能与稳定性。
空间检索(下):「查找最近的加油站」和「查找附近的人」有何不同?
本文回顾了利用四叉树在二维空间高效检索最近k个元素的方法,适用于动态查询场景。通过递归划分空间,四叉树可快速定位目标区域,避免满四叉树的空间浪费,常用非满四叉树优化存储。类似思想也适用于GeoHash编码的前缀树索引,提升检索效率。(239字)
免费试用