动态数组代码实现
本文详解动态数组的增删查改实现,重点解析三大关键点:自动扩缩容策略(2倍扩容、1/4缩容)、索引越界检查(区分元素与插入位置),以及删除元素时置null防内存泄漏。代码基于Java实现,帮助理解底层原理与时间复杂度。
10-Docker安装Redis
本文介绍Docker安装Redis单机与集群部署,涵盖配置映射、数据持久化及3主3从集群搭建。深入解析Redis集群存储算法:哈希取余、一致性哈希与哈希槽,重点说明槽位分配机制及16384个槽的设计原理,并演示主从扩缩容操作流程。
16 | 最近邻检索(下):如何用乘积量化实现「拍照识花」功能?
本文深入浅出地讲解了AI时代图片检索的核心技术:从特征提取、聚类算法(如K-Means)与局部敏感哈希的对比,到乘积量化压缩向量、结合倒排索引提升效率。重点剖析了如何通过聚类划分空间、用乘积量化大幅降低存储开销,并实现高效近似最近邻搜索。这些技术广泛应用于以图搜图、拍照识物、推荐系统等场景,是现代高维向量检索的基石。
15 | 最近邻检索(上):如何用局部敏感哈希快速过滤相似文章?
在搜索引擎与推荐系统中,相似文章去重至关重要。通过向量空间模型将文档表示为高维向量,利用SimHash等局部敏感哈希技术,可高效实现近似最近邻检索。SimHash保留关键词权重,生成紧凑哈希值,结合抽屉原理分段建立倒排索引,显著提升海明距离内的相似文档检索效率,广泛应用于网页去重、图像识别等场景。
20 | 推荐引擎:没有搜索词,「头条」怎么找到你感兴趣的文章?
本文深入解析了资讯类App推荐引擎的检索技术。通过“下拉刷新”背后的个性化召回机制,介绍了推荐系统如何在无搜索词情况下,基于用户行为数据构建用户与文章画像,并运用基于内容和协同过滤(用户/物品)的召回算法实现精准推荐,最后通过多路混合与分层排序优化性能。
12 | 非精准 Top K 检索:如何给检索结果的排序过程装上加速器?
本文介绍了非精准 Top K 检索的优化思路及三种实现方法:基于静态质量得分排序截断、胜者表利用词频打分、分层索引两阶段检索。核心思想是将复杂计算前置到离线阶段,在线时快速截断,降低打分开销。该方法广泛应用于搜索与推荐系统,通过召回+排序两阶段架构,在保证结果质量的前提下显著提升检索效率。