nick1153007561_个人页

nick1153007561

文章

问答

视频

个人介绍

暂无个人介绍

擅长的技术

获得更多能力

通用技术能力：

暂时未有相关通用技术能力~

云产品技术能力：

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明

高分内容

最新动态

文章
问答
视频

暂无更多信息

2025年12月

12.12 09:12:55

发表了文章 2025-12-12 09:12:55

05 | 动态代理：面向接口编程，屏蔽 RPC 处理流程

本讲深入解析动态代理在 RPC 中的核心作用：通过动态代理实现接口方法的透明拦截，将本地调用无缝转为远程通信。结合 JDK 动态代理实例，揭示代理类生成与调用原理，并对比 Javassist、Byte Buddy 等框架在性能与易用性上的差异，帮助理解 RPC 如何实现“像调用本地一样调用远程”的编程体验。（238字）
12.12 09:10:49

发表了文章 2025-12-12 09:10:49

04 | 网络通信：RPC 框架在网络通信上更倾向于哪种网络 IO 模型？

本讲深入讲解RPC框架中的网络通信机制，重点分析同步阻塞IO与IO多路复用模型的原理及适用场景，阐明高并发下IO多路复用的优势。结合Netty等主流框架，探讨零拷贝技术在提升性能中的关键作用，涵盖操作系统层与用户空间的优化策略，助力构建高效、稳定的RPC通信体系。（239字）
12.12 09:10:02

发表了文章 2025-12-12 09:10:02

02 | 协议：怎么设计可扩展且向后兼容的协议？

本讲深入讲解RPC协议设计原理，从HTTP协议类比引入，剖析协议在解决网络传输“断句”问题中的关键作用。重点探讨如何通过消息边界、协议头与体的设计实现高效通信，并强调可扩展性对升级兼容的重要性，最终揭示私有RPC协议为何优于HTTP。
12.12 09:08:59

发表了文章 2025-12-12 09:08:59

Chap03. SpringAI

SpringAI整合主流大模型，支持多模态、函数调用与RAG，提供统一API简化开发。通过ChatClient封装对话流程，结合Prompt工程、工具调用和知识库扩展，可快速构建智能客服、聊天机器人等应用，助力Java开发者高效集成AI能力。
12.12 09:07:39

发表了文章 2025-12-12 09:07:39

01丨核心原理：能否画张图解释下 RPC 的通信流程？

RPC（远程过程调用）是一种实现跨服务透明调用的技术，屏蔽网络通信细节，让开发者像调用本地方法一样调用远程服务。它通过序列化、协议解析和动态代理等机制完成远程调用，是微服务架构的“经络”，广泛应用于分布式系统中，提升开发效率与系统解耦能力。
12.12 09:05:04

发表了文章 2025-12-12 09:05:04

Chap01. 认识AI

本文介绍了AI核心概念与大模型开发原理，涵盖人工智能发展历程及Transformer神经网络的关键作用。详解其注意力机制如何提升信息处理智能，并解析大语言模型（LLM）如何通过持续生成实现连贯文本输出，帮助理解GPT等模型的工作机制。（238字）
12.12 09:03:26

发表了文章 2025-12-12 09:03:26

20 | 推荐引擎：没有搜索词，「头条」怎么找到你感兴趣的文章？

本文深入解析了资讯类App推荐引擎的底层技术，重点探讨其在无搜索词场景下如何通过“下拉刷新”实现个性化内容召回。核心在于用户与文章画像构建，并结合基于内容与协同过滤的召回算法。基于内容的召回依赖标签匹配与向量检索，适合冷启动；协同过滤则通过用户或物品相似性推荐，挖掘潜在兴趣。实际系统多采用混合召回策略，结合多路结果并分层排序，在保证多样性的同时提升推荐精准度与效率。
12.12 09:02:31

发表了文章 2025-12-12 09:02:31

19 | 广告系统：广告引擎如何做到在 0.1s 内返回广告信息？

广告系统是互联网核心营收支柱，支撑Google、Facebook等巨头超80%收入。其背后依赖高性能广告引擎，实现高并发、低延迟的“千人千面”精准投放。本文深入解析广告引擎架构，涵盖标签检索、向量匹配、打分排序与索引优化四大关键技术，揭示如何在0.1秒内完成从请求到广告返回的全过程，打造高效智能的广告生态体系。（238字）
12.12 09:02:14

发表了文章 2025-12-12 09:02:14

18 | 搜索引擎：输入搜索词以后，搜索引擎是怎么工作的？

本文介绍了搜索引擎的核心架构与工作原理，重点解析了爬虫、索引和检索三大系统。通过分词、纠错、推荐等查询分析技术，结合倒排索引与位置信息索引法，搜索引擎能精准理解用户意图并高效返回相关结果。特别地，以“极客时间”为例，深入讲解了短语检索中最小窗口排序与多关键词相关性判断机制，揭示了搜索背后的技术逻辑。（238字）
12.12 09:02:03

发表了文章 2025-12-12 09:02:03

17 | 存储系统：从检索技术角度剖析 LevelDB 的架构设计思想

LevelDB是Google开源的高性能键值存储系统，基于LSM树优化，采用跳表、读写分离、SSTable分层与Compaction等技术，结合BloomFilter、缓存机制与二分查找，显著提升数据读写与检索效率，广泛应用于工业级系统中。（239字）
12.12 09:00:22

发表了文章 2025-12-12 09:00:22

特别加餐 | 高性能检索系统中的设计漫谈

本文深入解析高性能系统中的四大核心设计思想：索引与数据分离、减少磁盘IO、读写分离与分层处理。通过典型案例对比与扩展分析，揭示其本质与通用经验，帮助开发者在实际场景中优化检索效率、提升系统性能，打造高效稳定的架构。
12.12 09:00:09

发表了文章 2025-12-12 09:00:09

16 | 最近邻检索（下）：如何用乘积量化实现「拍照识花」功能？

本文深入解析了AI时代图片检索的核心技术，涵盖聚类算法与局部敏感哈希的差异、乘积量化压缩向量原理及倒排索引优化。通过K-Means聚类与乘积量化结合，实现高效近似最近邻搜索，在节省存储的同时提升检索速度，广泛应用于以图搜图、商品识别与推荐系统等领域。
12.12 08:59:01

发表了文章 2025-12-12 08:59:01

14 | 空间检索（下）：「查找最近的加油站」和「查找附近的人」有何不同？

本文探讨了动态调整查询范围的高效检索方案，重点介绍如何利用四叉树和前缀树优化“查找最近的k个目标”场景。针对GeoHash固定范围查询的局限性，提出通过非满四叉树实现动态分裂与回溯查询，在保证效率的同时节省存储空间；并引出前缀树对GeoHash字符串编码的高效索引方法。最后拓展至高维场景，简述k-d树的适用性与挑战，为近邻搜索提供系统性解决方案。
12.12 08:58:42

发表了文章 2025-12-12 08:58:42

15 | 最近邻检索（上）：如何用局部敏感哈希快速过滤相似文章？

在搜索引擎与推荐系统中，相似文章去重至关重要。本文介绍如何利用向量空间模型将文章转化为高维向量，并通过局部敏感哈希（如SimHash）实现高效近似最近邻检索，结合抽屉原理优化索引，快速找出内容相似的文章，提升用户体验。该技术广泛应用于网页去重、图像识别等场景。
12.12 08:57:15

发表了文章 2025-12-12 08:57:15

11｜精准 Top K 检索：搜索结果是怎么进行打分排序的？

搜索引擎排序核心在于打分与Top K检索。本文详解TF-IDF、BM25及机器学习打分方法，阐述如何综合词频、文档长度、查询词权重等因素提升排序质量，并介绍利用堆排序优化大规模数据下Top K结果返回效率，助力构建高效精准检索系统。
12.12 08:57:02

发表了文章 2025-12-12 08:57:02

13 | 空间检索（上）：如何用 Geohash 实现「查找附近的人」功能？

本文介绍了如何高效实现“查找附近的人”功能，针对大规模系统提出基于区域划分与Geohash编码的解决方案。通过将二维空间划分为带编号的区域，并利用一维编码（如Geohash）建立索引，可大幅提升检索效率。支持非精准与精准查询：前者直接查所在区域，后者扩展至邻接8区域以避免遗漏，结合二分查找、跳表或Redis等技术实现快速定位。尤其适用于社交、餐饮、出行等LBS场景。
12.12 08:56:11

发表了文章 2025-12-12 08:56:11

10 | 索引拆分：大规模检索系统如何使用分布式技术加速检索？

在大规模检索系统中，分布式技术通过拆分倒排索引提升性能。基于文档的水平拆分将数据随机分布到多台服务器，实现并行检索与负载均衡；基于关键词的垂直拆分则按词典划分，减少请求复制但易引发热点问题。前者扩展性好、运维简单，后者适用于特定高性能场景。合理选择拆分策略是提升系统吞吐与响应速度的关键。
12.12 08:55:59

发表了文章 2025-12-12 08:55:59

09 | 索引更新：刚发布的文章就能被搜到，这是怎么做到的？

本文介绍了工业界倒排索引的高效更新机制。针对小规模内存索引，采用Double Buffer实现无锁读写；对于大规模数据，则使用“全量+增量”索引结合方案，并通过删除列表处理文档删除问题。为避免频繁合并带来的性能开销，进一步引入滚动合并法，逐层整合天级、周级至全量索引，减少冗余IO。核心思想是读写分离，在保障检索性能的同时实现近实时更新。（238字）
12.12 08:53:49

发表了文章 2025-12-12 08:53:49

08 | 索引构建：搜索引擎如何为万亿级别网站生成索引？

针对超大规模数据，可通过分治与多路归并生成内存外倒排索引。先将文档分批在内存建索引，再写入有序临时文件，最后归并为全局索引。检索时结合内存哈希、B+树及分层加载技术，提升效率。
12.12 08:53:41

发表了文章 2025-12-12 08:53:41

07 | NoSQL 检索：为什么日志系统主要用 LSM 树而非 B+ 树？

B+树适用于读多写少场景，但在日志、监控等高频写入的大数据场景中性能受限。LSM树通过将数据分内存（C0树）和磁盘（C1树）两部分存储，利用批量写入替代随机写入，大幅提升写入效率。结合WAL预写日志保障崩溃恢复，滚动合并实现有序归并，特别适合写密集型应用。NoSQL数据库广泛采用此技术。
12.12 08:52:45

发表了文章 2025-12-12 08:52:45

06丨数据库检索：如何使用 B+ 树对海量磁盘数据建立索引？

本节深入探讨磁盘环境下大规模数据检索的挑战与解决方案，重点讲解B+树如何通过索引与数据分离、多阶平衡树结构及双向链表优化，实现高效磁盘I/O和范围查询，广泛应用于数据库等工业级系统。
12.12 08:52:36

发表了文章 2025-12-12 08:52:36

特别加餐丨倒排检索加速（二）：如何对联合查询进行加速？

本文介绍工业界联合查询的四种加速方法：调整次序法利用集合大小差异优化求交顺序；快速多路归并法借助跳表提升多列表归并效率；预先组合法对高频查询提前计算结果；缓存法则通过LRU机制缓存热点查询，避免重复计算，全面提升检索性能。
12.12 08:52:19

发表了文章 2025-12-12 08:52:19

特别加餐 | 倒排检索加速（一）：工业界如何利用跳表、哈希表、位图进行加速？

本文深入解析倒排索引在工业界如何通过跳表、哈希表和位图加速求交集操作，并介绍Roaring Bitmap如何融合三种基础数据结构优势，在存储与性能间取得平衡，是基础算法在实际系统中综合应用的典范。
12.12 08:50:55

发表了文章 2025-12-12 08:50:55

测一测丨检索算法基础，你掌握了多少？

本文解析了多种数据结构的查询效率与适用场景，涵盖无序/有序数组、链表、二叉检索树、跳表、哈希表、位图及布隆过滤器等。重点比较了它们在插入、查找、遍历等操作的时间空间代价，并探讨了倒排索引的设计原理与应用，如搜索引擎中的高效检索策略。同时指出各类结构的优缺点：如哈希表查询快但空间开销大，有序数组紧凑但插入慢，二叉搜索树性能依赖平衡性等。还澄清了常见误区，例如二分查找不适用于链表，开放寻址法中不能用二分查找解决冲突等。最后通过布隆过滤器和倒排索引的实际案例，说明如何根据业务需求选择合适的数据结构以优化系统性能。
12.12 08:50:39

发表了文章 2025-12-12 08:50:39

05 | 倒排索引：如何从海量数据中查询同时带有「极」和「客」的唐诗？

本文通过唐诗检索的场景，对比正排索引与倒排索引的差异。正排索引以文档ID为键，适合精确查找；而倒排索引以关键词为键，记录包含该词的文档列表，支持高效的关键字搜索。文中详解了倒排索引的构建过程：分词、生成关键字-文档对、插入哈希表，并介绍如何通过归并有序链表实现多关键词联合查询（如交集、并集）。倒排索引广泛应用于搜索引擎、数据库全文检索等系统，是信息检索的核心技术之一。
12.12 08:49:28

发表了文章 2025-12-12 08:49:28

04 | 状态检索：如何快速判断一个用户是否存在？

本文探讨了高效判断对象是否存在的技术方案，对比有序数组、二叉搜索树和哈希表后，重点介绍位图与布隆过滤器。位图利用bit节省空间，实现O(1)查询；布隆过滤器通过多哈希函数进一步压缩空间，适用于允许误判的快速存在性检测场景，广泛用于缓存、爬虫等系统中。
12.12 08:48:26

发表了文章 2025-12-12 08:48:26

03 | 哈希检索：如何根据用户 ID 快速查询用户信息？

本文介绍了哈希表的原理与实现。通过哈希函数将键转换为数组下标，利用数组随机访问特性实现O(1)级查询。针对哈希冲突，讲解了开放寻址法（线性探查、二次探查、双散列）和链表法两种解决方案，并分析其优劣。最后指出哈希表需足够空间以保持低装载因子，且不支持有序操作，适合精确查找但不适合范围查询。
12.12 08:46:47

发表了文章 2025-12-12 08:46:47

02 | 非线性结构检索：数据频繁变化的情况下，如何高效检索？

通过树状结构与跳表，将无序数据组织为可高效检索的非线性结构。二叉检索树利用有序性和二分查找提升效率，跳表则通过多层指针实现快速访问，二者均在动态数据场景下优于有序数组，兼顾查询与更新性能。
12.12 08:45:08

发表了文章 2025-12-12 08:45:08

01 | 线性结构检索：从数组和链表的原理初窥检索本质

本文探讨数组与链表的检索原理，揭示数据存储方式对检索效率的影响。数组支持随机访问，适合二分查找，实现O(log n)高效检索；链表虽检索较慢，但动态调整更灵活。通过理解二者特点，掌握“减少查询范围”的核心思想，为构建高效数据结构打下基础。

发表了文章 2025-12-12

05 | 动态代理：面向接口编程，屏蔽 RPC 处理流程
发表了文章 2025-12-12

04 | 网络通信：RPC 框架在网络通信上更倾向于哪种网络 IO 模型？
发表了文章 2025-12-12

01丨核心原理：能否画张图解释下 RPC 的通信流程？
发表了文章 2025-12-12

Chap03. SpringAI
发表了文章 2025-12-12

02 | 协议：怎么设计可扩展且向后兼容的协议？
发表了文章 2025-12-12

Chap01. 认识AI
发表了文章 2025-12-12

20 | 推荐引擎：没有搜索词，「头条」怎么找到你感兴趣的文章？
发表了文章 2025-12-12

10 | 索引拆分：大规模检索系统如何使用分布式技术加速检索？
发表了文章 2025-12-12

07 | NoSQL 检索：为什么日志系统主要用 LSM 树而非 B+ 树？
发表了文章 2025-12-12

特别加餐 | 高性能检索系统中的设计漫谈
发表了文章 2025-12-12

13 | 空间检索（上）：如何用 Geohash 实现「查找附近的人」功能？
发表了文章 2025-12-12

08 | 索引构建：搜索引擎如何为万亿级别网站生成索引？
发表了文章 2025-12-12

19 | 广告系统：广告引擎如何做到在 0.1s 内返回广告信息？
发表了文章 2025-12-12

17 | 存储系统：从检索技术角度剖析 LevelDB 的架构设计思想
发表了文章 2025-12-12

16 | 最近邻检索（下）：如何用乘积量化实现「拍照识花」功能？
发表了文章 2025-12-12

11｜精准 Top K 检索：搜索结果是怎么进行打分排序的？
发表了文章 2025-12-12

15 | 最近邻检索（上）：如何用局部敏感哈希快速过滤相似文章？
发表了文章 2025-12-12

14 | 空间检索（下）：「查找最近的加油站」和「查找附近的人」有何不同？
发表了文章 2025-12-12

09 | 索引更新：刚发布的文章就能被搜到，这是怎么做到的？
发表了文章 2025-12-12

18 | 搜索引擎：输入搜索词以后，搜索引擎是怎么工作的？

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

正在加载, 请稍后...

暂无更多信息

探索云世界

热门

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

nick1153007561_个人页

个人介绍

擅长的技术

05 | 动态代理：面向接口编程，屏蔽 RPC 处理流程

04 | 网络通信：RPC 框架在网络通信上更倾向于哪种网络 IO 模型？

01丨核心原理：能否画张图解释下 RPC 的通信流程？

Chap03. SpringAI

02 | 协议：怎么设计可扩展且向后兼容的协议？

Chap01. 认识AI

20 | 推荐引擎：没有搜索词，「头条」怎么找到你感兴趣的文章？

10 | 索引拆分：大规模检索系统如何使用分布式技术加速检索？

07 | NoSQL 检索：为什么日志系统主要用 LSM 树而非 B+ 树？

特别加餐 | 高性能检索系统中的设计漫谈

13 | 空间检索（上）：如何用 Geohash 实现「查找附近的人」功能？

08 | 索引构建：搜索引擎如何为万亿级别网站生成索引？

19 | 广告系统：广告引擎如何做到在 0.1s 内返回广告信息？

17 | 存储系统：从检索技术角度剖析 LevelDB 的架构设计思想

16 | 最近邻检索（下）：如何用乘积量化实现「拍照识花」功能？

11｜精准 Top K 检索：搜索结果是怎么进行打分排序的？

15 | 最近邻检索（上）：如何用局部敏感哈希快速过滤相似文章？

14 | 空间检索（下）：「查找最近的加油站」和「查找附近的人」有何不同？

09 | 索引更新：刚发布的文章就能被搜到，这是怎么做到的？

18 | 搜索引擎：输入搜索词以后，搜索引擎是怎么工作的？