游客eymlso6gorbs4_个人页

游客eymlso6gorbs4

文章

问答

视频

个人介绍

暂无个人介绍

擅长的技术

获得更多能力

通用技术能力：

暂时未有相关通用技术能力~

云产品技术能力：

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明

高分内容

最新动态

文章
问答
视频

暂无更多信息

2025年12月

12.11 10:29:23

发表了文章 2025-12-11 10:29:23

4.4 服务端(Cursor)-接口开发(文件上传)

Sealos开通对象存储服务，首次使用需创建Bucket并填写名称。通过Access Key、Secret Key等信息配置对象存储，结合API实现文件上传功能，支持本地文件上传与管理，详情参考操作指南。
12.11 10:28:14

发表了文章 2025-12-11 10:28:14

4.3 服务端(Cursor)-接口开发(员工管理)

基于SpringBoot+Mybatis+PageHelper，使用JDK1.8+新语法，开发员工管理功能，涵盖分页查询、新增、修改、删除、详情查看及全量查询6大接口，关联员工表与工作经历表，实现高效RESTful API交互，支持多条件筛选与批量操作。
12.11 10:27:39

发表了文章 2025-12-11 10:27:39

4.2 服务端(Cursor)-接口开发(部门管理)

基于SpringBoot+Mybatis+PageHelper实现部门管理功能，涵盖查询、新增、修改、删除接口。使用JDK8+语法，连接内网MySQL数据库，完成dept表操作，响应标准JSON格式数据，适配前端调用需求。（239字）
12.11 10:27:10

发表了文章 2025-12-11 10:27:10

4.1 服务端(DevBox)-项目创建

通过Sealos在DevBox中创建SpringBoot项目zxyf-management，配置Java环境与4G内存，使用Cursor智能开发工具一键启动云端Maven工程，快速完成项目构建与部署，无需手动输入命令，实现高效开发与访问。
12.11 10:26:32

发表了文章 2025-12-11 10:26:32

Chap03. SpringAI

SpringAI整合主流大模型，支持多模态、函数调用与RAG，提供统一API简化开发。通过ChatClient封装对话交互，结合向量库与知识检索，实现智能客服、PDF问答等复杂应用，助力快速构建AI驱动系统。
12.11 10:25:05

发表了文章 2025-12-11 10:25:05

Chap01. 认识AI

本文介绍AI核心概念与大模型开发原理，涵盖人工智能发展历程及Transformer神经网络的关键作用。详解其注意力机制如何提升信息处理智能，并解析大语言模型（LLM）如何通过持续生成实现连贯文本输出，帮助理解GPT等模型的工作机制。
12.11 10:24:23

发表了文章 2025-12-11 10:24:23

结束语

从数组链表到搜索引擎、推荐系统，信息技术不断演进。信息爆炸时代，唯有构建思维的“检索引擎”，筛选、提炼有价值的知识，才能不被洪流淹没。学会迭代认知，打好基础，步步为营，方能跟上时代，迈向更高台阶。（238字）
12.11 10:23:28

发表了文章 2025-12-11 10:23:28

20 | 推荐引擎：没有搜索词，「头条」怎么找到你感兴趣的文章？

本文深入解析了资讯类App推荐引擎的检索技术。通过“下拉刷新”背后的个性化召回机制，介绍了推荐系统如何在无搜索词情况下，基于用户行为数据构建用户与文章画像，并运用基于内容和协同过滤（用户/物品）的召回算法实现精准推荐，最后通过多路混合与分层排序优化性能。
12.11 10:23:00

发表了文章 2025-12-11 10:23:00

19 | 广告系统：广告引擎如何做到在 0.1s 内返回广告信息？

广告系统是互联网核心营收支柱，支撑Google、Facebook等巨头超80%收入。本文解析其高性能架构：通过标签与向量检索结合、树形分片、倒排索引及非精准打分预筛，实现每秒百万级请求下0.1秒内精准响应，揭秘高并发低延迟背后的工程智慧。
12.11 10:22:30

发表了文章 2025-12-11 10:22:30

18 | 搜索引擎：输入搜索词以后，搜索引擎是怎么工作的？

本文介绍了搜索引擎的核心架构与工作原理，重点解析了爬虫、索引和检索三大系统。通过分词、纠错、推荐和位置索引等技术，搜索引擎能精准理解用户意图并高效召回结果，是文本检索领域的关键技术参考。
12.11 10:21:45

发表了文章 2025-12-11 10:21:45

17 | 存储系统：从检索技术角度剖析 LevelDB 的架构设计思想

LevelDB是Google开源的高性能键值存储系统，基于LSM树优化，采用跳表、读写分离、SSTable分层与Compaction等技术，结合BloomFilter、缓存机制与二分查找，大幅提升读写效率，广泛应用于工业级系统。
12.11 10:20:59

发表了文章 2025-12-11 10:20:59

特别加餐 | 高性能检索系统中的设计漫谈

本文系统梳理了高性能检索系统中的四大核心设计思想：索引与数据分离、减少磁盘IO、读写分离和分层处理。通过典型案例对比与深入分析，揭示其本质原理与通用经验，帮助开发者在实际场景中合理应用，提升系统性能与可维护性。
12.11 10:20:32

发表了文章 2025-12-11 10:20:32

16 | 最近邻检索（下）：如何用乘积量化实现「拍照识花」功能？

本文深入浅出地讲解了AI时代图片检索的核心技术：从特征提取、聚类算法（如K-Means）与局部敏感哈希的对比，到乘积量化压缩向量、结合倒排索引提升效率。重点剖析了如何通过聚类划分空间、用乘积量化大幅降低存储开销，并实现高效近似最近邻搜索。这些技术广泛应用于以图搜图、拍照识物、推荐系统等场景，是现代高维向量检索的基石。
12.11 10:20:02

发表了文章 2025-12-11 10:20:02

15 | 最近邻检索（上）：如何用局部敏感哈希快速过滤相似文章？

在搜索引擎与推荐系统中，相似文章去重至关重要。通过向量空间模型将文档表示为高维向量，利用SimHash等局部敏感哈希技术，可高效实现近似最近邻检索。SimHash保留关键词权重，生成紧凑哈希值，结合抽屉原理分段建立倒排索引，显著提升海明距离内的相似文档检索效率，广泛应用于网页去重、图像识别等场景。
12.11 10:19:37

发表了文章 2025-12-11 10:19:37

14 | 空间检索（下）：「查找最近的加油站」和「查找附近的人」有何不同？

本文探讨了在动态查询范围内高效检索“最近的k个目标”的方案。针对GeoHash编码的局限性，提出利用四叉树和前缀树等树形结构，实现空间的层次化划分与快速范围扩展。通过非满四叉树优化存储，避免稀疏数据下的空间浪费，并以前缀树支持GeoHash字符串的高效索引。最终实现了查询范围动态调整时的高性能检索，适用于加油站、医院等“最近”需求场景。
12.11 10:19:11

发表了文章 2025-12-11 10:19:11

13 | 空间检索（上）：如何用 Geohash 实现「查找附近的人」功能？

本文介绍了如何高效实现“查找附近的人”功能，提出基于Geohash的区域划分与编码方法，通过非精准与精准检索结合，提升大规模系统下地理位置查询性能。
12.11 10:18:45

发表了文章 2025-12-11 10:18:45

12 | 非精准 Top K 检索：如何给检索结果的排序过程装上加速器？

本文介绍了非精准 Top K 检索的优化思路及三种实现方法：基于静态质量得分排序截断、胜者表利用词频打分、分层索引两阶段检索。核心思想是将复杂计算前置到离线阶段，在线时快速截断，降低打分开销。该方法广泛应用于搜索与推荐系统，通过召回+排序两阶段架构，在保证结果质量的前提下显著提升检索效率。
12.11 10:18:17

发表了文章 2025-12-11 10:18:17

11｜精准 Top K 检索：搜索结果是怎么进行打分排序的？

搜索引擎排序直接影响用户体验，核心是Top K检索。本文详解三种打分算法：经典TF-IDF衡量词频与区分度；BM25优化词频饱和与文档长度影响；机器学习融合多因子自动调权。最后用堆排序提升Top K效率，实现高效精准排序。
12.11 10:17:46

发表了文章 2025-12-11 10:17:46

10 | 索引拆分：大规模检索系统如何使用分布式技术加速检索？

在大规模检索系统中，分布式技术通过拆分倒排索引提升性能。基于文档的水平拆分将数据随机分片，各服务器并行处理，缩短单次查询时间，且易于扩展与维护；而基于关键词的垂直拆分虽减少请求复制，但易引发负载不均与运维复杂。工业界更倾向文档拆分，因其具备良好均衡性、可扩展性，支持高效检索与平滑扩容，是主流实践方案。（238字）
12.11 10:17:09

发表了文章 2025-12-11 10:17:09

09 | 索引更新：刚发布的文章就能被搜到，这是怎么做到的？

本文介绍了工业界倒排索引的高效更新机制。针对小规模内存索引，采用Double Buffer实现无锁读写；对于大规模数据，则使用“全量+增量”索引结合方案，并通过删除列表处理删改。为避免频繁重建开销，提出滚动合并法，逐层整合天级、周级至全量索引，兼顾性能与资源。核心思想是读写分离，提升系统并发与稳定性。（238字）
12.11 10:16:41

发表了文章 2025-12-11 10:16:41

08 | 索引构建：搜索引擎如何为万亿级别网站生成索引？

针对超大规模数据场景，如搜索引擎需处理万亿级网页，倒排索引远超内存容量。本文介绍通过分治思想将文档集拆分为小块，在内存中构建局部倒排索引，再写入磁盘生成有序临时文件，最后利用多路归并技术合并为全局倒排索引。该过程可迁移至MapReduce框架实现分布式加速。检索时，优先将词典加载至内存（如哈希表或FST），结合B+树或跳表等结构高效访问磁盘中的posting list，辅以缓存优化IO。核心理念是“数据尽量入内存”与“分而治之”，兼顾效率与扩展性。
12.11 10:16:08

发表了文章 2025-12-11 10:16:08

07 | NoSQL 检索：为什么日志系统主要用 LSM 树而非 B+ 树？

LSM树专为高频写入场景设计，适用于日志、监控等大数据系统。它将数据先写入内存C0树，达到阈值后批量合并至磁盘C1树，避免B+树的随机写性能瓶颈。通过WAL保障崩溃恢复，利用顺序写提升效率，适合写多读少、查新数据为主的场景，是NoSQL数据库的核心技术之一。（238字）
12.11 10:15:39

发表了文章 2025-12-11 10:15:39

06丨数据库检索：如何使用 B+ 树对海量磁盘数据建立索引？

本讲探讨大规模数据下磁盘检索的挑战与解决方案，重点解析B+树如何通过索引与数据分离、多阶平衡树结构及双向链表优化，实现高效随机与范围查询，降低磁盘IO次数，广泛应用于数据库等工业系统。
12.11 10:15:11

发表了文章 2025-12-11 10:15:11

特别加餐丨倒排检索加速（二）：如何对联合查询进行加速？

本文深入讲解工业界倒排索引中联合查询的四大加速方法：调整次序法利用集合大小排序与数学分配律优化计算顺序；快速多路归并法结合跳表提升多列表归并效率；预先组合法对高频查询提前计算结果；缓存法则通过LRU机制缓存热点查询，减少重复计算。四种方法从数学、算法到工程实践，全面提升检索性能。
12.11 10:14:41

发表了文章 2025-12-11 10:14:41

特别加餐 | 倒排检索加速（一）：工业界如何利用跳表、哈希表、位图进行加速？

本文深入解析倒排索引中求交集的三大加速技术：跳表、哈希表与位图，并结合工业级实践，介绍Roaring Bitmap如何融合三种基础数据结构，实现高效检索与空间压缩的平衡，展现基础算法在真实系统中的强大应用。
12.11 10:14:04

发表了文章 2025-12-11 10:14:04

测一测丨检索算法基础，你掌握了多少？

本文解析了多种数据结构的查询效率与适用场景，涵盖无序与有序数据的查找代价、二叉搜索树与跳表的平衡性、哈希表冲突处理、位图与布隆过滤器特性，以及倒排索引的设计原理，系统比较了各结构在时间、空间与功能上的优劣。
12.11 10:13:28

发表了文章 2025-12-11 10:13:28

05 | 倒排索引：如何从海量数据中查询同时带有「极」和「客」的唐诗？

本文通过唐诗检索的类比，深入浅出地讲解了正排索引与倒排索引的原理与应用。正排索引以文档ID为键，适合精确查找；而倒排索引以关键词为键，指向包含该词的文档列表，极大提升了关键词搜索效率。文章详细介绍了倒排索引的构建过程：文档编号、关键词解析、哈希表插入，并解释了如何通过归并有序链表实现多关键词联合查询（如交集、并集）。此外，还探讨了作者维度的扩展索引、敏感词检测的实现难点及大规模索引的存储优化方案，如压缩、磁盘索引和分布式分片。倒排索引虽原理简单，却是搜索引擎、数据库全文检索等系统的核心技术基础。
12.11 10:12:55

发表了文章 2025-12-11 10:12:55

04 | 状态检索：如何快速判断一个用户是否存在？

本文探讨高效判断对象“是否存在”的问题，对比有序数组、二分查找树和哈希表的查询效率，引出位图与布隆过滤器的优化方案。位图利用bit节省空间，实现O(1)查询；布隆过滤器通过多哈希函数进一步压缩空间，适用于允许误判的快速预检场景，如用户注册、网页抓取去重等。
12.11 10:12:25

发表了文章 2025-12-11 10:12:25

03 | 哈希检索：如何根据用户 ID 快速查询用户信息？

本文介绍了哈希表的原理与实现。通过哈希函数将键转换为数组下标，利用数组随机访问特性实现O(1)级查询。针对哈希冲突，讲解了开放寻址法（如线性探查、二次探查、双散列）和链表法两种解决方案，并分析其优劣。最后指出哈希表虽高效，但需足够空间避免高冲突，且不支持有序操作。结合红黑树优化长链表，提升性能。
12.11 10:11:48

发表了文章 2025-12-11 10:11:48

02 | 非线性结构检索：数据频繁变化的情况下，如何高效检索？

通过树状结构或跳表组织数据，可实现高效二分查找。二叉检索树利用有序性快速缩小搜索范围，平衡时查询效率为O(log n)；跳表则通过多层指针加速链表遍历，以概率平衡实现近似O(log n)性能，二者均优于数组在频繁更新场景下的表现。
12.11 10:10:36

发表了文章 2025-12-11 10:10:36

01 | 线性结构检索：从数组和链表的原理初窥检索本质

本文探讨数组与链表的检索原理及效率。数组支持随机访问，适合二分查找，检索效率为O(log n)；链表虽检索较慢，但插入删除高效。通过合理组织数据结构，可提升检索性能，掌握其核心思想对构建高效系统至关重要。（238字）

发表了文章 2025-12-11

4.2 服务端(Cursor)-接口开发(部门管理)
发表了文章 2025-12-11

4.4 服务端(Cursor)-接口开发(文件上传)
发表了文章 2025-12-11

4.3 服务端(Cursor)-接口开发(员工管理)
发表了文章 2025-12-11

4.1 服务端(DevBox)-项目创建
发表了文章 2025-12-11

Chap03. SpringAI
发表了文章 2025-12-11

特别加餐 | 高性能检索系统中的设计漫谈
发表了文章 2025-12-11

13 | 空间检索（上）：如何用 Geohash 实现「查找附近的人」功能？
发表了文章 2025-12-11

16 | 最近邻检索（下）：如何用乘积量化实现「拍照识花」功能？
发表了文章 2025-12-11

15 | 最近邻检索（上）：如何用局部敏感哈希快速过滤相似文章？
发表了文章 2025-12-11

18 | 搜索引擎：输入搜索词以后，搜索引擎是怎么工作的？
发表了文章 2025-12-11

Chap01. 认识AI
发表了文章 2025-12-11

20 | 推荐引擎：没有搜索词，「头条」怎么找到你感兴趣的文章？
发表了文章 2025-12-11

17 | 存储系统：从检索技术角度剖析 LevelDB 的架构设计思想
发表了文章 2025-12-11

11｜精准 Top K 检索：搜索结果是怎么进行打分排序的？
发表了文章 2025-12-11

09 | 索引更新：刚发布的文章就能被搜到，这是怎么做到的？
发表了文章 2025-12-11

19 | 广告系统：广告引擎如何做到在 0.1s 内返回广告信息？
发表了文章 2025-12-11

12 | 非精准 Top K 检索：如何给检索结果的排序过程装上加速器？
发表了文章 2025-12-11

结束语
发表了文章 2025-12-11

10 | 索引拆分：大规模检索系统如何使用分布式技术加速检索？
发表了文章 2025-12-11

14 | 空间检索（下）：「查找最近的加油站」和「查找附近的人」有何不同？

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

正在加载, 请稍后...

暂无更多信息

探索云世界

热门

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

游客eymlso6gorbs4_个人页

个人介绍

擅长的技术

4.2 服务端(Cursor)-接口开发(部门管理)

4.4 服务端(Cursor)-接口开发(文件上传)

4.3 服务端(Cursor)-接口开发(员工管理)

4.1 服务端(DevBox)-项目创建

Chap03. SpringAI

特别加餐 | 高性能检索系统中的设计漫谈

13 | 空间检索（上）：如何用 Geohash 实现「查找附近的人」功能？

16 | 最近邻检索（下）：如何用乘积量化实现「拍照识花」功能？

15 | 最近邻检索（上）：如何用局部敏感哈希快速过滤相似文章？

18 | 搜索引擎：输入搜索词以后，搜索引擎是怎么工作的？

Chap01. 认识AI

20 | 推荐引擎：没有搜索词，「头条」怎么找到你感兴趣的文章？

17 | 存储系统：从检索技术角度剖析 LevelDB 的架构设计思想

11｜精准 Top K 检索：搜索结果是怎么进行打分排序的？

09 | 索引更新：刚发布的文章就能被搜到，这是怎么做到的？

19 | 广告系统：广告引擎如何做到在 0.1s 内返回广告信息？

12 | 非精准 Top K 检索：如何给检索结果的排序过程装上加速器？

结束语

10 | 索引拆分：大规模检索系统如何使用分布式技术加速检索？

14 | 空间检索（下）：「查找最近的加油站」和「查找附近的人」有何不同？