游客eymlso6gorbs4_个人页

游客eymlso6gorbs4
0
0
0

个人介绍

暂无个人介绍

擅长的技术

获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息

2025年12月

  • 12.11 10:29:23
    发表了文章 2025-12-11 10:29:23

    4.4 服务端(Cursor)-接口开发(文件上传)

    Sealos开通对象存储服务,首次使用需创建Bucket并填写名称。通过Access Key、Secret Key等信息配置对象存储,结合API实现文件上传功能,支持本地文件上传与管理,详情参考操作指南。
  • 12.11 10:28:14
    发表了文章 2025-12-11 10:28:14

    4.3 服务端(Cursor)-接口开发(员工管理)

    基于SpringBoot+Mybatis+PageHelper,使用JDK1.8+新语法,开发员工管理功能,涵盖分页查询、新增、修改、删除、详情查看及全量查询6大接口,关联员工表与工作经历表,实现高效RESTful API交互,支持多条件筛选与批量操作。
  • 12.11 10:27:39
    发表了文章 2025-12-11 10:27:39

    4.2 服务端(Cursor)-接口开发(部门管理)

    基于SpringBoot+Mybatis+PageHelper实现部门管理功能,涵盖查询、新增、修改、删除接口。使用JDK8+语法,连接内网MySQL数据库,完成dept表操作,响应标准JSON格式数据,适配前端调用需求。(239字)
  • 12.11 10:27:10
    发表了文章 2025-12-11 10:27:10

    4.1 服务端(DevBox)-项目创建

    通过Sealos在DevBox中创建SpringBoot项目zxyf-management,配置Java环境与4G内存,使用Cursor智能开发工具一键启动云端Maven工程,快速完成项目构建与部署,无需手动输入命令,实现高效开发与访问。
  • 12.11 10:26:32
    发表了文章 2025-12-11 10:26:32

    Chap03. SpringAI

    SpringAI整合主流大模型,支持多模态、函数调用与RAG,提供统一API简化开发。通过ChatClient封装对话交互,结合向量库与知识检索,实现智能客服、PDF问答等复杂应用,助力快速构建AI驱动系统。
  • 12.11 10:25:05
    发表了文章 2025-12-11 10:25:05

    Chap01. 认识AI

    本文介绍AI核心概念与大模型开发原理,涵盖人工智能发展历程及Transformer神经网络的关键作用。详解其注意力机制如何提升信息处理智能,并解析大语言模型(LLM)如何通过持续生成实现连贯文本输出,帮助理解GPT等模型的工作机制。
  • 12.11 10:24:23
    发表了文章 2025-12-11 10:24:23

    结束语

    从数组链表到搜索引擎、推荐系统,信息技术不断演进。信息爆炸时代,唯有构建思维的“检索引擎”,筛选、提炼有价值的知识,才能不被洪流淹没。学会迭代认知,打好基础,步步为营,方能跟上时代,迈向更高台阶。(238字)
  • 12.11 10:23:28
    发表了文章 2025-12-11 10:23:28

    20 | 推荐引擎:没有搜索词,「头条」怎么找到你感兴趣的文章?

    本文深入解析了资讯类App推荐引擎的检索技术。通过“下拉刷新”背后的个性化召回机制,介绍了推荐系统如何在无搜索词情况下,基于用户行为数据构建用户与文章画像,并运用基于内容和协同过滤(用户/物品)的召回算法实现精准推荐,最后通过多路混合与分层排序优化性能。
  • 12.11 10:23:00
    发表了文章 2025-12-11 10:23:00

    19 | 广告系统:广告引擎如何做到在 0.1s 内返回广告信息?

    广告系统是互联网核心营收支柱,支撑Google、Facebook等巨头超80%收入。本文解析其高性能架构:通过标签与向量检索结合、树形分片、倒排索引及非精准打分预筛,实现每秒百万级请求下0.1秒内精准响应,揭秘高并发低延迟背后的工程智慧。
  • 12.11 10:22:30
    发表了文章 2025-12-11 10:22:30

    18 | 搜索引擎:输入搜索词以后,搜索引擎是怎么工作的?

    本文介绍了搜索引擎的核心架构与工作原理,重点解析了爬虫、索引和检索三大系统。通过分词、纠错、推荐和位置索引等技术,搜索引擎能精准理解用户意图并高效召回结果,是文本检索领域的关键技术参考。
  • 12.11 10:21:45
    发表了文章 2025-12-11 10:21:45

    17 | 存储系统:从检索技术角度剖析 LevelDB 的架构设计思想

    LevelDB是Google开源的高性能键值存储系统,基于LSM树优化,采用跳表、读写分离、SSTable分层与Compaction等技术,结合BloomFilter、缓存机制与二分查找,大幅提升读写效率,广泛应用于工业级系统。
  • 12.11 10:20:59
    发表了文章 2025-12-11 10:20:59

    特别加餐 | 高性能检索系统中的设计漫谈

    本文系统梳理了高性能检索系统中的四大核心设计思想:索引与数据分离、减少磁盘IO、读写分离和分层处理。通过典型案例对比与深入分析,揭示其本质原理与通用经验,帮助开发者在实际场景中合理应用,提升系统性能与可维护性。
  • 12.11 10:20:32
    发表了文章 2025-12-11 10:20:32

    16 | 最近邻检索(下):如何用乘积量化实现「拍照识花」功能?

    本文深入浅出地讲解了AI时代图片检索的核心技术:从特征提取、聚类算法(如K-Means)与局部敏感哈希的对比,到乘积量化压缩向量、结合倒排索引提升效率。重点剖析了如何通过聚类划分空间、用乘积量化大幅降低存储开销,并实现高效近似最近邻搜索。这些技术广泛应用于以图搜图、拍照识物、推荐系统等场景,是现代高维向量检索的基石。
  • 12.11 10:20:02
    发表了文章 2025-12-11 10:20:02

    15 | 最近邻检索(上):如何用局部敏感哈希快速过滤相似文章?

    在搜索引擎与推荐系统中,相似文章去重至关重要。通过向量空间模型将文档表示为高维向量,利用SimHash等局部敏感哈希技术,可高效实现近似最近邻检索。SimHash保留关键词权重,生成紧凑哈希值,结合抽屉原理分段建立倒排索引,显著提升海明距离内的相似文档检索效率,广泛应用于网页去重、图像识别等场景。
  • 12.11 10:19:37
    发表了文章 2025-12-11 10:19:37

    14 | 空间检索(下):「查找最近的加油站」和「查找附近的人」有何不同?

    本文探讨了在动态查询范围内高效检索“最近的k个目标”的方案。针对GeoHash编码的局限性,提出利用四叉树和前缀树等树形结构,实现空间的层次化划分与快速范围扩展。通过非满四叉树优化存储,避免稀疏数据下的空间浪费,并以前缀树支持GeoHash字符串的高效索引。最终实现了查询范围动态调整时的高性能检索,适用于加油站、医院等“最近”需求场景。
  • 12.11 10:19:11
    发表了文章 2025-12-11 10:19:11

    13 | 空间检索(上):如何用 Geohash 实现「查找附近的人」功能?

    本文介绍了如何高效实现“查找附近的人”功能,提出基于Geohash的区域划分与编码方法,通过非精准与精准检索结合,提升大规模系统下地理位置查询性能。
  • 12.11 10:18:45
    发表了文章 2025-12-11 10:18:45

    12 | 非精准 Top K 检索:如何给检索结果的排序过程装上加速器?

    本文介绍了非精准 Top K 检索的优化思路及三种实现方法:基于静态质量得分排序截断、胜者表利用词频打分、分层索引两阶段检索。核心思想是将复杂计算前置到离线阶段,在线时快速截断,降低打分开销。该方法广泛应用于搜索与推荐系统,通过召回+排序两阶段架构,在保证结果质量的前提下显著提升检索效率。
  • 12.11 10:18:17
    发表了文章 2025-12-11 10:18:17

    11|精准 Top K 检索:搜索结果是怎么进行打分排序的?

    搜索引擎排序直接影响用户体验,核心是Top K检索。本文详解三种打分算法:经典TF-IDF衡量词频与区分度;BM25优化词频饱和与文档长度影响;机器学习融合多因子自动调权。最后用堆排序提升Top K效率,实现高效精准排序。
  • 12.11 10:17:46
    发表了文章 2025-12-11 10:17:46

    10 | 索引拆分:大规模检索系统如何使用分布式技术加速检索?

    在大规模检索系统中,分布式技术通过拆分倒排索引提升性能。基于文档的水平拆分将数据随机分片,各服务器并行处理,缩短单次查询时间,且易于扩展与维护;而基于关键词的垂直拆分虽减少请求复制,但易引发负载不均与运维复杂。工业界更倾向文档拆分,因其具备良好均衡性、可扩展性,支持高效检索与平滑扩容,是主流实践方案。(238字)
  • 12.11 10:17:09
    发表了文章 2025-12-11 10:17:09

    09 | 索引更新:刚发布的文章就能被搜到,这是怎么做到的?

    本文介绍了工业界倒排索引的高效更新机制。针对小规模内存索引,采用Double Buffer实现无锁读写;对于大规模数据,则使用“全量+增量”索引结合方案,并通过删除列表处理删改。为避免频繁重建开销,提出滚动合并法,逐层整合天级、周级至全量索引,兼顾性能与资源。核心思想是读写分离,提升系统并发与稳定性。(238字)
  • 12.11 10:16:41
    发表了文章 2025-12-11 10:16:41

    08 | 索引构建:搜索引擎如何为万亿级别网站生成索引?

    针对超大规模数据场景,如搜索引擎需处理万亿级网页,倒排索引远超内存容量。本文介绍通过分治思想将文档集拆分为小块,在内存中构建局部倒排索引,再写入磁盘生成有序临时文件,最后利用多路归并技术合并为全局倒排索引。该过程可迁移至MapReduce框架实现分布式加速。检索时,优先将词典加载至内存(如哈希表或FST),结合B+树或跳表等结构高效访问磁盘中的posting list,辅以缓存优化IO。核心理念是“数据尽量入内存”与“分而治之”,兼顾效率与扩展性。
  • 12.11 10:16:08
    发表了文章 2025-12-11 10:16:08

    07 | NoSQL 检索:为什么日志系统主要用 LSM 树而非 B+ 树?

    LSM树专为高频写入场景设计,适用于日志、监控等大数据系统。它将数据先写入内存C0树,达到阈值后批量合并至磁盘C1树,避免B+树的随机写性能瓶颈。通过WAL保障崩溃恢复,利用顺序写提升效率,适合写多读少、查新数据为主的场景,是NoSQL数据库的核心技术之一。(238字)
  • 12.11 10:15:39
    发表了文章 2025-12-11 10:15:39

    06丨数据库检索:如何使用 B+ 树对海量磁盘数据建立索引?

    本讲探讨大规模数据下磁盘检索的挑战与解决方案,重点解析B+树如何通过索引与数据分离、多阶平衡树结构及双向链表优化,实现高效随机与范围查询,降低磁盘IO次数,广泛应用于数据库等工业系统。
  • 12.11 10:15:11
    发表了文章 2025-12-11 10:15:11

    特别加餐丨倒排检索加速(二):如何对联合查询进行加速?

    本文深入讲解工业界倒排索引中联合查询的四大加速方法:调整次序法利用集合大小排序与数学分配律优化计算顺序;快速多路归并法结合跳表提升多列表归并效率;预先组合法对高频查询提前计算结果;缓存法则通过LRU机制缓存热点查询,减少重复计算。四种方法从数学、算法到工程实践,全面提升检索性能。
  • 12.11 10:14:41
    发表了文章 2025-12-11 10:14:41

    特别加餐 | 倒排检索加速(一):工业界如何利用跳表、哈希表、位图进行加速?

    本文深入解析倒排索引中求交集的三大加速技术:跳表、哈希表与位图,并结合工业级实践,介绍Roaring Bitmap如何融合三种基础数据结构,实现高效检索与空间压缩的平衡,展现基础算法在真实系统中的强大应用。
  • 12.11 10:14:04
    发表了文章 2025-12-11 10:14:04

    测一测丨检索算法基础,你掌握了多少?

    本文解析了多种数据结构的查询效率与适用场景,涵盖无序与有序数据的查找代价、二叉搜索树与跳表的平衡性、哈希表冲突处理、位图与布隆过滤器特性,以及倒排索引的设计原理,系统比较了各结构在时间、空间与功能上的优劣。
  • 12.11 10:13:28
    发表了文章 2025-12-11 10:13:28

    05 | 倒排索引:如何从海量数据中查询同时带有「极」和「客」的唐诗?

    本文通过唐诗检索的类比,深入浅出地讲解了正排索引与倒排索引的原理与应用。正排索引以文档ID为键,适合精确查找;而倒排索引以关键词为键,指向包含该词的文档列表,极大提升了关键词搜索效率。文章详细介绍了倒排索引的构建过程:文档编号、关键词解析、哈希表插入,并解释了如何通过归并有序链表实现多关键词联合查询(如交集、并集)。此外,还探讨了作者维度的扩展索引、敏感词检测的实现难点及大规模索引的存储优化方案,如压缩、磁盘索引和分布式分片。倒排索引虽原理简单,却是搜索引擎、数据库全文检索等系统的核心技术基础。
  • 12.11 10:12:55
    发表了文章 2025-12-11 10:12:55

    04 | 状态检索:如何快速判断一个用户是否存在?

    本文探讨高效判断对象“是否存在”的问题,对比有序数组、二分查找树和哈希表的查询效率,引出位图与布隆过滤器的优化方案。位图利用bit节省空间,实现O(1)查询;布隆过滤器通过多哈希函数进一步压缩空间,适用于允许误判的快速预检场景,如用户注册、网页抓取去重等。
  • 12.11 10:12:25
    发表了文章 2025-12-11 10:12:25

    03 | 哈希检索:如何根据用户 ID 快速查询用户信息?

    本文介绍了哈希表的原理与实现。通过哈希函数将键转换为数组下标,利用数组随机访问特性实现O(1)级查询。针对哈希冲突,讲解了开放寻址法(如线性探查、二次探查、双散列)和链表法两种解决方案,并分析其优劣。最后指出哈希表虽高效,但需足够空间避免高冲突,且不支持有序操作。结合红黑树优化长链表,提升性能。
  • 12.11 10:11:48
    发表了文章 2025-12-11 10:11:48

    02 | 非线性结构检索:数据频繁变化的情况下,如何高效检索?

    通过树状结构或跳表组织数据,可实现高效二分查找。二叉检索树利用有序性快速缩小搜索范围,平衡时查询效率为O(log n);跳表则通过多层指针加速链表遍历,以概率平衡实现近似O(log n)性能,二者均优于数组在频繁更新场景下的表现。
  • 12.11 10:10:36
    发表了文章 2025-12-11 10:10:36

    01 | 线性结构检索:从数组和链表的原理初窥检索本质

    本文探讨数组与链表的检索原理及效率。数组支持随机访问,适合二分查找,检索效率为O(log n);链表虽检索较慢,但插入删除高效。通过合理组织数据结构,可提升检索性能,掌握其核心思想对构建高效系统至关重要。(238字)
  • 发表了文章 2025-12-11

    4.2 服务端(Cursor)-接口开发(部门管理)

  • 发表了文章 2025-12-11

    4.4 服务端(Cursor)-接口开发(文件上传)

  • 发表了文章 2025-12-11

    4.3 服务端(Cursor)-接口开发(员工管理)

  • 发表了文章 2025-12-11

    4.1 服务端(DevBox)-项目创建

  • 发表了文章 2025-12-11

    Chap03. SpringAI

  • 发表了文章 2025-12-11

    特别加餐 | 高性能检索系统中的设计漫谈

  • 发表了文章 2025-12-11

    13 | 空间检索(上):如何用 Geohash 实现「查找附近的人」功能?

  • 发表了文章 2025-12-11

    16 | 最近邻检索(下):如何用乘积量化实现「拍照识花」功能?

  • 发表了文章 2025-12-11

    15 | 最近邻检索(上):如何用局部敏感哈希快速过滤相似文章?

  • 发表了文章 2025-12-11

    18 | 搜索引擎:输入搜索词以后,搜索引擎是怎么工作的?

  • 发表了文章 2025-12-11

    Chap01. 认识AI

  • 发表了文章 2025-12-11

    20 | 推荐引擎:没有搜索词,「头条」怎么找到你感兴趣的文章?

  • 发表了文章 2025-12-11

    17 | 存储系统:从检索技术角度剖析 LevelDB 的架构设计思想

  • 发表了文章 2025-12-11

    11|精准 Top K 检索:搜索结果是怎么进行打分排序的?

  • 发表了文章 2025-12-11

    09 | 索引更新:刚发布的文章就能被搜到,这是怎么做到的?

  • 发表了文章 2025-12-11

    19 | 广告系统:广告引擎如何做到在 0.1s 内返回广告信息?

  • 发表了文章 2025-12-11

    12 | 非精准 Top K 检索:如何给检索结果的排序过程装上加速器?

  • 发表了文章 2025-12-11

    结束语

  • 发表了文章 2025-12-11

    10 | 索引拆分:大规模检索系统如何使用分布式技术加速检索?

  • 发表了文章 2025-12-11

    14 | 空间检索(下):「查找最近的加油站」和「查找附近的人」有何不同?

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息