nick1153007561_个人页

nick1153007561
0
0
0

个人介绍

暂无个人介绍

擅长的技术

获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息

2025年12月

  • 12.12 09:12:55
    发表了文章 2025-12-12 09:12:55

    05 | 动态代理:面向接口编程,屏蔽 RPC 处理流程

    本讲深入解析动态代理在 RPC 中的核心作用:通过动态代理实现接口方法的透明拦截,将本地调用无缝转为远程通信。结合 JDK 动态代理实例,揭示代理类生成与调用原理,并对比 Javassist、Byte Buddy 等框架在性能与易用性上的差异,帮助理解 RPC 如何实现“像调用本地一样调用远程”的编程体验。(238字)
  • 12.12 09:10:49
    发表了文章 2025-12-12 09:10:49

    04 | 网络通信:RPC 框架在网络通信上更倾向于哪种网络 IO 模型?

    本讲深入讲解RPC框架中的网络通信机制,重点分析同步阻塞IO与IO多路复用模型的原理及适用场景,阐明高并发下IO多路复用的优势。结合Netty等主流框架,探讨零拷贝技术在提升性能中的关键作用,涵盖操作系统层与用户空间的优化策略,助力构建高效、稳定的RPC通信体系。(239字)
  • 12.12 09:10:02
    发表了文章 2025-12-12 09:10:02

    02 | 协议:怎么设计可扩展且向后兼容的协议?

    本讲深入讲解RPC协议设计原理,从HTTP协议类比引入,剖析协议在解决网络传输“断句”问题中的关键作用。重点探讨如何通过消息边界、协议头与体的设计实现高效通信,并强调可扩展性对升级兼容的重要性,最终揭示私有RPC协议为何优于HTTP。
  • 12.12 09:08:59
    发表了文章 2025-12-12 09:08:59

    Chap03. SpringAI

    SpringAI整合主流大模型,支持多模态、函数调用与RAG,提供统一API简化开发。通过ChatClient封装对话流程,结合Prompt工程、工具调用和知识库扩展,可快速构建智能客服、聊天机器人等应用,助力Java开发者高效集成AI能力。
  • 12.12 09:07:39
    发表了文章 2025-12-12 09:07:39

    01丨核心原理:能否画张图解释下 RPC 的通信流程?

    RPC(远程过程调用)是一种实现跨服务透明调用的技术,屏蔽网络通信细节,让开发者像调用本地方法一样调用远程服务。它通过序列化、协议解析和动态代理等机制完成远程调用,是微服务架构的“经络”,广泛应用于分布式系统中,提升开发效率与系统解耦能力。
  • 12.12 09:05:04
    发表了文章 2025-12-12 09:05:04

    Chap01. 认识AI

    本文介绍了AI核心概念与大模型开发原理,涵盖人工智能发展历程及Transformer神经网络的关键作用。详解其注意力机制如何提升信息处理智能,并解析大语言模型(LLM)如何通过持续生成实现连贯文本输出,帮助理解GPT等模型的工作机制。(238字)
  • 12.12 09:03:26
    发表了文章 2025-12-12 09:03:26

    20 | 推荐引擎:没有搜索词,「头条」怎么找到你感兴趣的文章?

    本文深入解析了资讯类App推荐引擎的底层技术,重点探讨其在无搜索词场景下如何通过“下拉刷新”实现个性化内容召回。核心在于用户与文章画像构建,并结合基于内容与协同过滤的召回算法。基于内容的召回依赖标签匹配与向量检索,适合冷启动;协同过滤则通过用户或物品相似性推荐,挖掘潜在兴趣。实际系统多采用混合召回策略,结合多路结果并分层排序,在保证多样性的同时提升推荐精准度与效率。
  • 12.12 09:02:31
    发表了文章 2025-12-12 09:02:31

    19 | 广告系统:广告引擎如何做到在 0.1s 内返回广告信息?

    广告系统是互联网核心营收支柱,支撑Google、Facebook等巨头超80%收入。其背后依赖高性能广告引擎,实现高并发、低延迟的“千人千面”精准投放。本文深入解析广告引擎架构,涵盖标签检索、向量匹配、打分排序与索引优化四大关键技术,揭示如何在0.1秒内完成从请求到广告返回的全过程,打造高效智能的广告生态体系。(238字)
  • 12.12 09:02:14
    发表了文章 2025-12-12 09:02:14

    18 | 搜索引擎:输入搜索词以后,搜索引擎是怎么工作的?

    本文介绍了搜索引擎的核心架构与工作原理,重点解析了爬虫、索引和检索三大系统。通过分词、纠错、推荐等查询分析技术,结合倒排索引与位置信息索引法,搜索引擎能精准理解用户意图并高效返回相关结果。特别地,以“极客时间”为例,深入讲解了短语检索中最小窗口排序与多关键词相关性判断机制,揭示了搜索背后的技术逻辑。(238字)
  • 12.12 09:02:03
    发表了文章 2025-12-12 09:02:03

    17 | 存储系统:从检索技术角度剖析 LevelDB 的架构设计思想

    LevelDB是Google开源的高性能键值存储系统,基于LSM树优化,采用跳表、读写分离、SSTable分层与Compaction等技术,结合BloomFilter、缓存机制与二分查找,显著提升数据读写与检索效率,广泛应用于工业级系统中。(239字)
  • 12.12 09:00:22
    发表了文章 2025-12-12 09:00:22

    特别加餐 | 高性能检索系统中的设计漫谈

    本文深入解析高性能系统中的四大核心设计思想:索引与数据分离、减少磁盘IO、读写分离与分层处理。通过典型案例对比与扩展分析,揭示其本质与通用经验,帮助开发者在实际场景中优化检索效率、提升系统性能,打造高效稳定的架构。
  • 12.12 09:00:09
    发表了文章 2025-12-12 09:00:09

    16 | 最近邻检索(下):如何用乘积量化实现「拍照识花」功能?

    本文深入解析了AI时代图片检索的核心技术,涵盖聚类算法与局部敏感哈希的差异、乘积量化压缩向量原理及倒排索引优化。通过K-Means聚类与乘积量化结合,实现高效近似最近邻搜索,在节省存储的同时提升检索速度,广泛应用于以图搜图、商品识别与推荐系统等领域。
  • 12.12 08:59:01
    发表了文章 2025-12-12 08:59:01

    14 | 空间检索(下):「查找最近的加油站」和「查找附近的人」有何不同?

    本文探讨了动态调整查询范围的高效检索方案,重点介绍如何利用四叉树和前缀树优化“查找最近的k个目标”场景。针对GeoHash固定范围查询的局限性,提出通过非满四叉树实现动态分裂与回溯查询,在保证效率的同时节省存储空间;并引出前缀树对GeoHash字符串编码的高效索引方法。最后拓展至高维场景,简述k-d树的适用性与挑战,为近邻搜索提供系统性解决方案。
  • 12.12 08:58:42
    发表了文章 2025-12-12 08:58:42

    15 | 最近邻检索(上):如何用局部敏感哈希快速过滤相似文章?

    在搜索引擎与推荐系统中,相似文章去重至关重要。本文介绍如何利用向量空间模型将文章转化为高维向量,并通过局部敏感哈希(如SimHash)实现高效近似最近邻检索,结合抽屉原理优化索引,快速找出内容相似的文章,提升用户体验。该技术广泛应用于网页去重、图像识别等场景。
  • 12.12 08:57:15
    发表了文章 2025-12-12 08:57:15

    11|精准 Top K 检索:搜索结果是怎么进行打分排序的?

    搜索引擎排序核心在于打分与Top K检索。本文详解TF-IDF、BM25及机器学习打分方法,阐述如何综合词频、文档长度、查询词权重等因素提升排序质量,并介绍利用堆排序优化大规模数据下Top K结果返回效率,助力构建高效精准检索系统。
  • 12.12 08:57:02
    发表了文章 2025-12-12 08:57:02

    13 | 空间检索(上):如何用 Geohash 实现「查找附近的人」功能?

    本文介绍了如何高效实现“查找附近的人”功能,针对大规模系统提出基于区域划分与Geohash编码的解决方案。通过将二维空间划分为带编号的区域,并利用一维编码(如Geohash)建立索引,可大幅提升检索效率。支持非精准与精准查询:前者直接查所在区域,后者扩展至邻接8区域以避免遗漏,结合二分查找、跳表或Redis等技术实现快速定位。尤其适用于社交、餐饮、出行等LBS场景。
  • 12.12 08:56:11
    发表了文章 2025-12-12 08:56:11

    10 | 索引拆分:大规模检索系统如何使用分布式技术加速检索?

    在大规模检索系统中,分布式技术通过拆分倒排索引提升性能。基于文档的水平拆分将数据随机分布到多台服务器,实现并行检索与负载均衡;基于关键词的垂直拆分则按词典划分,减少请求复制但易引发热点问题。前者扩展性好、运维简单,后者适用于特定高性能场景。合理选择拆分策略是提升系统吞吐与响应速度的关键。
  • 12.12 08:55:59
    发表了文章 2025-12-12 08:55:59

    09 | 索引更新:刚发布的文章就能被搜到,这是怎么做到的?

    本文介绍了工业界倒排索引的高效更新机制。针对小规模内存索引,采用Double Buffer实现无锁读写;对于大规模数据,则使用“全量+增量”索引结合方案,并通过删除列表处理文档删除问题。为避免频繁合并带来的性能开销,进一步引入滚动合并法,逐层整合天级、周级至全量索引,减少冗余IO。核心思想是读写分离,在保障检索性能的同时实现近实时更新。(238字)
  • 12.12 08:53:49
    发表了文章 2025-12-12 08:53:49

    08 | 索引构建:搜索引擎如何为万亿级别网站生成索引?

    针对超大规模数据,可通过分治与多路归并生成内存外倒排索引。先将文档分批在内存建索引,再写入有序临时文件,最后归并为全局索引。检索时结合内存哈希、B+树及分层加载技术,提升效率。
  • 12.12 08:53:41
    发表了文章 2025-12-12 08:53:41

    07 | NoSQL 检索:为什么日志系统主要用 LSM 树而非 B+ 树?

    B+树适用于读多写少场景,但在日志、监控等高频写入的大数据场景中性能受限。LSM树通过将数据分内存(C0树)和磁盘(C1树)两部分存储,利用批量写入替代随机写入,大幅提升写入效率。结合WAL预写日志保障崩溃恢复,滚动合并实现有序归并,特别适合写密集型应用。NoSQL数据库广泛采用此技术。
  • 12.12 08:52:45
    发表了文章 2025-12-12 08:52:45

    06丨数据库检索:如何使用 B+ 树对海量磁盘数据建立索引?

    本节深入探讨磁盘环境下大规模数据检索的挑战与解决方案,重点讲解B+树如何通过索引与数据分离、多阶平衡树结构及双向链表优化,实现高效磁盘I/O和范围查询,广泛应用于数据库等工业级系统。
  • 12.12 08:52:36
    发表了文章 2025-12-12 08:52:36

    特别加餐丨倒排检索加速(二):如何对联合查询进行加速?

    本文介绍工业界联合查询的四种加速方法:调整次序法利用集合大小差异优化求交顺序;快速多路归并法借助跳表提升多列表归并效率;预先组合法对高频查询提前计算结果;缓存法则通过LRU机制缓存热点查询,避免重复计算,全面提升检索性能。
  • 12.12 08:52:19
    发表了文章 2025-12-12 08:52:19

    特别加餐 | 倒排检索加速(一):工业界如何利用跳表、哈希表、位图进行加速?

    本文深入解析倒排索引在工业界如何通过跳表、哈希表和位图加速求交集操作,并介绍Roaring Bitmap如何融合三种基础数据结构优势,在存储与性能间取得平衡,是基础算法在实际系统中综合应用的典范。
  • 12.12 08:50:55
    发表了文章 2025-12-12 08:50:55

    测一测丨检索算法基础,你掌握了多少?

    本文解析了多种数据结构的查询效率与适用场景,涵盖无序/有序数组、链表、二叉检索树、跳表、哈希表、位图及布隆过滤器等。重点比较了它们在插入、查找、遍历等操作的时间空间代价,并探讨了倒排索引的设计原理与应用,如搜索引擎中的高效检索策略。同时指出各类结构的优缺点:如哈希表查询快但空间开销大,有序数组紧凑但插入慢,二叉搜索树性能依赖平衡性等。还澄清了常见误区,例如二分查找不适用于链表,开放寻址法中不能用二分查找解决冲突等。最后通过布隆过滤器和倒排索引的实际案例,说明如何根据业务需求选择合适的数据结构以优化系统性能。
  • 12.12 08:50:39
    发表了文章 2025-12-12 08:50:39

    05 | 倒排索引:如何从海量数据中查询同时带有「极」和「客」的唐诗?

    本文通过唐诗检索的场景,对比正排索引与倒排索引的差异。正排索引以文档ID为键,适合精确查找;而倒排索引以关键词为键,记录包含该词的文档列表,支持高效的关键字搜索。文中详解了倒排索引的构建过程:分词、生成关键字-文档对、插入哈希表,并介绍如何通过归并有序链表实现多关键词联合查询(如交集、并集)。倒排索引广泛应用于搜索引擎、数据库全文检索等系统,是信息检索的核心技术之一。
  • 12.12 08:49:28
    发表了文章 2025-12-12 08:49:28

    04 | 状态检索:如何快速判断一个用户是否存在?

    本文探讨了高效判断对象是否存在的技术方案,对比有序数组、二叉搜索树和哈希表后,重点介绍位图与布隆过滤器。位图利用bit节省空间,实现O(1)查询;布隆过滤器通过多哈希函数进一步压缩空间,适用于允许误判的快速存在性检测场景,广泛用于缓存、爬虫等系统中。
  • 12.12 08:48:26
    发表了文章 2025-12-12 08:48:26

    03 | 哈希检索:如何根据用户 ID 快速查询用户信息?

    本文介绍了哈希表的原理与实现。通过哈希函数将键转换为数组下标,利用数组随机访问特性实现O(1)级查询。针对哈希冲突,讲解了开放寻址法(线性探查、二次探查、双散列)和链表法两种解决方案,并分析其优劣。最后指出哈希表需足够空间以保持低装载因子,且不支持有序操作,适合精确查找但不适合范围查询。
  • 12.12 08:46:47
    发表了文章 2025-12-12 08:46:47

    02 | 非线性结构检索:数据频繁变化的情况下,如何高效检索?

    通过树状结构与跳表,将无序数据组织为可高效检索的非线性结构。二叉检索树利用有序性和二分查找提升效率,跳表则通过多层指针实现快速访问,二者均在动态数据场景下优于有序数组,兼顾查询与更新性能。
  • 12.12 08:45:08
    发表了文章 2025-12-12 08:45:08

    01 | 线性结构检索:从数组和链表的原理初窥检索本质

    本文探讨数组与链表的检索原理,揭示数据存储方式对检索效率的影响。数组支持随机访问,适合二分查找,实现O(log n)高效检索;链表虽检索较慢,但动态调整更灵活。通过理解二者特点,掌握“减少查询范围”的核心思想,为构建高效数据结构打下基础。
  • 发表了文章 2025-12-12

    05 | 动态代理:面向接口编程,屏蔽 RPC 处理流程

  • 发表了文章 2025-12-12

    04 | 网络通信:RPC 框架在网络通信上更倾向于哪种网络 IO 模型?

  • 发表了文章 2025-12-12

    01丨核心原理:能否画张图解释下 RPC 的通信流程?

  • 发表了文章 2025-12-12

    Chap03. SpringAI

  • 发表了文章 2025-12-12

    02 | 协议:怎么设计可扩展且向后兼容的协议?

  • 发表了文章 2025-12-12

    Chap01. 认识AI

  • 发表了文章 2025-12-12

    20 | 推荐引擎:没有搜索词,「头条」怎么找到你感兴趣的文章?

  • 发表了文章 2025-12-12

    10 | 索引拆分:大规模检索系统如何使用分布式技术加速检索?

  • 发表了文章 2025-12-12

    07 | NoSQL 检索:为什么日志系统主要用 LSM 树而非 B+ 树?

  • 发表了文章 2025-12-12

    特别加餐 | 高性能检索系统中的设计漫谈

  • 发表了文章 2025-12-12

    13 | 空间检索(上):如何用 Geohash 实现「查找附近的人」功能?

  • 发表了文章 2025-12-12

    08 | 索引构建:搜索引擎如何为万亿级别网站生成索引?

  • 发表了文章 2025-12-12

    19 | 广告系统:广告引擎如何做到在 0.1s 内返回广告信息?

  • 发表了文章 2025-12-12

    17 | 存储系统:从检索技术角度剖析 LevelDB 的架构设计思想

  • 发表了文章 2025-12-12

    16 | 最近邻检索(下):如何用乘积量化实现「拍照识花」功能?

  • 发表了文章 2025-12-12

    11|精准 Top K 检索:搜索结果是怎么进行打分排序的?

  • 发表了文章 2025-12-12

    15 | 最近邻检索(上):如何用局部敏感哈希快速过滤相似文章?

  • 发表了文章 2025-12-12

    14 | 空间检索(下):「查找最近的加油站」和「查找附近的人」有何不同?

  • 发表了文章 2025-12-12

    09 | 索引更新:刚发布的文章就能被搜到,这是怎么做到的?

  • 发表了文章 2025-12-12

    18 | 搜索引擎:输入搜索词以后,搜索引擎是怎么工作的?

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息