搜索流程详细分析|学习笔记

简介: 快速学习搜索流程详细分析

开发者学堂课程【Lucene 知识精讲与实战(上) 搜索流程详细分析】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/700/detail/12329


搜索流程详细分析


内容介绍

一、搜索界面展示

二、搜索过程原理

 

一、搜索界面展示

一般会在搜索页面的输入关键字的词条输入用户要搜索的关键字,点击搜索,就会显示搜索结果。

image.png


二、搜索过程原理

内部的结构原理是关键字有可能是一个字一个词一句话,如果是一句话或者是多个词的话会对这句话和多个词进行切分词,之后会对切分之后的词一个个进行搜索,如果输入的是“华为手机”,就会被切分为“华为”、“手机”,会搜索出包含关键字“华为”和“手机”的文档,如果“华为”、“手机”之间的关系是并且(相交)的关系,那么搜索出来的文档既要包含“华为”,也要包含“手机”。

原理如下图:

image.png

词之间的关系是交集还是并集,要看自己写的代码,根据自己的需要来写,不管是交集还是并集,都是要去掉重复的词。索引的过程和搜索的过程都用代码。

下面就是查询 Lucene 的结果,不仅有百度百科还有官网等等信息:

image.png

相关文章
|
域名解析 关系型数据库 MySQL
怎样用自己电脑搭建网络服务器!不花一分钱
怎样用自己电脑搭建网络服务器!不花一分钱
1374 1
|
安全 物联网 网络安全
|
数据安全/隐私保护
基于双PI控制的永磁同步电机变频调速系统simulink建模与仿真
本课题针对基于双PI控制的永磁同步电机(PMSM)变频调速系统,进行Simulink建模与仿真。系统采用MATLAB2022a实现,包含完整核心程序与无水印仿真结果。双PI控制器分别对速度和电流闭环控制,结合dq坐标变换及SVPWM技术,确保电机高效运行与精确调速。内容涵盖系统原理、数学模型与控制策略,适合学习与研究使用。
|
Web App开发 人工智能 JavaScript
Nanobrowser:开源版OpenAI Operator!AI自动操控浏览器,复杂网页任务一键搞定
Nanobrowser 是一款开源的 Chrome 扩展工具,基于多智能体系统实现复杂的网页任务自动化,支持多种大型语言模型,完全免费且注重隐私保护。
2022 1
|
机器学习/深度学习 数据可视化 网络架构
增强深度学习模型的可解释性和泛化能力的方法研究
【8月更文第15天】在深度学习领域,模型的准确率和预测能力是衡量模型好坏的重要指标。然而,随着模型复杂度的增加,它们往往变得越来越难以理解,这限制了模型在某些关键领域的应用,例如医疗诊断、金融风险评估等。本文将探讨如何通过几种方法来增强深度学习模型的可解释性,同时保持或提高模型的泛化能力。
1590 2
|
11月前
|
弹性计算 Docker 容器
构建dify
本教程介绍如何在ECS服务器上使用Docker构建Dify。首先拉取最新镜像`langgenius/dify-web:latest`,然后通过命令运行该镜像,映射端口并设置环境变量。需在安全组中添加入方向规则,放行指定端口(如3000)。完成后保存规则,初始化安装Dify,并登录Web界面验证部署是否成功。
1260 17
|
监控 安全 网络协议
Hyper V上网实战:多虚拟机网络环境配置
在Hyper-V环境中配置多虚拟机网络以实现上网功能,需完成以下步骤:1. 确认Hyper-V安装与物理网络连接正常;2. 配置虚拟交换机(外部、内部或专用)以支持不同网络需求;3. 设置虚拟机网络适配器并关联对应虚拟交换机;4. 验证虚拟机网络连接状态;5. 根据场景需求优化多虚拟机网络环境。此外,还需注意网络隔离、性能监控及数据备份等事项,确保网络安全稳定运行。
|
人工智能 小程序 前端开发
【一步步开发AI运动小程序】六、人体骨骼图绘制
随着AI技术的发展,阿里体育等公司推出的AI运动APP如“乐动力”、“天天跳绳”等,使云上运动会、线上健身等概念广受欢迎。本文将引导您从零开始,利用“云智AI运动识别小程序插件”,在小程序中实现类似功能,包括人体骨骼图的绘制原理及其实现代码,确保骨骼图与人体图像精准重合。下篇将继续介绍运动分析方法。
|
JSON Go 网络架构
langchain 入门指南 - 自动选择不同的大模型
langchain 入门指南 - 自动选择不同的大模型
879 0
|
设计模式 Java 测试技术
【Selenium使用误区】Iframe元素定位失败:避免误提GitHub Issue的技巧
本文分享了作者在使用Selenium进行UI自动化测试时遇到的一个常见问题:在模拟登录163邮箱的过程中,元素定位失败,原因是没有正确地定位到iframe内的元素。文章通过分析问题原因、提供解决方案和附录代码,指导读者如何避免类似的错误,并强调了在UI自动化测试中准确定位页面元素的重要性。
394 1

热门文章

最新文章