全文检索技术使用场景|学习笔记

简介: 快速学习全文检索技术使用场景

开发者学堂课程【Lucene 知识精讲与实战(上)全文检索技术使用场景】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/700/detail/12325


全文检索技术使用场景


内容介绍:

一、站内搜索

二、垂直领域的搜索

三、专业搜索引擎公司

 

一、站内搜索

比如 Baidu 贴吧、论坛、京东、Taobao,他们的数据量非常庞大,京东和 Taobao 保存的是商品信息,贴吧保存的是大量的文本信息,论坛也是大量的文本信息,这些内容数据量非常大,使用的都是全文检索技术,速度会非常快。

 

二、垂直领域的搜索

比如818工作网,什么是垂直领域?一个产品或者一个公司,只专注于某一块作用,就叫做垂直领域,比如像智联招聘,只关注招聘信息,就属于招聘信息的垂直领域,对于简历这些,也是属于文本信息,用全文检索这种技术速度也会非常快。

 

三、专业搜索引擎公司

比如 Google、Baidu,那他们是怎么搜集数据的?首先通过互联网的网络查重,然后查全球所有的网站,把网站的相关信息查出来,存储到他们的服务器当中,就通过他们的浏览器搜索,就能找到用户需要的网站,通过点击他们的链接,就能直接跳转到相关的网站上去,他们也是用的全文检索技术,但未必用的是 Lucene,Lucene 常用的是全文检索技术。

总的来说是在大数据量查询的时候对速度上面有要求的就使用全文检索技术。

相关文章
|
存储 缓存 达摩院
企查查基于阿里云Elasticsearch 在复杂检索场景中的性能优化
本文分享企查查基于阿里云Elasticsearch 在复杂检索场景中的性能优化。
1281 0
|
8天前
|
搜索推荐 API 定位技术
一文看懂Elasticsearch的技术架构:高效、精准的搜索神器
Elasticsearch 是一个基于 Lucene 的开源搜索引擎,以其强大的全文本搜索功能和快速的倒排索引技术著称。它不仅支持数字、文本、地理位置等多类型数据,还提供了可调相关度分数、高级查询 DSL 等功能。Elasticsearch 的核心技术流程包括数据导入、解析、索引化、查询处理、得分计算及结果返回,确保高效处理大规模数据并提供准确的搜索结果。通过 RESTful API、Logstash 和 Filebeat 等工具,Elasticsearch 可以从多种数据源中导入和解析数据,支持复杂的查询需求。
42 0
|
2月前
|
开发框架 监控 搜索推荐
GoFly快速开发框架集成ZincSearch全文搜索引擎 - Elasticsearch轻量级替代为ZincSearch全文搜索引擎
本文介绍了在项目开发中使用ZincSearch作为全文搜索引擎的优势,包括其轻量级、易于安装和使用、资源占用低等特点,以及如何在GoFly快速开发框架中集成和使用ZincSearch,提供了详细的开发文档和实例代码,帮助开发者高效地实现搜索功能。
203 0
|
5月前
|
运维 监控 Java
在大数据场景下,Elasticsearch作为分布式搜索与分析引擎,因其扩展性和易用性成为全文检索首选。
【7月更文挑战第1天】在大数据场景下,Elasticsearch作为分布式搜索与分析引擎,因其扩展性和易用性成为全文检索首选。本文讲解如何在Java中集成Elasticsearch,包括安装配置、使用RestHighLevelClient连接、创建索引和文档操作,以及全文检索查询。此外,还涉及高级查询、性能优化和故障排查,帮助开发者高效处理非结构化数据。
79 0
|
存储 缓存 搜索推荐
百度搜索:蓝易云【Elasticsearch 底层技术原理以及性能优化实践】
和副本、优化硬件、设计合理的索引、编写高效的查询以及利用缓存和预热等策略。通过综合考虑这些方面,可以提升Elasticsearch的性能并获得更好的搜索和分析体验。
324 0
|
7月前
|
SQL 调度 Swift
【深入浅出】阿里自研开源搜索引擎Havenask日志查询
本次分享内容为Havenask的日志查询,文章包含了具体查询步骤和举例、实操演示,希望可以帮助大家更好的使用Havenask。
55374 0
|
7月前
|
自然语言处理 关系型数据库 PostgreSQL
|
存储 SQL 搜索推荐
01全文检索技术介绍
01全文检索技术介绍
90 0
|
存储 搜索推荐 大数据
|
存储 固态存储 JavaScript
Elasticsearch 亿级数据检索性能优化案例实战
Elasticsearch 亿级数据检索性能优化案例实战