全文检索技术使用场景|学习笔记

简介: 快速学习全文检索技术使用场景

开发者学堂课程【Lucene 知识精讲与实战(上)全文检索技术使用场景】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/700/detail/12325


全文检索技术使用场景


内容介绍:

一、站内搜索

二、垂直领域的搜索

三、专业搜索引擎公司

 

一、站内搜索

比如 Baidu 贴吧、论坛、京东、Taobao,他们的数据量非常庞大,京东和 Taobao 保存的是商品信息,贴吧保存的是大量的文本信息,论坛也是大量的文本信息,这些内容数据量非常大,使用的都是全文检索技术,速度会非常快。

 

二、垂直领域的搜索

比如818工作网,什么是垂直领域?一个产品或者一个公司,只专注于某一块作用,就叫做垂直领域,比如像智联招聘,只关注招聘信息,就属于招聘信息的垂直领域,对于简历这些,也是属于文本信息,用全文检索这种技术速度也会非常快。

 

三、专业搜索引擎公司

比如 Google、Baidu,那他们是怎么搜集数据的?首先通过互联网的网络查重,然后查全球所有的网站,把网站的相关信息查出来,存储到他们的服务器当中,就通过他们的浏览器搜索,就能找到用户需要的网站,通过点击他们的链接,就能直接跳转到相关的网站上去,他们也是用的全文检索技术,但未必用的是 Lucene,Lucene 常用的是全文检索技术。

总的来说是在大数据量查询的时候对速度上面有要求的就使用全文检索技术。

相关文章
|
8天前
|
监控 数据可视化 搜索推荐
初识Elasticsearch:打造高效全文搜索与数据分析引擎
【4月更文挑战第7天】Elasticsearch,一款由Elastic公司开发的分布式搜索引擎,以其全文搜索和数据分析能力在全球范围内广泛应用。它基于Apache Lucene,支持JSON,适用于日志分析、监控等领域。Elasticsearch的亮点包括:精准快速的全文搜索,通过倒排索引和分析器实现;强大的数据分析与实时响应能力,提供丰富聚合功能;弹性扩展和高可用性,适应水平扩展和故障恢复;以及完善的生态系统,与Kibana、Logstash等工具集成,支持多种编程语言。作为大数据处理的重要工具,Elasticsearch在企业级搜索和数据分析中扮演关键角色。
22 1
|
29天前
|
数据库
第四章数据查询基础
第四章数据查询基础
7 0
|
6月前
|
存储 缓存 搜索推荐
百度搜索:蓝易云【Elasticsearch 底层技术原理以及性能优化实践】
和副本、优化硬件、设计合理的索引、编写高效的查询以及利用缓存和预热等策略。通过综合考虑这些方面,可以提升Elasticsearch的性能并获得更好的搜索和分析体验。
280 0
|
Web App开发 关系型数据库 数据库
用PostgreSQL 做实时高效 搜索引擎 - 全文检索、模糊查询、正则查询、相似查询、ADHOC查询
用PostgreSQL 做实时高效 搜索引擎 - 全文检索、模糊查询、正则查询、相似查询、ADHOC查询作者digoal 日期2017-12-05 标签PostgreSQL , 搜索引擎 , GIN , ranking , high light , 全文检索 , 模糊查询 , 正则查询 , 相似查询 , ADHOC查询 背景字符串搜索是非常常见的业务需求,它包括: 1、前缀+模糊查询。
10245 1
|
9月前
|
SQL 前端开发 关系型数据库
七.全文检索ElasticSearch经典入门-聚合查询
七.全文检索ElasticSearch经典入门-聚合查询
|
5月前
|
存储 关系型数据库 MySQL
MySQL索引探秘:加速数据检索的必备利器
MySQL索引探秘:加速数据检索的必备利器
226 0
|
8月前
|
数据采集 Java 程序员
高并发海量数据爬取,哪种语言更适合?
高并发海量数据爬取,哪种语言更适合?
|
10月前
|
存储 搜索推荐 大数据
|
12月前
|
存储 固态存储 JavaScript
Elasticsearch 亿级数据检索性能优化案例实战
Elasticsearch 亿级数据检索性能优化案例实战
|
JSON 自然语言处理 Java
39-微服务技术栈(高级):分布式搜索引擎ElasticSearch(索引库、文档操作)
在前面读者朋友们可以了解到ES承载着和MySQL一样的“存储-查询”功能,那么就类似的会有建表语句、表结构、表数据,有了这些才可以存储-查询数据。而这些对应的在ES中是:Mapping映射(表结构-建表语句)、索引库(表本身)、文档(表数据)。本节笔者将带领大家完整上述概念的创建、使用。
119 0