开发者学堂课程【Lucene 知识精讲与实战(上):全文检索技术使用场景】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/700/detail/12325
全文检索技术使用场景
内容介绍:
一、站内搜索
二、垂直领域的搜索
三、专业搜索引擎公司
一、站内搜索
比如 Baidu 贴吧、论坛、京东、Taobao,他们的数据量非常庞大,京东和 Taobao 保存的是商品信息,贴吧保存的是大量的文本信息,论坛也是大量的文本信息,这些内容数据量非常大,使用的都是全文检索技术,速度会非常快。
二、垂直领域的搜索
比如818工作网,什么是垂直领域?一个产品或者一个公司,只专注于某一块作用,就叫做垂直领域,比如像智联招聘,只关注招聘信息,就属于招聘信息的垂直领域,对于简历这些,也是属于文本信息,用全文检索这种技术速度也会非常快。
三、专业搜索引擎公司
比如 Google、Baidu,那他们是怎么搜集数据的?首先通过互联网的网络查重,然后查全球所有的网站,把网站的相关信息查出来,存储到他们的服务器当中,就通过他们的浏览器搜索,就能找到用户需要的网站,通过点击他们的链接,就能直接跳转到相关的网站上去,他们也是用的全文检索技术,但未必用的是 Lucene,Lucene 常用的是全文检索技术。
总的来说是在大数据量查询的时候对速度上面有要求的就使用全文检索技术。