开发者学堂课程【Lucene 知识精讲与实战(上): 为什么要使用 Lucene】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/700/detail/12322
为什么要使用 Lucene
内容介绍
一、传统 Web 开发的原理
二、利用 Lucene 技术解决问题
一、传统 Web 开发的原理
一般对于数据,会存到传统的 mySQL 数据库,在搜索的时候,用户通过浏览器发出请求到项目当中,通过项目存到 Controller、service、Dao 中,Dao 可能会通过事件型框架去访问 mySQL 数据库,从数据库中传输数据,然后返回项目,项目又把数据返回给用户的浏览器,还会涉及到服务器的渲染,或者浏览器的渲染,返回给用户的浏览器展现出来,这时就涉及到一个问题,对于小量的数据,传统体验,比如 OA 系统、亚希系统把数据放到数据库当中,访问量比较小,数据量也比较少,这个没有问题,速度依然很快,如果涉及到互联网企业,涉及到高数据量高并发的时候,如果都从 mySQL 数据库当中去查这个海量数据,尤其是遇到一些中文查询,进行“like”这个模糊查询的时候,数据库返回的数据会非常的慢,遇到高并发的数据的时候数据库也会出现卡死的状态。
二、利用 Lucene 技术解决问题
这时候就会有一个搜索的方案,就是用这个 Lucene 技术,可以优化加快我们的查询效率,
如果 Lucene 是怎么查询,首先通过发送请求,到项目当中,项目之前是去访问数据库,现在不一样,现在的Lucene有他自己的一个库,叫做索引库,索引库当中放着的就是要查询的数据,项目会查到 Lucene 的索引库,索引库查数据之后返回项目,然后项目再把数据返回给用户,这个效率回比从数据库中查要快得多,可以利用海量数据来查询。
索引库中的数据是如何来的,一般在企业中,一般把数据放到 mySQL 等等官方数据库当中,因为这些数据库会有索引还有很多的这种特性,所以在传统的官方数据库是比较靠谱的,但是查询提醒数据库要查这个数据,给它扔到 Lucene 索引库中去查,在查的时候就直接在索引库中查了,因为索引库的数据跟数据库中要被查的数据是一样的,所以说从索引库中查就可以了,查的时候是直接从索引库中查的,相当于也给数据库降低了高并发访问的压力,索引库的数据来源不止数据库,还有文档和互联网的 web 网页,比如百度,当在查询的时候百度会把很多网页都搜集起来。
通过上面的讲解就能知道 Lucene 是一种查询技术,并且查询得很快,支持海量数据和高并发数据的查询。