sphinx（八）sphinx增量索引-阿里云开发者社区

sphinx（八）sphinx增量索引

2022-04-25 324

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 主索引的更新频率可以设置的长一些(例如设置在每天的凌晨进行)，而增量索引的更新频率，我们可以将时间设置的很短(几分钟左右)，这样在用户搜索的时候，我们可以同时查询这两个索引的数据。使用“主索引+增量索引”方法有个简单的实现，在数据库中增加一个计数表，记录每次重新构建主索引时，被索引表的最后一个数据id，这样在增量索引时只需要索引这个id以后的数据即可，每次重新构建主索引时都更新这个表。

QQ图片20220425163846.jpg

我服务器上部署的sphinx-for-chinese全文搜索引擎主要是做博客的搜索，数据量不大，因此，这里更新索引每次都是更新所有。

但是相对于大数据量来说，每次都全部更新的话，速度可能会比较慢。

关于这个问题，sphinx为我们提供了增量索引这个功能。

也就是说，我们每次为新增加的数据增加索引，然后和之前的索引再进行合并，这个相对来讲速度比较快。

这个模式实现的基本原理是设置两个数据源和两个索引，为那些基本不更新的数据建立主索引，而对于那些新增的数据建立增量索引。

主索引的更新频率可以设置的长一些(例如设置在每天的凌晨进行)，而增量索引的更新频率，我们可以将时间设置的很短(几分钟左右)，这样在用户搜索的时候，我们可以同时查询这两个索引的数据。

使用“主索引+增量索引”方法有个简单的实现，在数据库中增加一个计数表，记录每次重新构建主索引时，被索引表的最后一个数据id，这样在增量索引时只需要索引这个id以后的数据即可，每次重新构建主索引时都更新这个表。

1：创建sphinx索引表，用于记录那些数据已经被创建索引

create table sphinx
(
    max_id int unsigned not null default 0
)
#该表作用：用于记录article表哪些数据已被创建索引，哪些数据未被创建索引
#获取未创建索引数据：select * from article where id >  sphinx表记录的数字

2：修改配置文件(增加新索引)

将如下代码追加至你的sphinx.conf中

# 增量索引数据源
source src1_add
{
    # 下面是sql数据库特有的端口，用户名，密码，数据库名等。
    type                    = mysql
    sql_host                = localhost
    sql_user                = mysql
    sql_pass                = xxxxx
    sql_db                  = xxxxx
    sql_port                = 3306
    sql_query_pre           = SET NAMES utf8
    # (SELECT MAX(max_id) FROM sphinx)  目的，规避重复创建索引
    sql_query = SELECT p1.*,p2.content FROM article p1 LEFT JOIN article_info p2 ON p1.id = p2.article_id WHERE p1.id > (SELECT MAX(max_id) FROM sphinx)
    # 建完索引这后　，把最后一条记录的id存到sphinx表中
    # 在主查询（sql_query）之后执行的ＳＱＬ
    sql_query_post = UPDATE sphinx SET max_id = (SELECT MAX(id) FROM article)
}
# 增量索引数据索引
index src1_add
{
    # 对应的source数据来源名称
source            = src1_add
# 索引存放位置
    path              = /usr/xxx/xxx/xxx/data/src1_add
    docinfo           = extern  
    mlock             = 0
    morphology        = none
    min_word_len      = 1
    html_strip        = 0
    charset_type      = zh_cn.utf-8
}

3：使用增量索引

（1）：重启sphinx服务

使用如下命令：

/usr/local/sphinxforchinese/bin/indexer -c /usr/local/sphinxforchinese/etc/sphinx.conf  src1_add
#用于给test1表未创建索引数据增加索引
/usr/local/sphinxforchinese/bin/indexer -c /usr/local/sphinxforchinese/etc/sphinx.conf --merge test1 src1_add --rotate
#将src1_add索引合并到test1索引中

以上大概就是sphinx增量索引的使用。不是很麻烦。

sphinx（八）sphinx增量索引

1：创建sphinx索引表，用于记录那些数据已经被创建索引

2：修改配置文件(增加新索引)

3：使用增量索引

（1）：重启sphinx服务

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

sphinx（八）sphinx增量索引

1：创建sphinx索引表，用于记录那些数据已经被创建索引

2：修改配置文件(增加新索引)

3：使用增量索引

（1）：重启sphinx服务

热门文章

最新文章

相关电子书