1.一篇文章,文字很多,文中可能含有站内其他文章的标题。
2.想根据其他文章的标题,匹配出来本文匹配的文字加上超链接。
问题:站内文章很多,至少10w条标题需要查询匹配。
如何实现呢?
HI, 使用PostgreSQL可以这样来实现,并提供加速。
首先需要用到中文分词,另外,需要用户自定义词典(即文章标题)。
生成自定义词典:
select title from tbl group by title.
将字典加入自定义词典。
创建 gin分词index .
create index idx on tbl using gin(to_tsvector('zhparser',content)) ;
查询:
可以在RDS PostgreSQL上试一试。
select * from tbl where to_tsvector('zhparser',content) @@ to_tsquery('zhparser', '某个标题 || 某个标题 && 某个标题')
用法参考文档:
http://www.postgresql.org/docs/9.5/static/functions-textsearch.html
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。