RDS PG 12 文档显示不支持中文分词插件 pg_jieba,zhparser, 目前中文分词应该怎么做?谢谢
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
针对RDS PG 12版本,若文档显示不支持中文分词插件pg_jieba
和zhparser
,您可参考以下步骤使用zhparser
进行中文分词,因为根据提供的参考资料,RDS PostgreSQL 10或以上版本是支持zhparser
插件的。这里假设您的实例满足使用zhparser
的前提条件:
zhparser
添加到shared_preload_libraries
参数中。这一步是必须的,以确保插件可以在实例启动时加载。CREATE EXTENSION zhparser;
CREATE TEXT SEARCH CONFIGURATION testzhcfg (PARSER = zhparser);
ALTER TEXT SEARCH CONFIGURATION testzhcfg ADD MAPPING FOR n,v,a,i,e,l WITH simple;
zhparser
进行中文分词和全文检索操作了。例如,进行简单的测试和创建索引:
SELECT * FROM ts_parse('zhparser', '您的中文文本示例');
-- 创建索引示例(请替换t1和name为实际表名和字段)
CREATE INDEX idx_t1 ON t1 USING gin (to_tsvector('testzhcfg', upper(name)));
-- 使用全文索引查询
SELECT * FROM t1 WHERE to_tsvector('testzhcfg', upper(t1.name)) @@ to_tsquery('testzhcfg', '关键词');
综上所述,尽管文档可能未明确列出对pg_jieba
的支持,但您仍可以采用zhparser
插件来实现RDS PG 12中的中文分词功能。