备案控制台

开发者社区问答正文

PostgreSQL全文检索的性能问题

近期业务需要，准备上全文检索功能。原始数据是2000W+的txt文件，每个文件里面一段文字，平均单个文件大小100k。在实施过程中，遇到性能问题。

硬件配置：

阿里云ECS，2CPU/8G内存，自己安装的PG（注意：不是那个独立的RDS产品）

PG版本9.4，参数如下：

fsync off
shared_buffers 1GB
work_mem 10MB
effective_cache_size 2GB
maintenance_work_mem 512MB
checkpoint_segments 32
checkpoint_completion_target 0.9
wal_buffer 8MB
commit_delay 10
commit_siblings 4

表结构：

CREATE TABLE sys_document
(
id serial NOT NULL, -- 自增主键
doc_content_plain character varying, -- 文本原文
doc_content_plain_tsvector tsvector, -- 文本的搜索分词
doc_content_bin bytea, -- 文本的二进制原文
href character varying, -- 设计用来网络访问的url
created_at timestamp without time zone -- 创建时间
)

全文检索的相关扩展

采用了zhparser做中文分词扩展

性能问题：任何操作都非常慢

例如：UPDATE sys_document SET href = ''; (6个小时)

例如：UPDATE sys_document SET doc_content_plain_tsvector = to_tsvector('testzhcfg', doc_content_plain character); (运行了2天，没有结果，于是停掉)

例如：CREATE INDEX sys_document_doc_content_plain_tsvector_idx ON sys_document USING gin(to_tsvector('testzhcfg', doc_content_plain character)); (3天了，还在运行)

请问，这个方案的瓶颈可能在哪里呢？是方案本身有问题吗？

展开

收起

troyzhao 2016-10-01 11:45:56 4018 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

ttttttt

可以先参考下postgreSQL的产品文档，看是不是能找到，https://help.aliyun.com/document_detail/26092.html?spm=5176.7920951.603188.1.5PxsAL

2019-07-17 20:13:16

赞同展开评论

问答分类：

弹性计算自然语言处理关系型数据库 PostgreSQL RDS 云服务器 ECS 云原生数据库 PolarDB 云数据库 RDS MySQL 版

问答标签：

PostgreSQL性能 PostgreSQL全文检索云数据库 RDS PostgreSQL 版全文检索 PostgreSQL全文检索性能

问答地址：

开发者社区 > 数据库 > 问答

相关问答

云原生数据仓库AnalyticDB PostgreSQL是否测试过物化视图和行存表join下性能损失

132

2

0

polardb中postgresql 分库分表，单表最大多少条记录，会影响性能？

700

0

0

flinkcdc有大佬监控整个postgresql库的吗，性能怎么样？

268

6

0

【RDS】RDS MySQL 5.7与RDS MySQL 5.6中，全文检索字符个数不同是什么原因？

1069

1

0

【RDS】like语句和RDS MySQL全文检索比较有什么区别？

1192

1

0

【RDS】RDS MySQL对中文全文检索支持吗？

993

1

0

【RDS】RDS MySQL全文检索相关参数如何查看？

917

1

0

【RDS】RDS MySQL对全文检索支持吗？

920

1

0

PostgreSQL , varbitx 性能压测结果有吗

544

0

0

Postgres-XL对比单机Postgresql性能很差

2453

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码启动异常，可点击按钮进行一键修复，如仍无法解决，请参考[问题排查指南](https://he

关于idea lingma欺骗的对话。请开发者尽快修复

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

相关文章

数字化转型中的知识管理新范式

阿里云gpu云服务器产品优势有哪些？具体产品优势、功能、应用场景与产品选型参考

12月21日｜「Qoder Together 广州站」圆满落幕！

基于springboot的快递仓储管理系统

小白必看：AI智能体零基础搭建全攻略！

还有其他疑问?