文档备案控制台

开发者社区问答正文

PostgreSQL全文检索的性能问题

近期业务需要，准备上全文检索功能。原始数据是2000W+的txt文件，每个文件里面一段文字，平均单个文件大小100k。在实施过程中，遇到性能问题。

硬件配置：

阿里云ECS，2CPU/8G内存，自己安装的PG（注意：不是那个独立的RDS产品）

PG版本9.4，参数如下：

fsync off
shared_buffers 1GB
work_mem 10MB
effective_cache_size 2GB
maintenance_work_mem 512MB
checkpoint_segments 32
checkpoint_completion_target 0.9
wal_buffer 8MB
commit_delay 10
commit_siblings 4

表结构：

CREATE TABLE sys_document
(
id serial NOT NULL, -- 自增主键
doc_content_plain character varying, -- 文本原文
doc_content_plain_tsvector tsvector, -- 文本的搜索分词
doc_content_bin bytea, -- 文本的二进制原文
href character varying, -- 设计用来网络访问的url
created_at timestamp without time zone -- 创建时间
)

全文检索的相关扩展

采用了zhparser做中文分词扩展

性能问题：任何操作都非常慢

例如：UPDATE sys_document SET href = ''; (6个小时)

例如：UPDATE sys_document SET doc_content_plain_tsvector = to_tsvector('testzhcfg', doc_content_plain character); (运行了2天，没有结果，于是停掉)

例如：CREATE INDEX sys_document_doc_content_plain_tsvector_idx ON sys_document USING gin(to_tsvector('testzhcfg', doc_content_plain character)); (3天了，还在运行)

请问，这个方案的瓶颈可能在哪里呢？是方案本身有问题吗？

展开

收起

troyzhao 2016-10-01 11:45:56 4105 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

ttttttt

可以先参考下postgreSQL的产品文档，看是不是能找到，https://help.aliyun.com/document_detail/26092.html?spm=5176.7920951.603188.1.5PxsAL

2019-07-17 20:13:16

赞同展开评论

问答分类：

弹性计算自然语言处理关系型数据库 PostgreSQL RDS 云服务器 ECS 云原生数据库 PolarDB 云数据库 RDS MySQL 版

问答标签：

PostgreSQL性能 PostgreSQL全文检索云数据库 RDS PostgreSQL 版全文检索 PostgreSQL全文检索性能

问答地址：

开发者社区 > 数据库 > 问答

相关问答

云原生数据仓库AnalyticDB PostgreSQL是否测试过物化视图和行存表join下性能损失

168

2

0

polardb中postgresql 分库分表，单表最大多少条记录，会影响性能？

847

0

0

flinkcdc有大佬监控整个postgresql库的吗，性能怎么样？

299

6

0

【RDS】RDS MySQL 5.7与RDS MySQL 5.6中，全文检索字符个数不同是什么原因？

1112

1

0

【RDS】like语句和RDS MySQL全文检索比较有什么区别？

1224

1

0

【RDS】RDS MySQL对中文全文检索支持吗？

1034

1

0

【RDS】RDS MySQL全文检索相关参数如何查看？

944

1

0

【RDS】RDS MySQL对全文检索支持吗？

946

1

0

PostgreSQL , varbitx 性能压测结果有吗

565

0

0

Postgres-XL对比单机Postgresql性能很差

2471

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

阿里云千问大模型是什么？2026年阿里云千问大模型优惠活动说明

阿里云百炼Coding Plan订阅套餐是什么？有哪些购买方式、使用规则与合规注意事项

阿里云Coding Plan售罄，抢不到怎么办？阿里云Coding Plan抢购最新方法

阿里云Coding Plan是什么？阿里云Coding Plan详解：Lite/Pro套餐对比、使用

阿里云百炼Coding Plan提示售罄、Lite停售、Pro难抢，怎么办？最新解决方案总结

相关文章

5 分钟完成 OpenClaw 2.6.2 安装与环境配置（含最新版安装包）

Java团队必看：为何转型AI应用开发已刻不容缓？

引言技术选型与工具数据库选择与配置常见问题与解决方案

抢购价38元1年，阿里云轻量应用服务器2核2G配置，峰值200M带宽+40G云盘

OpenClaw 史上最全手把手的保姆级安装配置教程（2026年4月15日最新版）

相关解决方案

更多

高效构建全球网络服务性能观测体系

基于 Supabase 高效构建轻量级应用

实现 MySQL 到 ADB 秒级分析性能

极速构建实时全文检索系统

通过 RDS 读写分离提升数据库性能

还有其他疑问?