【重新发现PostgreSQL之美 】- 30 打蛇打七寸

本文涉及的产品
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
简介: 大家好,这里是重新发现PostgreSQL之美 - 30 打蛇打七寸

背景


场景:

电商、网站、社交.如头条,微博等.

评价、文章、短语内容文本分析, 找出热词、关键词.

挑战:

传统数据库不支持文本分析, 需要拉去到程序内计算, 非常慢.

程序效率差(大多数不是C语言写的,性能弱上加弱).

PG 解决方案:

支持文本分析, 包括tf-idf等,支持自定义分词能力.

分词性能强大: macmini 2018 i5每秒分析速度360万词.

参考


http://madlib.apache.org/docs/latest/group__grp__text__utilities.html

《PostgreSQL结合余弦、线性相关算法 在文本、图片、数组相似 等领域的应用 - 1 文本(关键词)分析理论基础 - TF(Term Frequency 词频)/IDF(Inverse Document Frequency 逆向文本频率)》

《[未完待续] 情感词分析,维护社会和谐 - PostgreSQL,Greenplum文本挖掘、分析实践》

《PostgreSQL 全文检索 - 词频统计》



相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
相关文章
|
3月前
|
存储 JSON 关系型数据库
《Postgresql实战》笔记(二)
《Postgresql实战》笔记(二)
39 0
|
3月前
|
关系型数据库 网络安全 数据库
《Postgresql实战》笔记(一)
《Postgresql实战》笔记(一)
50 0
|
7月前
|
存储 SQL JSON
PostgreSQL学习研究笔记(一)
PostgreSQL学习研究笔记(一)
|
关系型数据库 PostgreSQL
PostgreSQL扫盲教程
PostgreSQL扫盲教程
103 0
PostgreSQL扫盲教程
|
关系型数据库 数据库 PostgreSQL
【重新发现PostgreSQL之美】- 43 快速破镜重圆
大家好,这里是重新发现PostgreSQL之美 - 43 快速破镜重圆
|
算法 关系型数据库 PostgreSQL
【重新发现PostgreSQL之美】- 22 黄帝内经
大家好,这里是重新发现PostgreSQL之美 - 22 黄帝内经
|
SQL 关系型数据库 数据库
【重新发现PostgreSQL之美】- 50 一粒老鼠屎
大家好,这里是重新发现PostgreSQL之美 - 50 一粒老鼠屎
|
传感器 SQL 监控
【重新发现PostgreSQL之美】- 28 旋转门
大家好,这里是重新发现PostgreSQL之美 - 28 旋转门
|
SQL 算法 自动驾驶
【重新发现PostgreSQL之美】- 27 无中生有
大家好,这里是重新发现PostgreSQL之美 - 27 无中生有
|
JSON 关系型数据库 数据库
【重新发现PostgreSQL之美】- 44 摩斯电码
大家好,这里是重新发现PostgreSQL之美 - 44 摩斯电码