阿里云PostgreSQL_案例介绍4 | 学习笔记

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,内容安全 1000次 1年
云原生数据库 PolarDB MySQL 版,通用型 2核4GB 50GB
简介: 简介:快速学习阿里云PostgreSQL_案例介绍4

开发者学堂课程【PostgreSQL云上开发实践:阿里云PostgreSQL_案例介绍4】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/528/detail/7103


阿里云PostgreSQL_案例介绍4


内容介绍:

RDS PG + HDB PG 应用案例

一、Case1优土-智能广告

二、Case2阿里游戏-单款游戏日增量亿+级 动态分析

三、Case3(时空分析)

四、Case4(批量数据圈选与导出)

五、Case5准实时订单分析系统(双十一业务)

六、案例小结

 

一、Case1优土-智能广告

· RDs PostgreSQL 角色

——FEED 表

· 命中规则,写入 FEED。(100万+行/s)

——计数表

· 分区:小时、天、周

· 实时写入、阅后即焚(300万行+/s),合并到计数表

——实时统计表

· 阅后即焚(300万行+/s)、合并到实时统计表,提供毫秒级任意维度查询

——OSS 存储

· 计数表,上一小时、天、周,调度写入 OSS 。200MB/s并行读写速度。

· HDB PostgreSQL 角色

——对接 OSS (30MB/s/segment节点读写速度)、实时分析。无限扩容。

https://github.com/digoal/blog/blob/master/201711/ 20171126_01.md

image.png

· SQL 接口机器学习库 MADLib (支持几百个机器学习库函数、对应各种数学模型),PL/R,PL/Python

案例-架构设计、代码、实操手册

· 阅后即焚-流式处理

https://github.com/digoal/blog/blob/master/201711/20171126_01.md https://github.com/digoal/blog/blob/master 201711/20171123_02.md https://github.com/digoal/blog/blob/master/201711/20171107_33.md https://github.com/digoal/blog/blob/master/201711/20171107_32.md https://github.com/digoal/blog/blob/master/201711/20171107_28.md

· MADlib机器学习库

https://github.com/digoal/blog/blob/master/201511/20151111_01.md http://madlib.apache.org/

https://cran.r-project.org/web/packages/PivotalR/vignettes/pivotalr.pdf https://pypi.python.org/pypi/pymadlib/0.1.4

 

二、Case2 阿里游戏-单款游戏日增量亿+级 动态分析

需求:

· JSON 内字段检索、索引、统计

· UDF-JSON 内容分裂

image.png

实时分析,举例(不限于此):

指定维度、日 UV ,新增 UV ,。。。透视

select x,count(distinct y) from tbl where dt=? group by x;

案例架构设计、代码、实操手册

https://www.postgresql.org/docs/10/static/datatype- json.html

https://www.postgresql.org/docs/10/static/functions- json.html

· RDSPGOSS 外部表文档:

https://help.aliyun.com/ knowledge_detail/43352.html

· HDBPG OSS 外部表文档:

https://help.aliyun.com/document_detail/35457.html


三、Case3(时空分析)

· GIS 与新零售

案例

· 新零售- LBS 数据应用,网格化运营

——业务背景: LBS 透视、圈人

——数据来源: ODPS

——数据规模:千亿+

——数据描述:商铺位置、用户轨迹数据,保留3个月。

——查询需求:

· 选址,分析某个商圈的对象透视,秒级

· 商铺地推,商圈周边的潜在目标人群,秒级

· 时间区间、空间覆盖查询,秒级

——并发需求:100+

——DML需求:OSS批量写入

· 黄金策

——精准筛选(任意字段、标签过滤、透视分析),高效分析

痛点

· 数据量较大

· 时间、空间、对象属性多维透视

· 有空间需求

· 透视实时响应

· 存储乱序、10放大

黄金策:

细分人群,精准营销

面向集团内部小二,提供从人群圈选,人群分析,人群放大,到投放渠道对接,提供营销全链路的数据支持,提升人群营销生产力

image.png

案例-架构设计、代码、实操手册

https://github.com/digoal/blog/blob/master/201706/20170629_01.md https://github.com/digoal/blog/blob/master/201709/20170918_02.md https://github.com/digoal/blog/blob/master/201708/20170820_02.md

https://github.com/digoal/blog/blob/master/201708/20170820_01.md https://github.com/digoal/blog/blob/master/201707/20170722_01.md https://github.com/digoal/blog/blob/master/201703/20170328_04.md


四、Case(批量数据圈选与导出)

· CDN,数据归集

· 某物流公司,数据归集

· 品牌圈人,导出

· 速度  ——~30MB/s/Segment

image.png

· DEMO

· 详见阿里云官网,HDBPG 产品手册

-create table tb1_output_struct(prefix text,struct json);

-insert into tb1_output_struct values('label1','{col:type,col2:type,....}');

-create writable table tbl_output(prefixtext,content json) bucket ...;

-insert into tbl_output select 'label1'as prefix,row_to json(t) (select ... from tblxxx where .....)as t;

案例-架构设计、代码、实操手册

https://github.com/digoal/blog/blob/master/201801/20180109_01.md


五、Case5准实时订单分析系统(双十一业务)

同时兼具 OLTP+OLAP:

1、大吞吐实时写入

2、海量实时分析(MPP架构)

3、行列混合存储

4、任意 JOIN、Groupby、Distinct

5、GIS 数据管理

6、JSON

7、HLL 估值

8、全文检索

9、多值(array,k-v)类型10、游标

11、传统数据库ACID标准

12、MADlib机器学习

案例-架构设计、代码、实操手册

· 案例

https://github.com/digoal/blog/blob/master/201707/20170728_01.md

https://github.com/digoal/blog/blob/master/201711/20171111_01.md

· OSS外部表

——RDS PGOSS外部表文档:

https://help.aliyun.com/knowledge_detail/43352.html

——HDBPGOSS外部表文档:

https://help.aliyun.com/document_detail/35457.html

 

六、案例小结

行业:

· 物联网、电商、生物、游戏

· 企业 CRM、传统行业、ZF

· 物流、音视频、BI、证券、金融

· 手机、 

技术点:

· 搜索( ADHoc ,全文检索、模糊、数组)

· 相似搜索(图片、文本、数组)

· 用户画像、空间、时空、挖掘

· 图式搜索、流计算、秒杀、树结构、非结构化

· 单元化部署、sharding

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
相关文章
|
NoSQL 关系型数据库 MySQL
阿里云RDS关系型数据库大全_MySQL版、PolarDB、PostgreSQL、SQL Server和MariaDB等
阿里云RDS关系型数据库如MySQL版、PolarDB、PostgreSQL、SQL Server和MariaDB等,NoSQL数据库如Redis、Tair、Lindorm和MongoDB
339 0
|
2月前
|
人工智能 自然语言处理 关系型数据库
阿里云云原生数据仓库 AnalyticDB PostgreSQL 版已完成和开源LLMOps平台Dify官方集成
近日,阿里云云原生数据仓库 AnalyticDB PostgreSQL 版已完成和开源LLMOps平台Dify官方集成。
|
7月前
|
Cloud Native 关系型数据库 OLAP
云原生数据仓库产品使用合集之阿里云云原生数据仓库AnalyticDB PostgreSQL版的重分布时间主要取决的是什么
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
|
6月前
|
SQL 关系型数据库 PostgreSQL
【sql】PostgreSQL物化视图表使用案例
【sql】PostgreSQL物化视图表使用案例
70 0
|
存储 人工智能 关系型数据库
5倍性能提升,阿里云AnalyticDB PostgreSQL版新一代实时智能引擎重磅发布
2023 云栖大会上,AnalyticDB for PostgreSQL新一代实时智能引擎重磅发布,全自研计算和行列混存引擎较比开源Greenplum有5倍以上性能提升。AnalyticDB for PostgreSQL与通义大模型家族深度集成,推出一站式AIGC解决方案。阿里云新发布的行业模型及“百炼”平台,采用AnalyticDB for PostgreSQL作为内置向量检索引擎,性能较开源增强了2~5倍。大会上来自厦门国际银行、三七互娱等知名企业代表和瑶池数据库团队产品及技术资深专家们结合真实场景实践,深入分享了最新的技术进展和解析。
5倍性能提升,阿里云AnalyticDB PostgreSQL版新一代实时智能引擎重磅发布
|
7月前
|
安全 关系型数据库 数据库
上新|阿里云RDS PostgreSQL支持PG 16版本,AliPG提供丰富自研能力
AliPG在社区版16.0的基础上,在安全、成本、可运维性等多个方面做了提升,丰富的内核/插件特性支持,满足业务场景的需求
|
SQL 关系型数据库 分布式数据库
阿里云PolarDB是一款兼容MySQL、PostgreSQL和SQL Server等多种数据库协议的产品
阿里云PolarDB是一款兼容MySQL、PostgreSQL和SQL Server等多种数据库协议的产品
834 6
|
SQL 存储 自然语言处理
玩转阿里云RDS PostgreSQL数据库通过pg_jieba插件进行分词
在当今社交媒体的时代,人们通过各种平台分享自己的生活、观点和情感。然而,对于平台管理员和品牌经营者来说,了解用户的情感和意见变得至关重要。为了帮助他们更好地了解用户的情感倾向,我们可以使用PostgreSQL中的pg_jieba插件对这些发帖进行分词和情感分析,来构建一个社交媒体情感分析系统,系统将根据用户的发帖内容,自动判断其情感倾向是积极、消极还是中性,并将结果存储在数据库中。
玩转阿里云RDS PostgreSQL数据库通过pg_jieba插件进行分词
|
SQL 存储 自然语言处理
玩转阿里云PostgreSQL,通过pg_jieba对豆瓣影评进行热评分析
在当今社交媒体的时代,人们通过各种平台分享自己的生活、观点和情感。然而,对于平台管理员和品牌经营者来说,了解用户的情感和意见变得至关重要。为了帮助他们更好地了解用户的情感倾向,我们可以使用PostgreSQL中的pg_jieba插件对这些发帖进行分词和情感分析,来构建一个社交媒体情感分析系统,系统将根据用户的发帖内容,自动判断其情感倾向是积极、消极还是中性,并将结果存储在数据库中。 本文通过针对kaggle数据集中的豆瓣影评的中文评论数据,通过阿里云的PostgreSQL中的pg_jieba插件进行分词(可自定义多个词典,并且切换自定义词典进行分词),基于分词的结果进行统计分析。
|
NoSQL 关系型数据库 MySQL
阿里云关系型数据库详细介绍MySQL/MariaDB/SQL Server/PolarDB/PostgreSQL等
阿里云关系型数据库详细介绍MySQL/MariaDB/SQL Server/PolarDB/PostgreSQL等,阿里云RDS关系型数据库如MySQL版、PolarDB、PostgreSQL、SQL Server和MariaDB等
212 0

热门文章

最新文章