AnalyticDB for PostgreSQL(原HybridDB for PostgreSQL)作为高性能分析型数据库,可以支持用户对其业务数据进行实时分析,能够让企业敏锐感知市场动态,做出必要决策。
Tableau是一款数据分析与可视化工具,它支持连接本地或云端数据,不管是电子表格,还是数据库数据,都能进行无缝连接。本文介绍Tableau以AnalyticDB for PostgreSQL作为数据源,如何进行有效的数据分析。
使用AnalyticDB for PostgreSQL
AnalyticDB for PostgreSQL基于Greenplum,所以在选择连接器的时候选择Greenplum连接器:
点开出现登录页面,填上DB的连接信息完成登录。
登录后页面:
根据指导操作,可以将任意表进行统计分析,并进行报表展示。
例如使用TPCH数据中的lineitem,点开一张工作表可以进行任意维度的数据展示了:
每从度量或者维度中选择一个字段,放到工作表区时,Tableau都会发送一个query到AnalyticDB for PostgreSQL进行数据查询,例如上述图表发送的query:
BEGIN;declare "SQL_CUR0x7fdabf04ca00" cursor with hold for SELECT "lineitem"."l_linestatus" AS "l_linestatus",
"lineitem"."l_shipmode" AS "l_shipmode",
SUM("lineitem"."l_orderkey") AS "sum_l_orderkey_ok",
((CAST("lineitem"."l_shipdate" AS DATE) + CAST(TRUNC((-1 * (EXTRACT(DAY FROM "lineitem"."l_shipdate") - 1))) AS INTEGER) * INTERVAL '1 DAY') + CAST(TRUNC((-1 * (EXTRACT(MONTH FROM "lineitem"."l_shipdate") - 1))) AS INTEGER) * INTERVAL '1 MONTH') AS "tyr_l_shipdate_ok"
FROM "public"."lineitem" "lineitem"
GROUP BY 1,
2,
4;fetch 10000 in "SQL_CUR0x7fdabf04ca00
一些注意事项
关掉cursor
默认情况下Tableau使用cursor模式从AnalyticDB for PostgreSQL拉取数据:
FETCH 10000 in “SQL_CUR0x7fe678049e00”
如果提取的数据量很大,并且Tableau服务器的内存足够放下所有的查询数据,可以通过关闭cursor的模式进行性能调优。
通过TDC文件关闭cursor模式:
<?xml version='1.0' encoding='utf-8' ?>
<connection-customization class='greenplum' enabled='true' version='4.3'>
<vendor name='greenplum'/>
<driver name='greenplum'/>
<customizations>
<customization name='odbc-connect-string-extras' value='UseDeclareFetch=0' />
</customizations>
</connection-customization>
将该文件以tdc为后缀名,Desktop版本的Tableau放到DocumentsMy Tableau RepositoryDatasources下面,其他版本的同样放置到对应的Datasources目录下,重启Tableau即可生效。
也可以修改fetch的size,让其每次fetch更多的数据:
<?xml version='1.0' encoding='utf-8' ?>
<connection-customization class='greenplum' enabled='true' version='4.3'>
<vendor name='greenplum'/>
<driver name='greenplum'/>
<customizations>
<customization name='odbc-connect-string-extras' value='Fetch=100000' />
</customizations>
</connection-customization>
初始化sql
连接建立时可以通过初始化SQL设置特定参数,例如:
SQL后面不要带‘;’,否则执行会报错,因为Tableau会将该SQL封装执行,中间如果有分号会报语法错误。同样在自定义SQL时,SQL结尾也不能加‘;’。