Tableau BI工具对接 AnalyticDB for PostgreSQL数据源

AnalyticDB for PostgreSQL(原HybridDB for PostgreSQL)作为高性能分析型数据库,可以支持用户对其业务数据进行实时分析,能够让企业敏锐感知市场动态,做出必要决策。
Tableau是一款数据分析与可视化工具,它支持连接本地或云端数据,不管是电子表格,还是数据库数据,都能进行无缝连接。本文介绍Tableau以AnalyticDB for PostgreSQL作为数据源,如何进行有效的数据分析。

使用AnalyticDB for PostgreSQL

AnalyticDB for PostgreSQL基于Greenplum,所以在选择连接器的时候选择Greenplum连接器:
Tableau BI工具对接 AnalyticDB for PostgreSQL数据源

点开出现登录页面,填上DB的连接信息完成登录。


登录后页面:
Tableau BI工具对接 AnalyticDB for PostgreSQL数据源

根据指导操作,可以将任意表进行统计分析,并进行报表展示。

例如使用TPCH数据中的lineitem,点开一张工作表可以进行任意维度的数据展示了:
Tableau BI工具对接 AnalyticDB for PostgreSQL数据源

每从度量或者维度中选择一个字段,放到工作表区时,Tableau都会发送一个query到AnalyticDB for PostgreSQL进行数据查询,例如上述图表发送的query:

BEGIN;declare "SQL_CUR0x7fdabf04ca00" cursor with hold for SELECT "lineitem"."l_linestatus" AS "l_linestatus",
          "lineitem"."l_shipmode" AS "l_shipmode",
          SUM("lineitem"."l_orderkey") AS "sum_l_orderkey_ok",
          ((CAST("lineitem"."l_shipdate" AS DATE) + CAST(TRUNC((-1 * (EXTRACT(DAY FROM "lineitem"."l_shipdate") - 1))) AS INTEGER) * INTERVAL '1 DAY') + CAST(TRUNC((-1 * (EXTRACT(MONTH FROM "lineitem"."l_shipdate") - 1))) AS INTEGER) * INTERVAL '1 MONTH') AS "tyr_l_shipdate_ok"
        FROM "public"."lineitem" "lineitem"
        GROUP BY 1,
          2,
          4;fetch 10000 in "SQL_CUR0x7fdabf04ca00

一些注意事项

关掉cursor

默认情况下Tableau使用cursor模式从AnalyticDB for PostgreSQL拉取数据:

 FETCH 10000 in “SQL_CUR0x7fe678049e00”

如果提取的数据量很大,并且Tableau服务器的内存足够放下所有的查询数据,可以通过关闭cursor的模式进行性能调优。
通过TDC文件关闭cursor模式:

<?xml version='1.0' encoding='utf-8' ?>  
<connection-customization class='greenplum' enabled='true' version='4.3'>  
<vendor name='greenplum'/>  
<driver name='greenplum'/>  
<customizations>  
<customization name='odbc-connect-string-extras' value='UseDeclareFetch=0' />
</customizations>  
</connection-customization>

将该文件以tdc为后缀名,Desktop版本的Tableau放到DocumentsMy Tableau RepositoryDatasources下面,其他版本的同样放置到对应的Datasources目录下,重启Tableau即可生效。
也可以修改fetch的size,让其每次fetch更多的数据:

<?xml version='1.0' encoding='utf-8' ?>  
<connection-customization class='greenplum' enabled='true' version='4.3'>  
<vendor name='greenplum'/>  
<driver name='greenplum'/>  
<customizations>  
<customization name='odbc-connect-string-extras' value='Fetch=100000' />  
</customizations>  
</connection-customization>

初始化sql

连接建立时可以通过初始化SQL设置特定参数,例如:
Tableau BI工具对接 AnalyticDB for PostgreSQL数据源

SQL后面不要带‘;’,否则执行会报错,因为Tableau会将该SQL封装执行,中间如果有分号会报语法错误。同样在自定义SQL时,SQL结尾也不能加‘;’。

上一篇:如何使用AnalyticDB for PostgreSQL 6.0 进行TPC-H 1TB数据的测试


下一篇:SQLServer CDC数据通过Kafka connect实时同步至分析型数据库 AnalyticDB For PostgreSQL及OSS