使用 www_fdw 插件向PG/PPAS导入数据

本文涉及的产品
RDS PostgreSQL Serverless,0.5-4RCU 50GB 3个月
推荐场景:
对影评进行热评分析
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
简介: www_fdw 插件支持通过http协议把文本数据导入到PG/PPAS中 RDS PG/PPAS 新版本已经支持通过 www_fdw 下面简单介绍下使用方式 启动http服务 导入数据前,我们需要在文件服务器上启动一个http服务,再把要导入的文本数据放在对应目录 创建 www_fdw 插

简介

www_fdw 插件支持通过http协议把文本数据导入到PG/PPAS中
RDS PG/PPAS 新版本已经支持通过 www_fdw
下面简单介绍下使用方式

启动http服务

导入数据前,我们需要在文件服务器上启动一个http服务,再把要导入的文本数据放在对应目录

创建 www_fdw 插件

create extension www_fdw;

创建server和用户映射规则

CREATE SERVER www_fdw_test FOREIGN DATA WRAPPER www_fdw 
  OPTIONS (uri 'http://192.168.1.1/', request_serialize_callback 'test_request_serialize_callback',response_type'other', response_deserialize_callback 'test_response_deserialize_callback');

CREATE USER MAPPING FOR current_user SERVER www_fdw_test;

创建数据处理函数

这里需要注意的是,根据不同的格式的文本数据,需要定制下列函数,目的是把行数据拆分到表中的列

CREATE OR REPLACE FUNCTION test_request_serialize_callback(options WWWFdwOptions, quals text, INOUT url text, INOUT post WWWFdwPostParameters) AS 
$$

BEGIN
    RAISE NOTICE 'options parameter: %', options;
    RAISE NOTICE 'quals parameter: %', quals;
    RAISE NOTICE 'url parameter: %', url;
    RAISE NOTICE 'post parameter: %', post;
    url := url;
END; 
$$
 LANGUAGE PLPGSQL;

CREATE OR REPLACE FUNCTION test_response_deserialize_callback(options WWWFdwOptions, response text) RETURNS SETOF www_fdw_test AS 
$$

DECLARE
        title text;
        link text;
        snippet text;
        rows text[];
        i integer;
        fields text[];
        r RECORD;
BEGIN
        RAISE DEBUG 'options parameter: %', options;
        RAISE DEBUG 'response parameter: %', response;
        rows := regexp_split_to_array(response, E'\\n');

    RAISE NOTICE 'row: %', rows[0];

        FOR i IN 1 .. array_length(rows,1) LOOP
            fields := regexp_split_to_array(rows[i], E' ');
            title := fields[1];
            link := fields[2];
            snippet := fields[3];
            r := ROW(title, link, snippet);
            RETURN NEXT r;
        END LOOP;
END; 
$$
 LANGUAGE PLPGSQL;

创建外部表

CREATE FOREIGN TABLE www_fdw_test (
  t1 text, t2 text ,t3 text
) SERVER www_fdw_test;

数据的访问

接下来用户就可以像访问表那样,访问对应http服务上的外部数据了.举例:

select * from www_fdw_test;
目录
相关文章
|
1月前
|
关系型数据库 数据库 PostgreSQL
【YashanDB知识库】kettle同步PG至崖山提示no encryption pg_hba.conf记录
在使用 Kettle 进行 PostgreSQL 至崖山数据库的数据同步时,可能出现连接报错。原因是 `pg_hba.conf` 文件未正确配置 IP 连接规则。此文件控制客户端认证,决定哪些主机和用户可连接数据库。解决方法为:在 `pg_hba.conf` 中添加允许的 IP 规则(如 `host all all 10.9.7.54/32 md5`),并重启 PostgreSQL 服务使配置生效。该问题影响所有版本。
|
24天前
|
SQL 关系型数据库 MySQL
【YashanDB知识库】MySQL的FIND_IN_SET如何在YashanDB改写
本文来自YashanDB官网,探讨了MySQL中使用`FIND_IN_SET`函数在YashanDB中不兼容的问题及解决方法。由于YashanDB的`tinyint`类型无法参与条件运算,而MySQL的Boolean类型是`tinyint`的同义词,导致直接迁移时出现错误。文章通过分析原因,提出改写方案:将`where find_in_set(`替换为`where 0 < find_in_set(`,从而实现兼容性调整,方便用户快速迁移和改写SQL语句。
|
2月前
|
关系型数据库 Java 数据库
【YashanDB 知识库】kettle 同步 PG 至崖山提示 no encryption pg_hba.conf 记录
【问题分类】数据导入导出 【关键字】数据同步,kettle,数据迁移,pg_hba.conf 【问题描述】使用 kettle 同步 postgresql 至崖山数据库时提示以下报错信息: 信息: New Caching Service registered 2024/10/10 17:00:21 - Pan - 开始运行. 2024/10/10 17:00:21 - public.T1 - 为了转换解除补丁开始 [public.T1] log4j:ERROR No output stream or file set for the appender named [pdi-execu
|
11月前
|
关系型数据库 MySQL 索引
【MySQL】视图 -- 详解
【MySQL】视图 -- 详解
|
10月前
|
SQL 关系型数据库 PostgreSQL
PostgreSQL和greenplum的copy命令可以添加字段吗?
【6月更文挑战第5天】PostgreSQL和greenplum的copy命令可以添加字段吗?
134 3
|
弹性计算 安全 关系型数据库
阿里云RDS PG 10 HA版 - 使用postgres_fdw外部表插件 - 实例内跨库访问其他库的表
标签 PostgreSQL , postgres_fdw , 阿里云 , 内核安全限制 背景 阿里云rds pg内核安全上做了限制,只能访问当前实例的其他库,所以使用dblink, postgres_fdw时,虽然PG功能上是可以访问其他远程实例的,但是阿里云RDS PG限制了只能访问当前实例。 另一方面,当前实例是HA版本,并且是云化版本,所以IP,PORT都可能在发生迁移、切换后发
675 0
|
关系型数据库 MySQL 数据库
PostgreSQL外部数据插件:mysql_fdw
概述 PostgreSQL具有插件功能,通过不同的插件拓展,实现数据库本身不包含的功能,以满足用户的需求。mysql_fdw 就是一个强大的外部表功能,所谓外部表,就是在PG数据库中通过SQL访问外部数据源数据,就像访问本地数据库一样,下面就来测试一下使用mysql_fdw 来访问mysql中的数...
10803 2
|
关系型数据库 MySQL
MySQL到ADB PG版表结构转换工具
工具提供将MySQL中的表结构转换为ADB PG版规范的表结构
2167 0