【问题标题】:Greenplum PXF JDBC Parallel insertGreenplum PXF JDBC 并行插入
【发布时间】:2021-12-17 05:10:35
【问题描述】:

从gp表向jdbc pxf表插入数据时:

insert into <pxf jdbc target> 
select * from <gp table>

它是在与外部 RDBMS 有许多连接的所有 PXF 实例上并行工作,还是在单个 PXF 实例上并行工作,例如从 JDBC 源中选择而不进行分区?

GP 版本 6.17

【问题讨论】:

    标签: greenplum


    【解决方案1】:

    它将在所有 PXF 实例上并行。

    【讨论】:

      【解决方案2】:

      根据 gpdb 文档,对于 HDFS/S3 中的所有加载和卸载操作,查询将并行执行。

      参考:https://docs.greenplum.org/6-10/admin_guide/external/g-external-tables.html

      以下是他们文档中的引述。

      外部表从数据库中访问外部文件,就像 它们是常规的数据库表。定义的外部表 gpfdist/gpfdists、pxf 和 s3 协议利用 Greenplum 并行性 通过使用所有Greenplum数据库段的资源来加载或 卸载数据。 pxf 协议利用了 Hadoop 分布式文件系统以访问该系统上的文件。这 s3 协议利用 Amazon Web Services (AWS) 功能。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2012-08-14
        • 2010-09-17
        • 1970-01-01
        • 1970-01-01
        • 2017-06-10
        相关资源
        最近更新 更多