【发布时间】:2021-12-17 05:10:35
【问题描述】:
从gp表向jdbc pxf表插入数据时:
insert into <pxf jdbc target>
select * from <gp table>
它是在与外部 RDBMS 有许多连接的所有 PXF 实例上并行工作,还是在单个 PXF 实例上并行工作,例如从 JDBC 源中选择而不进行分区?
GP 版本 6.17
【问题讨论】:
标签: greenplum
从gp表向jdbc pxf表插入数据时:
insert into <pxf jdbc target>
select * from <gp table>
它是在与外部 RDBMS 有许多连接的所有 PXF 实例上并行工作,还是在单个 PXF 实例上并行工作,例如从 JDBC 源中选择而不进行分区?
GP 版本 6.17
【问题讨论】:
标签: greenplum
它将在所有 PXF 实例上并行。
【讨论】:
根据 gpdb 文档,对于 HDFS/S3 中的所有加载和卸载操作,查询将并行执行。
参考:https://docs.greenplum.org/6-10/admin_guide/external/g-external-tables.html
以下是他们文档中的引述。
外部表从数据库中访问外部文件,就像 它们是常规的数据库表。定义的外部表 gpfdist/gpfdists、pxf 和 s3 协议利用 Greenplum 并行性 通过使用所有Greenplum数据库段的资源来加载或 卸载数据。 pxf 协议利用了 Hadoop 分布式文件系统以访问该系统上的文件。这 s3 协议利用 Amazon Web Services (AWS) 功能。
【讨论】: