【发布时间】:2020-02-26 20:20:43
【问题描述】:
我正在尝试将 Hive Table f1 的数据导出到 s3://mubucket/exported.csv 的 csv 文件中。我在 Amazon EMR 中创建了一个集群并使用 emr-4.0.0。 Hadoop 分布:Amazon 2.6.0 和 Hive 1.0.0。将数据从 Hive 表导出到 s3 存储桶的 csv 文件的查询是什么?
【问题讨论】:
标签: hive amazon-emr
我正在尝试将 Hive Table f1 的数据导出到 s3://mubucket/exported.csv 的 csv 文件中。我在 Amazon EMR 中创建了一个集群并使用 emr-4.0.0。 Hadoop 分布:Amazon 2.6.0 和 Hive 1.0.0。将数据从 Hive 表导出到 s3 存储桶的 csv 文件的查询是什么?
【问题讨论】:
标签: hive amazon-emr
传统的方法是使用CREATE EXTERNAL TABLE在Amazon S3中定义一个输出位置,然后将数据插入到表中。这会导致 CSV 文件存储在 Amazon S3 存储桶中。
CREATE EXTERNAL TABLE mydata (foo STRING, bar INT, ...)
LOCATION 's3://mybucket/';
INSERT OVERWRITE TABLE mydata
SELECT * FROM existing_table;
【讨论】: