【问题标题】:Impala: create parquet from mysql dumpImpala:从 mysql 转储创建镶木地板
【发布时间】:2016-02-11 09:12:05
【问题描述】:

我有 mysql 转储,如何使用 Impala 将它们转换为 parquet 文件格式?

我知道我可以从 CSV 创建 parquet 文件,但我想直接创建 parquet 文件而不需要这两个步骤。

【问题讨论】:

    标签: impala parquet


    【解决方案1】:

    我通常使用两步流程,但我确定有更好的方法。我们使用这种方式来保持 parquet table 在线,以便在更新期间尽可能多地提供不间断的服务。

    sqoop import --table <mysql_table> --hive-import --hive-table <hive_text_table>
    
    impala-shell -i <impala_ip_addr> -q 'use <db>; INVALIDATE METADATA <hive_text_table>; CREATE TABLE <parquet_table> LIKE <hive_text_table> STORED AS PARQUET; INSERT OVERWRITE <parquet_table> SELECT * FROM <hive_text_table>;'
    

    有点啰嗦,但以防万一你没有得到任何其他答案。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-11-11
      • 1970-01-01
      • 2023-01-20
      • 2022-01-19
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多