【问题标题】:How to Querying to make compressed parquet file?如何查询以制作压缩的镶木地板文件?
【发布时间】:2016-09-28 12:30:00
【问题描述】:

我使用 apache Drill 制作了数据格式转换程序。

在这个程序中,如果csv文件转换成json,json文件在hdfs中制作

但是我想输出的文件是压缩的。

有可能吗??如果可以的话怎么做??

【问题讨论】:

  • 如果在不增加性能时间的情况下输出数据大小比以前小,那么每种方式都可以。

标签: hadoop apache-drill dataformat


【解决方案1】:

是的,您可以在 apache Drill 中设置压缩类型。

来自文档,

您可以在系统或会话级别为每个集群设置 Drill 查询计划和执行选项。在会话级别设置的选项仅适用于您在当前 Drill 连接期间运行的查询。在系统级别设置的选项会影响整个系统并在重新启动之间持续存在。会话级别设置会覆盖系统级别设置。”

ALTER SYSTEM SET `option_name` = value;

选项名称 store.parquet.compression 您可以从允许的值中选择压缩类型:snappy、gzip、无

更多信息here

【讨论】:

    猜你喜欢
    • 2021-09-14
    • 2021-12-06
    • 1970-01-01
    • 1970-01-01
    • 2021-10-24
    • 1970-01-01
    • 2021-07-28
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多