【发布时间】:2019-01-22 12:55:25
【问题描述】:
我正在尝试将 avro 文件存储为具有快速压缩的 parquet 文件。尽管数据被写入为带有 filename.snappy.parquet 的镶木地板,但文件大小保持不变。粘贴代码。
代码:
sqlContext.setConf("spark.sql.parquet.compression.codec","snappy")
orders_avro.write.parquet("/user/cloudera/problem5/parquet-snappy-compress")
【问题讨论】:
标签: apache-spark hadoop apache-spark-sql parquet snappy