【发布时间】:2016-12-23 01:41:01
【问题描述】:
我是 hadoop 和大数据技术的新手。我喜欢将 parquet 文件转换为 avro 文件并读取该数据。我在几个论坛上搜索,它建议使用 AvroParquetReader。
AvroParquetReader<GenericRecord> reader = new AvroParquetReader<GenericRecord>(file);
GenericRecord nextRecord = reader.read();
但我不确定如何包含 AvroParquetReader。我不能够 完全导入它。
我可以使用 spark-shell 读取这个文件,并且可以将它转换为一些 JSON 然后可以将该 JSON 转换为 avro。但我正在寻找一个 更简单的解决方案。
【问题讨论】:
标签: hadoop apache-spark parquet spark-avro