【发布时间】:2020-10-10 15:52:30
【问题描述】:
我有类似的代码
ParquetWriter<Record> writer = getParquetWriter("s3a://my_bucket/my_object_path.snappy.parquet");
for (Record r : someIterable) {
validate(r);
writer.write()
}
writer.close();
如果validate 抛出异常,我想释放与作者相关的所有资源。但在这种情况下,我不想在 S3 中创建任何对象。这可以实现吗?
如果我关闭编写器,它将结束 s3 分段上传并在云中创建一个对象。如果我不关闭它,到目前为止写入的部分将保留在磁盘缓冲区中,从而阻塞工作。
【问题讨论】:
标签: java hadoop amazon-s3 parquet parquet-mr