【发布时间】:2026-02-13 05:10:01
【问题描述】:
我正在尝试读取 parquet 文件并对其执行一些操作并将结果保存为 HDFS 上的 parquet。我正在使用 Spark 进行操作。这样做时,我遇到了以下异常。
java.io.EOFException: Premature EOF: no length prefix available
at org.apache.hadoop.hdfs.protocolPB.PBHelper.vintPrefixed(PBHelper.java:2203)
at org.apache.hadoop.hdfs.protocol.datatransfer.PipelineAck.readFields(PipelineAck.java:176)
at org.apache.hadoop.hdfs.DFSOutputStream$DataStreamer$ResponseProcessor.run(DFSOutputStream.java:867)
任何关于可能是什么原因和解决方案的帮助。
使用 CDH 5.4.1
【问题讨论】:
-
向我们展示你到目前为止所做的尝试......
-
尝试使用合并来减少写入时的分区数。如果它不起作用,也许你可以发布你的代码来帮助调试。
-
没有足够的背景信息或故障排除步骤。
-
投票结束,但也发布了一个通用答案,这可能与给定信息一样好。
标签: hadoop apache-spark hdfs cloudera