【发布时间】:2011-02-19 20:36:26
【问题描述】:
我有一个包含 java 序列化对象的文件,例如“Vector”。我已将此文件存储在 Hadoop 分布式文件系统 (HDFS) 上。现在我打算在其中一个地图任务中读取这个文件(使用方法 readObject)。我想
FileInputStream in = new FileInputStream("hdfs/path/to/file");
无法工作,因为文件存储在 HDFS 上。所以我想到了使用 org.apache.hadoop.fs.FileSystem 类。但不幸的是,它没有任何返回 FileInputStream 的方法。它所拥有的只是一个返回 FSDataInputStream 的方法,但我想要一个输入流,它可以从文件中读取序列化的 Java 对象,例如向量,而不仅仅是 FSDataInputStream 会执行的原始数据类型。
请帮忙!
【问题讨论】:
标签: java filesystems hdfs