【发布时间】:2016-09-23 20:40:33
【问题描述】:
我无法找到一种安全的方式来附加到HDFS 中的文件。
我正在使用一个小的 3-node Hadoop cluster (CDH v.5.3.9 to be specific)。我们的进程是一个数据管道,它是multi-threaded (8 threads),它有一个阶段,它将分隔文本行附加到HDFS 上的专用目录中的文件中。我正在使用锁来同步线程对附加数据的缓冲写入器的访问。
我的第一个问题是一般地决定方法。
方法 A 是打开文件,附加到它,然后为附加的每一行关闭它。这似乎很慢,并且似乎会产生太多的小块,或者至少我在各种帖子中看到了一些这样的情绪。
方法 B 是缓存写入器,但会定期刷新它们以确保写入器列表不会无限增长(目前,每个流水线处理的输入文件都有一个写入器)。这似乎是一种更有效的方法,但我想在一段时间内打开流但受到控制可能是一个问题,尤其是对于输出文件阅读器 (?)
除此之外,我真正的问题是两个。我正在使用FileSystem Java Hadoop API 进行附加,并且间歇性地得到这两个异常:
org.apache.hadoop.ipc.RemoteException: failed to create file /output/acme_20160524_1.txt for DFSClient_NONMAPREDUCE_271210261_1 for client XXX.XX.XXX.XX because current leaseholder is trying to recreate file.
org.apache.hadoop.ipc.RemoteException: BP-1999982165-XXX.XX.XXX.XX-1463070000410:blk_1073760252_54540 does not exist or is not under Constructionblk_1073760252_545
40{blockUCState=UNDER_RECOVERY, primaryNodeIndex=1, replicas=[ReplicaUnderConstruction[[DISK]DS-ccdf4e55-234b-4e17-955f-daaed1afdd92:NORMAL|RBW], ReplicaUnderConst
ruction[[DISK]DS-1f66db61-759f-4c5d-bb3b-f78c260e338f:NORMAL|RBW]]}
有人对其中任何一个有任何想法吗?
对于第一个问题,我尝试过检测this post 中讨论的逻辑,但似乎没有帮助。
我也对dfs.support.append 属性的作用感兴趣,如果适用的话。
我获取文件系统的代码:
userGroupInfo = UserGroupInformation.createRemoteUser("hdfs"); Configuration conf = new Configuration();
conf.set(key1, val1);
...
conf.set(keyN, valN);
fileSystem = userGroupInfo.doAs(new PrivilegedExceptionAction<FileSystem>() {
public FileSystem run() throws Exception {
return FileSystem.get(conf);
}
});
我获取 OutputStream 的代码:
org.apache.hadoop.fs.path.Path file = ...
public OutputStream getOutputStream(boolean append) throws IOException {
OutputStream os = null;
synchronized (file) {
if (isFile()) {
os = (append) ? fs.append(file) : fs.create(file, true);
} else if (append) {
// Create the file first, to avoid "failed to append to non-existent file" exception
FSDataOutputStream dos = fs.create(file);
dos.close();
// or, this can be: fs.createNewFile(file);
os = fs.append(file);
}
// Creating a new file
else {
os = fs.create(file);
}
}
return os;
}
【问题讨论】:
-
看来issues.apache.org/jira/browse/HDFS-7203 可能在这里起作用。我有原型代码,它维护一个附加到单个文件的单个线程。但我仍然看到“当前的承租人正在尝试重新创建文件”异常。