【发布时间】:2017-03-25 00:38:16
【问题描述】:
我已将我的 Flume 源配置为 Spooldir 类型。我有很多 CSV 文件,.xl3 和 .xls,我希望我的 Flume 代理将所有文件从 spooldir 加载到 HDFS 接收器。然而水槽代理返回异常
这是我对水槽源的配置:
agent.sources.s1.type = spooldir
agent.sources.s1.spoolDir = /my-directory
agent.sources.s1.basenameHeader = true
agent.sources.batchSize = 10000
还有我的 HDFS 接收器:
agent.sinks.sk1.type = hdfs
agent.sinks.sk1.hdfs.path = hdfs://...:8020/user/importflume/%Y/%m/%d/%H
agent.sinks.sk1.hdfs.filePrefix = %{basename}
agent.sinks.sk1.hdfs.rollSize = 0
agent.sinks.sk1.hdfs.rollCount = 0
agent.sinks.sk1.hdfs.useLocalTimeStamp = true
agent.sinks.sk1.hdfs.batchsize = 10000
agent.sinks.sk1.hdfs.fileType = DataStream
agent.sinks.sk1.serializer = avro_event
agent.sinks.sk1.serializer.compressionCodec = snappy
【问题讨论】:
标签: excel csv hadoop hdfs flume