【发布时间】:2016-04-27 15:27:35
【问题描述】:
我正在尝试将本地存储的一些 XML 文件放入 HBase(版本 1.1.X)中。
我的目标是使用 MapReduce(no reduce stage)将这些 XML 的内容作为字符串存储在我的 HBase Table 中,而不将它们加载到 HDFS。
这是我的伪代码:
fetchXMLs(path);
XML2OneLineFile();
configureHBase(); // + establishing connection
Map(input, output); //input: one XML file in one line; output : is the Put() of HBase;
closeConnection();
这种解决问题的方法是否正确,还是有更好的方法?
ps:我不想从我的 XML 中解析或提取数据,只是存储它们。
提前致谢
【问题讨论】:
标签: xml hadoop mapreduce hdfs hbase