【发布时间】:2014-09-27 03:27:14
【问题描述】:
我想用大量 *.csv 文件制作 DataModel。(这些文件格式相同,数据不同)
但是,我不知道该怎么做。
我无法通过 mahout 文档找到函数。(mahout-API)
“制作将多个 *.csv 文件生成为一个 *.csv 文件的模块”唯一解决方案?
请帮助...!
【问题讨论】:
标签: hadoop bigdata mahout datamodel mahout-recommender
我想用大量 *.csv 文件制作 DataModel。(这些文件格式相同,数据不同)
但是,我不知道该怎么做。
我无法通过 mahout 文档找到函数。(mahout-API)
“制作将多个 *.csv 文件生成为一个 *.csv 文件的模块”唯一解决方案?
请帮助...!
【问题讨论】:
标签: hadoop bigdata mahout datamodel mahout-recommender
您可以合并所有*.csv文件,即合并两个文件,如下所示
public static void main(String [] args) throws IOException{
BufferedReader reader = new BufferedReader(new FileReader("YOUR_SOURCE_1"));
BufferedReader reader2 = new BufferedReader(new FileReader("YOUR_SOURCE_2"));
BufferedWriter writer = new BufferedWriter(new FileWriter("YOUR_TARGET");
int x = 0;
while ((line = reader.readLine()) != null) {
if (x > 0) {
String [] values = line.split("\\t", -1);
writer.write(values[0] + "," + values[1]+","+values[2]+"\n");
}
x++;
}
String line;
int x = 0;
while ((line = reader.readLine()) != null) {
if (x > 0) {
String [] values = line.split("\\t", -1);
writer.write(values[0] + "," + values[1]+","+values[2]+"\n");
}
x++;
}
reader.close();
reader2.close();
writer.close();
}
【讨论】: