【问题标题】:How to make DataModel with multiple-input-file in mahout?如何在 mahout 中使用多输入文件制作 DataModel?
【发布时间】:2014-09-27 03:27:14
【问题描述】:

我想用大量 *.csv 文件制作 DataModel。(这些文件格式相同,数据不同)
但是,我不知道该怎么做。
我无法通过 mahout 文档找到函数。(mahout-API)
“制作将多个 *.csv 文件生成为一个 *.csv 文件的模块”唯一解决方案?
请帮助...!

【问题讨论】:

    标签: hadoop bigdata mahout datamodel mahout-recommender


    【解决方案1】:

    您可以合并所有*.csv文件,即合并两个文件,如下所示

    public static void main(String [] args) throws IOException{
        BufferedReader reader = new BufferedReader(new FileReader("YOUR_SOURCE_1"));
        BufferedReader reader2 = new BufferedReader(new FileReader("YOUR_SOURCE_2"));
        BufferedWriter writer = new BufferedWriter(new FileWriter("YOUR_TARGET");
        int x = 0;
        while ((line = reader.readLine()) != null) {
            if (x > 0) {
                String [] values = line.split("\\t", -1);
                writer.write(values[0] + "," + values[1]+","+values[2]+"\n");
            }
            x++;
        }
        String line;
        int x = 0;
        while ((line = reader.readLine()) != null) {
            if (x > 0) {
                String [] values = line.split("\\t", -1);
                writer.write(values[0] + "," + values[1]+","+values[2]+"\n");
            }
            x++;
        }
        reader.close();
        reader2.close();
        writer.close();
    }
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-09-30
      • 2011-11-04
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多