【问题标题】:Hadoop class not found exceptionHadoop 类未找到异常
【发布时间】:2016-12-10 05:24:28
【问题描述】:

我正在研究 hadoop 上的简单程序,我按照本教程步骤操作: http://www.bogotobogo.com/Hadoop/BigData_hadoop_Creating_Java_Wordcount_Project_with_Eclipse_MapReduce2.php

即使我在两台不同的机器上尝试过,它仍然显示此异常:

Exception in thread "main" java.lang.ClassNotFoundException: test.java
at java.net.URLClassLoader$1.run(URLClassLoader.java:366)
at java.net.URLClassLoader$1.run(URLClassLoader.java:355)
at java.security.AccessController.doPrivileged(Native Method)
at java.net.URLClassLoader.findClass(URLClassLoader.java:354)
at java.lang.ClassLoader.loadClass(ClassLoader.java:425)
at java.lang.ClassLoader.loadClass(ClassLoader.java:358)
at java.lang.Class.forName0(Native Method)
at java.lang.Class.forName(Class.java:270)
at org.apache.hadoop.util.RunJar.run(RunJar.java:214)
at org.apache.hadoop.util.RunJar.main(RunJar.java:136)

package pa2;
import org.apache.hadoop.conf.Configured;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.FileOutputFormat;
import org.apache.hadoop.mapred.FileInputFormat;
import org.apache.hadoop.mapred.JobClient;
import org.apache.hadoop.mapred.JobConf;
import org.apache.hadoop.util.Tool;
import org.apache.hadoop.util.ToolRunner;


public class test extends Configured implements Tool{


public int run(String[] args) throws Exception
{ if (args.length<2)
{
    System.out.println("plz give proper arguments");
    return -1;
}
      //creating a JobConf object and assigning a job name for identification purposes
      JobConf conf = new JobConf(test.class);

      FileInputFormat.setInputPaths(conf, new Path(args[0]));
      FileOutputFormat.setOutputPath(conf, new Path(args[1]));

      conf.setMapperClass(mapper.class);

      conf.setMapOutputKeyClass(Text.class);
      conf.setMapOutputValueClass(IntWritable.class);

      conf.setOutputKeyClass(Text.class);
      conf.setOutputValueClass(IntWritable.class);

      JobClient.runJob(conf);

      return 0;
}


public static void main(String[] args) throws Exception
{
      // this main function will call run method defined above.
  int exitcode = ToolRunner.run(new test(),args);
      System.exit(exitcode);
}
}

你能告诉我这里有什么问题吗?

更新:

映射器类:

package pa2;
import java.io.IOException;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.MapReduceBase;
import org.apache.hadoop.mapred.Mapper;
import org.apache.hadoop.mapred.OutputCollector;
import org.apache.hadoop.mapred.Reporter;


public class mapper extends MapReduceBase 
        implements Mapper<LongWritable,Text, Text, IntWritable>
{
            public void map(LongWritable Key, Text value,
            OutputCollector<Text, IntWritable> output, Reporter r)
            throws IOException {


            int i=0;
            String [] array = new String [50];


                        String name;
                        String year;
                        String s=value.toString();

                        for (String word:s.split(",")){

                   word = s.substring(0, s.indexOf(",")+1);
                   year= word.substring(0, s.indexOf(",")+1);
                   name=word.substring(s.indexOf(",")+1);
                   int theyear= Integer.parseInt(year);


                   if(theyear<2000){
                        array[i] =name;
                        output.collect(new Text(word),  new IntWritable(1));

                        i++;}

                    }       
    }
}

我还没有写reducer 类。我将项目导出为 jar 文件,并制作了一个名为 movies 的文本文件作为程序的输入。然后在终端里写了这个:

[cloudera@quickstart ~]$ cd workspace
[cloudera@quickstart workspace]$ ls
pa2  pa2.jar  training
[cloudera@quickstart workspace]$ hadoop jar pa2.jar test movies.txt output.txt
Exception in thread "main" java.lang.ClassNotFoundException: test
    at java.net.URLClassLoader$1.run(URLClassLoader.java:366)
    at java.net.URLClassLoader$1.run(URLClassLoader.java:355)
    at java.security.AccessController.doPrivileged(Native Method)
    at java.net.URLClassLoader.findClass(URLClassLoader.java:354)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:425)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:358)
    at java.lang.Class.forName0(Native Method)
    at java.lang.Class.forName(Class.java:270)
    at org.apache.hadoop.util.RunJar.run(RunJar.java:214)
    at org.apache.hadoop.util.RunJar.main(RunJar.java:136)

【问题讨论】:

  • 你是如何创建这个 JAR 文件的?
  • export >jar文件> 我把它命名为pa2.jar(和项目名一样>finish.
  • 尝试逐字遵循该教程。 testmapper 应该 1) 大写为 Java 类,则该类在默认包中为 WordCount

标签: java hadoop mapreduce


【解决方案1】:

不保证这是解决当前问题的方法,但是

package pa2;

这是附加到类名的。换句话说,完全限定的类名是pa2.test

所以,试试

hadoop jar ~/workspace/pa2.jar pa2.test input output

如果您使用该教程所示的默认包,则无需在命令行上指定包。

【讨论】:

  • 我试过了,它说:Not a valid JAR: /home/cloudera/pa2.jar
  • 好吧,正如它所说,它不在那个文件夹中/那个 JAR 是无效的。
  • 是的,对不起,我错了,现在终于可以使用了!非常感谢。
【解决方案2】:

此处应提供地图类的实际名称

conf.setMapperClass(mapper.class);

如果您尝试使用默认地图类,请编写“Mapper.class”。

【讨论】:

  • 是的,我拥有的地图类的名称是“mapper”。
  • 你是否将 hadoop jar 添加到 eclipse 中的 buildpath 中?
  • 是的。我将所有的 hadoop jar 添加到项目中。
  • 太好了,您可以分享完整的 mapreduce 代码(包括地图类)和您用于运行作业的命令吗?似乎是一个小的语义/语法问题导致了这个错误。
  • 非常感谢您的宝贵时间!现在已经修好了。
猜你喜欢
  • 1970-01-01
  • 2013-04-09
  • 2016-09-13
  • 2016-10-01
  • 2015-08-01
  • 2017-10-12
  • 1970-01-01
相关资源
最近更新 更多