【问题标题】:bulk loading HBase - NoClassDefFoundError(HBaseConfiguration)批量加载 HBase - NoClassDefFoundError(HBaseConfiguration)
【发布时间】:2017-01-16 02:30:21
【问题描述】:

我的目标是在 Cloudera 集群 (CDH 5.9) 上运行一个简单的 MapReduce 作业,该作业从 CSV 文件读取并在 HBase 中写入(批量加载)。

我使用 SpringSource Tool Suite IDE。

执行此程序后,我遇到了异常。

Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/hbase/HBaseConfiguration
    at drivers.Driver.main(Driver.java:27)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:606)
    at org.apache.hadoop.util.RunJar.run(RunJar.java:221)
    at org.apache.hadoop.util.RunJar.main(RunJar.java:136)
Caused by: java.lang.ClassNotFoundException: org.apache.hadoop.hbase.HBaseConfiguration
    at java.net.URLClassLoader$1.run(URLClassLoader.java:366)
    at java.net.URLClassLoader$1.run(URLClassLoader.java:355)
    at java.security.AccessController.doPrivileged(Native Method)
    at java.net.URLClassLoader.findClass(URLClassLoader.java:354)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:425)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:358)
    ... 7 more

这是我的驱动代码:

package drivers;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.KeyValue;
import org.apache.hadoop.hbase.client.HTable;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.HFileOutputFormat;
import org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import mappers.HBaseMapper;

// args[0] = inputPath
// args[1] = outputPath
// args[2] = tableName

public class Driver {
  public static void main(String[] args) throws Exception {
    Path inputPath = new Path(args[0]);
    Path outputPath = new Path(args[1]);
    String tableName = args[2];

    Configuration conf = HBaseConfiguration.create();
    conf.set("hbase.table.name", tableName);

    Job job = new Job(conf, "NYCTaxi Bulk Import");
    job.setJarByClass(HBaseMapper.class);

    job.setMapperClass(HBaseMapper.class);
    job.setMapOutputKeyClass(ImmutableBytesWritable.class);
    job.setMapOutputValueClass(KeyValue.class);

    job.setInputFormatClass(TextInputFormat.class);

    HTable table = new HTable(conf, tableName);

    HFileOutputFormat.configureIncrementalLoad(job, table);

    FileInputFormat.addInputPath(job, inputPath);
    FileOutputFormat.setOutputPath(job, outputPath);

    job.waitForCompletion(true);
  }
}

这是我的 pom.xml 文件:

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
  <modelVersion>4.0.0</modelVersion>
  <groupId>MapReduce</groupId>
  <artifactId>InsertHBase2</artifactId>
  <version>1.0</version>
  <name>InsertHBase2</name>
<url>http://maven.apache.org</url>

    <properties>
        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
    </properties>

    <dependencies>
        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <version>3.8.1</version>
            <scope>test</scope>
        </dependency>

        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-common</artifactId>
            <version>2.6.0-cdh5.9.0</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-yarn-common</artifactId>
            <version>2.6.0-cdh5.9.0</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-mapreduce-client-common</artifactId>
            <version>2.6.0-cdh5.9.0</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-mapreduce-client-core</artifactId>
            <version>2.6.0-cdh5.9.0</version>
        </dependency>

        <dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase-server</artifactId>
            <version>1.2.0-cdh5.9.0</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase-client</artifactId>
            <version>1.2.0-cdh5.9.0</version>
        </dependency>   

        <dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase-common</artifactId>
            <version>1.2.0-cdh5.9.0</version>
        </dependency>       
    </dependencies>

    <repositories>
        <repository>
            <id>cloudera</id>
            <url>https://repository.cloudera.com/artifactory/cloudera-repos/</url>
        </repository>
    </repositories>
</project>

当我检查 Maven 依赖项中的 HBase jar 时,我注意到 HBaseConfiguration 类存在。

我的构建路径中已经有了 HBase jar

【问题讨论】:

  • 请查看我的回复
  • 它在编译类路径中并不意味着它也在运行时类路径中。您如何执行此任何命令或其他需要将此 jar 包含到类路径中的东西
  • 我怎样才能把它放在运行时类路径中?
  • 您是否使用任何命令来运行该应用程序?如果是,则必须将其添加到类路径中。如果您使用的是 eclipse,那么您需要在运行配置中添加它。
  • 我使用这个命令来运行这个应用程序:sudo -u hdfs hadoop jar insertHBase-1.0.jar drivers.Driver /user/cloudera/trip_data* /user/cloudera/output-trip Fare

标签: java maven hadoop mapreduce hbase


【解决方案1】:

一般说明:Java 中的 NoClassDefFoundError:NoClassDefFoundError 是一个错误

当 Java 运行时系统尝试加载定义时抛出 类和类定义不再可用。所需的 类定义在编译时存在,但在运行时丢失 时间。

下面的依赖应该有HBaseConfiguration

<dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase-common</artifactId>
            <version>1.2.0-cdh5.9.0</version>
        </dependency> 

交叉检查您是否将相同的内容传递给您的类路径。

在下面的命令中,所有与 hbase 相关的 jar 都会出现

export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:`hbase classpath`
 echo $HADOOP_CLASSPATH // THIS IS TO ENSURE THAT YOU ARE NOT MISSING ANY HBASE JARS AGAIN

然后将这个 java 打包到 jar 中以在 hadoop 集群中运行它,如下所示:-

hadoop jar <jarfile> <mainclass>

【讨论】:

  • 检查我上面hbase classpath的更新答案应该有所有hbase jar,你必须像上面一样添加到类路径中。
  • 如果您对答案没问题,请注意投票/接受为所有者。
猜你喜欢
  • 2016-05-04
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多