【问题标题】:Reason for region server to become dead区域服务器死机的原因
【发布时间】:2013-10-29 12:00:52
【问题描述】:

我有一个在亚马逊 Ec2 上运行的 3 节点 hbase 集群。哪个工作得很好。现在,我尝试使用两个单独的插入查询将数据从 EMR 插入到 EC2。所以第一次插入查询工作得很好并插入数据,然后我所有的区域服务器都死了。那么,您能否建议我调试此问题的一般准则以及为什么通常区域服务器会死机? 此外,即使我在某个时候再次明确启动区域服务器,它们也会死掉。

更新问题:

早些时候我认为这可能是一个问题,因为HBASE_HEAPSIZE 默认设置为 1GB。但我也将其增加到 5.5 Gb,但区域服务器正在死亡。 以下是我在每个区域服务器死后得到的日志。

2013-10-07 18:16:27,949 WARN org.apache.zookeeper.ClientCnxn: Session 0x141916dfbe50000 for server null, unexpected error, closing socket connection and attempting rec$
java.net.ConnectException: Connection refused
        at sun.nio.ch.SocketChannelImpl.checkConnect(Native Method)
        at sun.nio.ch.SocketChannelImpl.finishConnect(SocketChannelImpl.java:597)
        at org.apache.zookeeper.ClientCnxnSocketNIO.doTransport(ClientCnxnSocketNIO.java:286)
        at org.apache.zookeeper.ClientCnxn$SendThread.run(ClientCnxn.java:1035)
2013-10-07 18:16:27,990 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: localhost/10.179.42.93:50020. Already tried 1 time(s).
2013-10-07 18:16:28,049 INFO org.apache.zookeeper.ClientCnxn: Opening socket connection to server master/10.179.42.93:2181
2013-10-07 18:16:28,049 INFO org.apache.zookeeper.client.ZooKeeperSaslClient: Client will not SASL-authenticate because the default JAAS configuration section 'Client'$
2013-10-07 18:16:28,049 WARN org.apache.zookeeper.ClientCnxn: Session 0x141916dfbe50001 for server null, unexpected error, closing socket connection and attempting rec$
java.net.ConnectException: Connection refused
        at sun.nio.ch.SocketChannelImpl.checkConnect(Native Method)
        at sun.nio.ch.SocketChannelImpl.finishConnect(SocketChannelImpl.java:597)
        at org.apache.zookeeper.ClientCnxnSocketNIO.doTransport(ClientCnxnSocketNIO.java:286)
        at org.apache.zookeeper.ClientCnxn$SendThread.run(ClientCnxn.java:1035)
2013-10-07 18:16:28,177 INFO org.apache.zookeeper.ClientCnxn: Opening socket connection to server slave/10.178.5.52:2181
2013-10-07 18:16:28,177 INFO org.apache.zookeeper.client.ZooKeeperSaslClient: Client will not SASL-authenticate because the default JAAS configuration section 'Client'$
2013-10-07 18:16:28,178 WARN org.apache.zookeeper.ClientCnxn: Session 0x141916dfbe50001 for server null, unexpected error, closing socket connection and attempting rec$
java.net.ConnectException: Connection refused
        at sun.nio.ch.SocketChannelImpl.checkConnect(Native Method)
        at sun.nio.ch.SocketChannelImpl.finishConnect(SocketChannelImpl.java:597)
        at org.apache.zookeeper.ClientCnxnSocketNIO.doTransport(ClientCnxnSocketNIO.java:286)
        at org.apache.zookeeper.ClientCnxn$SendThread.run(ClientCnxn.java:1035)

【问题讨论】:

  • 嗨纳雷什。您找到解决此问题的方法了吗?
  • 面临同样的问题。

标签: hadoop hive hbase heap-memory apache-zookeeper


【解决方案1】:

您可以查看 RegionServer 的日志。以下是有关日志位置的更多信息。

如果每次都要显式开启区域服务器,那就是问题所在了。

最好的方法是使用 HBASE 启动一个新的 EMR 实例。

【讨论】:

  • 我已经更新了我在区域服务器死机后发现的日志。我知道我们可以在 EMR 上旋转 Hbase 实例,但由于某种原因我们没有使用。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2019-02-08
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2022-12-22
  • 1970-01-01
  • 2013-12-02
相关资源
最近更新 更多