【发布时间】:2017-09-05 16:13:33
【问题描述】:
我已经按照this tutorial 在 AWS EC2 上成功安装了 hadoop 和 spark。 我可以从 AWS 上的 spark 访问 HDFS。
但是,当我尝试从本地计算机访问 HDFS 文件时
val lines = sc.textFile("hdfs://namenode_public_DNS:9000/datasets/wikipedia/wikipedia.dat")
lines.first()
我明白了
17/04/10 16:35:41 WARN BlockReaderFactory: I/O error constructing remote block reader.
org.apache.hadoop.net.ConnectTimeoutException: 60000 millis timeout while waiting for channel to be ready for connect. ch : java.nio.channels.SocketChannel[connection-pending remote=/datanode_ip:50010]
我该如何解决这个问题?
提前致谢。
- 所有 AWS 实例都设置为允许所有流量。
- 我只有 1 个名称节点和 1 个数据节点
【问题讨论】:
-
Namenode返回给Client的datanode IP是私网IP,本地机器无法访问。
标签: amazon-web-services hadoop apache-spark amazon-ec2 hdfs