【发布时间】:2017-10-20 18:41:23
【问题描述】:
我有 Hadoop 2.8.1
配置hdfs-site.xml
<configuration>
# Add the following inside the configuration tag
<property>
<name>dfs.data.dir</name>
<value>/app/dfs/name/data</value>
<final>true</final>
</property>
<property>
<name>dfs.name.dir</name>
<value>/app/dfs/name</value>
<final>true</final>
</property>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>
</configuration>
确实是通过python找到了这段代码
from pywebhdfs.webhdfs import PyWebHdfsClient
from pprint import pprint
hdfs = PyWebHdfsClient(host='hadoop01',port='50070', user_name='hadoop') # your Namenode IP & username here
my_data = "01010101010101010101010101010101000111 Example DataSet"
my_file = '/examples/myfile.txt'
hdfs.create_file(my_file, my_data.encode('utf-8'))
此变体有效。 但是我想把已经准备好的文件放到远程 HDFS。
试着写
with open("C:\\Downloads\\Demographic_Statistics_By_Zip_Code.csv") as file_data:
print(file_data)
BUT 文件未 PUT 到 HDFS。 只返回了
<_io.TextIOWrapper name='C:\\Downloads\\Demographic_Statistics_By_Zip_Code.csv' mode='r' encoding='cp1251'>
如何解决这个案子?
【问题讨论】: