【发布时间】:2016-03-30 20:33:10
【问题描述】:
如何使用 python 脚本从 hdfs (hadoop) 目录中获取文件列表?
我尝试了以下行:
dir = sc.textFile("hdfs://127.0.0.1:1900/directory").collect()
目录有文件列表“file1,file2,file3....fileN”。通过使用该行,我只获得了所有内容列表。 但我需要获取文件名列表。
谁能帮我找出这个问题?
提前致谢。
【问题讨论】:
标签: python file python-2.7 hadoop directory