【发布时间】:2015-07-06 07:35:27
【问题描述】:
我是 Hadoop 的新手,想知道如何使用 MapReduce 在 HDFS 中搜索指定的文件名?假设我有数千 TB 的图像地图数据,这些数据由它们的纬度/经度坐标命名。提供给定的纬度/经度坐标,我如何使用 MapReduce 快速找到该文件?
我四处搜索,发现一种方法是将其通过管道传递给 grep:
hdfs dfs -ls -R / | grep [search_term]
但这对于许多大数据文件来说会很慢。
【问题讨论】:
标签: hadoop mapreduce filesystems distributed distributed-computing