【发布时间】:2017-12-19 11:34:49
【问题描述】:
我正在尝试在 spark 中加载 parquet 文件目录,但似乎无法正常工作...这似乎工作:
val df = sqlContext.load("hdfs://nameservice1/data/rtl/events/stream/loaddate=20151102")
但这不起作用:
val df = sqlContext.load("hdfs://nameservice1/data/rtl/events/stream/loaddate=201511*")
它给了我这个错误:
java.io.FileNotFoundException: File does not exist: hdfs://nameservice1/data/rtl/events/stream/loaddate=201511*
如何让它与通配符一起使用?
【问题讨论】:
-
您可以使用stackoverflow.com/questions/794381/… 中的一种解决方案将通配符转换为系统上存在的文件名列表。
-
什么版本的 Spark?这应该是固定的..
标签: hadoop apache-spark