【发布时间】:2016-09-12 10:21:14
【问题描述】:
我需要从多个不是父目录或子目录的路径中读取 parquet 文件。
例如,
dir1 ---
|
------- dir1_1
|
------- dir1_2
dir2 ---
|
------- dir2_1
|
------- dir2_2
sqlContext.read.parquet(dir1) 从 dir1_1 和 dir1_2 读取 parquet 文件
现在我正在读取每个目录并使用“unionAll”合并数据帧。
有没有办法从 dir1_2 和 dir2_1 读取镶木地板文件而不使用 unionAll 或者有什么奇特的方式使用 unionAll
谢谢
【问题讨论】:
-
您好,我是读取多个Json 文件的类似任务,但这里提供的代码不起作用:(您找到解决方案了吗?