【发布时间】:2013-08-07 16:42:41
【问题描述】:
提供了一个分区的 fs 结构,如下所示:
logs
└── log_type
└── 2013
├── 07
│ ├── 28
│ │ ├── host1
│ │ │ └── log_file_1.csv
│ │ └── host2
│ │ ├── log_file_1.csv
│ │ └── log_file_2.csv
│ └── 29
│ ├── host1
│ │ └── log_file_1.csv
│ └── host2
│ └── log_file_1.csv
└── 08
我一直在尝试在 Impala 中创建一个外部表:
create external table log_type (
field1 string,
field2 string,
...
)
row format delimited fields terminated by '|' location '/logs/log_type/2013/08';
我希望 Impala 递归到子目录并加载所有 csv 文件;但没有雪茄。 没有抛出错误,但没有数据加载到表中。
/logs/log_type/2013/08/*/* 或 /logs/log_type/2013/08/*/*/* 等不同的 glob 也不起作用。
有没有办法做到这一点?或者我应该重组 fs - 对此有何建议?
【问题讨论】:
标签: hadoop bigdata cloudera impala