【发布时间】:2026-02-09 15:35:01
【问题描述】:
有一个多级分区的 Hive 表,现在需要删除旧的分区文件夹 超过某些年份。
多级分区如下所示。
/data/warehouse/suite/catalyst/site/company=abc/year=2019/month=08
/data/warehouse/suite/catalyst/site/company=cde/year=2018/month=05
/data/warehouse/suite/catalyst/site/company=cde/year=2017/month=11
/data/warehouse/suite/catalyst/site/company=cde/year=2016/month=11
如果要删除超过 2 年的分区,即需要删除 /year=2017/month=11 和 year=2016/month=11 怎么做。
请帮忙,在此先感谢。
【问题讨论】:
-
看到这个答案:*.com/a/56646879/2700344 - 几乎完全一样
-
@leftjoin 感谢您的回复..通过您的回答。它看起来很好。我找到了不同的解决方案。
标签: shell apache-spark hive hdfs