【发布时间】:2021-03-09 14:58:17
【问题描述】:
假设我有一个分区的配置单元表
>show partitions db.my_table;
+----------------------------------+
| partition |
+----------------------------------+
| in_date=20-09-2020 |
| in_date=21-09-2020 |
| in_date=22-09-2020 |
+----------------------------------+
如果我手动从 HDFS 中删除分区目录
$hadoop fs -rm -r 'path/to/table/in_date=20-09-2020';
但不要从 hive 表中删除分区
它会导致任何真正的问题(除了表元数据中有孤立的分区名称)吗?
我已验证的内容
hive 表查询工作正常(对于外部和内部表)
>select * from db.my_table; --works fine
>show partitions db.my_table --shows orphaned partitions,not a real problem
编辑:Aggergate 函数查询,如 COUNT()、MAX() 等失败并出现错误
输入路径不存在:path/to/table/in_date=20-09-2020
有谁知道这是否会导致其他问题/破坏其他应用程序?
【问题讨论】: