【发布时间】:2018-05-15 02:05:22
【问题描述】:
我必须创建一个自动化流程来列出 Hive 中的所有外部表并对这些表进行记录计数。
我应该将此作为日常工作。我通过对所有外部表名称进行硬编码来尝试此操作,但这不被接受,因为表每月会不断更改一次。
我经历了不同的方法,例如[show tables] 并在元存储数据库中执行查询。但这些不会帮助我自动化这个过程。
有没有更好的方法在 Hive 中实现这一点。
【问题讨论】:
-
编写一个 shell 脚本并从元存储中获取所有外部表详细信息,并在 hive 中迭代/生成“SELECT COUNT(*)”。
标签: hive hiveql external-tables