【发布时间】:2014-07-30 02:15:51
【问题描述】:
我有一个包含大约 330 万行的大型 csv 文件,我已将其上传到 Hive 元存储并从中创建了一个表。
但是当我运行一个
从表中选择计数(*)
查询一下,它只显示了大约 170 万行。
我已经运行了一个
从表中选择 *
查询并下载结果为 csv,该文件中只有大约 170 万行。
您可以导入 hive 并从中创建表的 csv 文件是否有大小限制?
非常感谢任何提示。
【问题讨论】:
-
如何创建 Hive 表?是通过 Hive 命令行界面还是 HUE?我发现使用 HUE 从 Hive Metastore 导入或导出数据存在一些限制,因此这是一种可能性。另外,您是否尝试在 JobHistory 或任何日志文件中查看作业?