【发布时间】:2017-09-24 18:34:16
【问题描述】:
我是 HDFS 和 HIVE 的新手。在阅读了一些书籍和文档后,我对两者都有了一些介绍。我有一个关于在 HIVE 中为 HDFS 中存在的文件创建表的问题。 我在 HDFS 中有这个包含 300 个字段的文件。我想在 HDFS 中创建一个访问该文件的表。但我想利用这个文件中的 30 个字段。 我的问题是 1、hive是否创建单独的文件目录? 2. 必须先创建hive表,然后从HDFS导入数据吗? 3. 由于我想创建一个包含 300 列中的 30 列的表,hive 是否创建一个只有这 30 列的文件? 4. 我必须创建一个30列的单独文件并导入HDFS,然后创建指向HDFS目录的hive表吗?
【问题讨论】:
-
请添加一个数据样本(比如说 3 行)。说明您要检索的列(至少是最后一个)