【发布时间】:2019-10-03 12:15:18
【问题描述】:
我正在尝试将 csv 数据摄取到 Hive 数据库中。为此,
我试过了
listFile --> FetchFile --> ConvertCSVToAvro --> ConvertAvroToOrc --> PutHDFS
csv 数据转换为 ORC 格式,数据正在加载到 HDFS。在这个 HDFS 数据之上,我可以创建 hive 外部表。
现在,我想用putHiveQL 处理器进行测试。
为此,我需要将 CSV 数据转换为 AVRO 到 JSON?
ORC 数据不能直接加载到 Hive 中?
如果是,我们必须手动创建 Hive 表还是自动创建?
【问题讨论】:
标签: hadoop hive apache-nifi avro orc