【发布时间】:2013-06-07 07:49:12
【问题描述】:
考虑一个复杂的 java (JAXB) 对象,它具有多个原语和集合作为成员变量。 Reducer 阶段将这些对象作为 对发送到 HDFS,其中 K 是一个 id,V 是对象的序列化形式 (SequenceFileOutputFormat)。
是否可以将这些 java 序列化对象从 HDFS/本地位置加载到 Hive/Impala?
MongoDB 能够将 JAXB 对象存储为开箱即用的 json 文档。非常感谢在 Hive 或 Impala 上实现相同目标的任何帮助。
【问题讨论】:
标签: serialization hadoop hive hdfs impala