【问题标题】:Nifi PutHiveStreaming writing data to HDFS but not able to see data in Hive tableNifi PutHiveStreaming 将数据写入 HDFS 但无法查看 Hive 表中的数据
【发布时间】:2019-04-03 12:30:12
【问题描述】:
  1. 我正在使用 HDF Nifi 1.5 和 Hdp Hive 3.1。

  2. 在 Hive 中创建分区和分桶表:

CREATE TABLE default.client_tbl (client_key int, clt_name varchar(45), clt_description varchar(200), version int) 分区由 (clt_status varchar(8)) CLUSTERED BY(client_key) INTO 3 BUCKETS 存储为 ORC TBLPROPERTIES('事务性'='true');

  1. 使用 ExecuteSQL --> PutHiveStreaming

Nifi 日志显示写入 HDFS 路径的数据,但我无法查看 Hive 表中的数据。

请查找 nifi-app.log 的附件。

【问题讨论】:

    标签: hive apache-nifi hortonworks-data-platform hdf


    【解决方案1】:

    如果您使用的是 HDP Hive 3.1,那么您将需要 PutHive3Streaming 而不是 PutHiveStreaming。前者适用于 Hive 3,后者适用于 Hive 1.2.x。

    话虽如此,Hive 3 组件自 NiFi 1.7.0+ 起可用。此外,如果您使用的是 Apache NiFi 发行版,则默认情况下它不包括 Hive 3 NAR(由于其大小)。您必须自己构建它或使用为 HDF 构建的那个(用于针对 HDP Hive 3),您可以获得 HDF 3.2 版本(NiFi 1.7.0)版本here

    【讨论】:

    • 非常感谢 matty,通过使用 HDF 3.2 我能够解决我的问题。
    • 我在使用 HDF Nifi 1.9 和 HDP Hive 3.1.1 时遇到了同样的问题。我还需要下载单独的 NAR 文件吗?
    • HDF 3.4(基于 Apache NiFi 1.9)应该已经包含 Hive 3 NAR。如果您使用的是 Apache NiFi 1.9,您可以自己构建它或在此处尝试 HDF 3.4 版本:repo.hortonworks.com/content/repositories/releases/org/apache/…
    猜你喜欢
    • 2017-12-01
    • 1970-01-01
    • 2011-08-11
    • 1970-01-01
    • 1970-01-01
    • 2020-04-10
    • 2019-07-12
    • 1970-01-01
    • 2020-10-13
    相关资源
    最近更新 更多