【发布时间】:2021-07-22 18:08:17
【问题描述】:
我们有一个 13 个节点的 nifi 集群,大约有 50k 个处理器。 flow.xml.gz 的大小约为 300MB。启动 13 个节点的 Nifi 集群,通常需要 8-10 个小时。最近我们将集群分成两部分,5 节点集群和 8 节点集群,两者都具有相同的 300MB flow.xml.gz。从那时起,我们无法在两个集群中启动 Nifi。此外,我们没有看到任何与此问题相关的有效日志。是否可以拥有相同的 flow.xml.gz 。在拆分 Nifi 集群时,我们可能会遗漏哪些最佳实践。
【问题讨论】:
-
您是如何准确拆分集群的?他们还在共享 zookeeper 集群吗?
-
@Cyrus 是的,我们仍在为两个 nifi 集群使用相同的 Zookeeper。有什么问题吗?
-
不应该有,如果您指定了不同的根节点而不是 /nifi。如果两个集群仍在尝试写入 /nifi 根节点,它将无法工作。
-
@Cyrus 我们分离了根节点。两个集群在 zookeeper 中都有不同的根节点。集群 1 配置了 /nifi1,集群 2 配置了 /nifi2。
-
我对这么大的流量没有任何经验,但是由于每个节点都加载并运行完整的流量,所以没有理由一个较小的集群不能运行它。您是否尝试过在独立的 NiFi 安装上加载流程?
标签: apache-nifi cloudera