MarkLogic 集群 - 使用所有文档配置 Forest答案

【问题标题】：MarkLogic Cluster - Configure Forest with all documentsMarkLogic 集群 - 使用所有文档配置 Forest
【发布时间】：2019-05-03 06:00:00
【问题描述】：

我们正在开发 MarkLogic 9.0.8.2

我们正在 Azure 上设置 MarkLogic 集群（3 个 VM），并且根据故障转移设计，希望在 Azure Blob 中有 3 个森林（每个用于节点）。

我已完成设置，当开始摄取时，我发现文档分布在 3 个森林中，而不是全部存储在每个森林中。

例如

我摄取了 30000 条记录，每个森林包含 10000 条记录。

我需要的是拥有 30000 条记录的所有森林。

我需要任何配置（在数据库或林级别）来实现这一点吗？

【问题讨论】：

标签： azure cluster-computing marklogic azure-blob-storage data-ingestion

【解决方案1】：

MarkLogic 的工作方式与其他一些 noSQL 文档数据库故障转移不同，后者可能会在每台主机上保留每个文档的副本。

MarkLogic 的集群特性将文档分布在主机之间以提供可用性和资源消耗的平衡。对于故障转移保护，您必须在每台主机上创建额外的林并将它们作为副本附加到现有林。这确保了 3 台主机中的任何一台出现故障时的可用性。

这是一个示例森林布局：

Host 1:    primary_forest_01     replica_forest_03
Host 2:    primary_forest_02     replica_forest_01
Host 3:    primary_forest_03     replica_forest_02

副本林必须与主林位于不同的主机上，如果每台主机有多个林，则应在主机之间条带化，以便在故障转移时最好地平衡资源消耗。

还需要注意的是，对于 HA，您还需要为系统数据库配置副本。

所以没有将所有文档放在每个主机上的数据库设置，因为这不是 MarkLogic 设计的工作方式。 Scalability, Availability and Failover Guide 信息量很大，在这种情况下，High Availability of Data Nodes with Failover 部分特别相关。我还强烈建议查看 MarkLogic 提供的 free training。

【讨论】：

你好 Michael，我们可以在 Azure 上按照本指南第 28 页中的建议配置 Blob 的上述方法吗？ docs.marklogic.com/guide/azure.pdf
谢谢迈克尔，我已经创建了单独的帖子，stackoverflow.com/questions/56227457/…，你能看看吗？
你好迈克尔，你能看看吗？