【问题标题】:Service Fabric ImageStoreService fails to replicateService Fabric ImageStoreService 无法复制
【发布时间】:2017-04-26 20:50:31
【问题描述】:

我在三个 VM 上安装了 Service Fabric,在 Windows Server 2016 上每个 VM 有 5 个节点(每个都配置了单独的 NodeType 以避免端口冲突等)。这类似于在开发人员上运行具有 5 个节点的 OneBox Service Fabric机器。

安装过程中一切正常,所有服务都正常启动。问题是 ImageStoreService 无法完成其复制周期,其中 3 个节点之一(beta2gamma4beta0 下面)停留在 In Build 而不是完成。

服务本身报告:

Error event: SourceId='System.FM', Property='State'. Partition is below target replica or instance count. ImageStoreService 3 3 00000000-0000-0000-0000-000000003000 N/P RD beta2 Up 131372506454740092 N/S IB gamma4 Up 131372506515241065 N/S RD beta0 Up 131372506515241066 (Showing 3 out of 3 replicas. Total available replicas: 2.)

我已确保每个系统服务创建的共享文件夹可用并且在磁盘上有一个备份文件夹(有时卸载过程会创建孤立文件夹)。我已在所有三台服务器上禁用 Windows 防火墙以防止任何阻塞。我已经在所有三台机器上重新安装了 Windows Server 2016 并重新安装了 Service Fabric,但问题仍然存在。

更新 根据问题的 cmets,我创建了一个新配置并将其部署在 3 个 VM 上(如前所述),但每个 VM 仅运行 1 个节点。

服务再次正常启动,但 ImageStoreService 报告:

Unhealthy event: SourceId='System.FM', Property='State', HealthState='Warning', ConsiderWarningAsError=false. Partition reconfiguration is taking longer than expected. ImageStoreService 3 3 00000000-0000-0000-0000-000000003000 P/P RD gamma Up 131376836149092409 S/S IB alpha Up 131376836457801126 S/S IB beta Up 131376836457801127 (Showing 3 out of 3 replicas. Total available replicas: 1.)

随着时间的推移,这个Warning 变成了Error。似乎只要 ImageStore 的复制必须跨越虚拟机,它就无法完成复制。

我的问题是,以前是否有人遇到过这种情况?关于什么可能导致复制失败的任何建议?安装集群中的哪里存储了与复制事件相关的错误信息?

【问题讨论】:

    标签: azure-service-fabric


    【解决方案1】:

    一台机器应该是一个集群节点,而不是5个。更多信息here

    独立 Service Fabric 群集中的每个节点都有服务 Fabric 运行时已部署并且是集群的成员。在一个典型的 生产部署,每个操作系统实例有一个节点(物理或 虚拟)。

    【讨论】:

    • 我们从同一页面获取信息。在您在回答中提到的部分下方,还提到了以下内容:“出于开发目的,您可以在给定计算机上拥有多个节点。在生产环境中,Service Fabric 仅支持每个物理机或虚拟机一个节点。”我仍然需要确定为什么 ImageStoreService 是唯一无法正常运行的系统服务。
    • 那你为什么要把 dev 集群和 prod 集群混在一起呢?
    • 我有一个由 3 台机器组成的开发集群,用于调试目的——尤其是在测试故障域是否正常工作时。我没有提到这是用于产品设置。问题是 ImageStoreService 的系统服务没有启动。
    • 我已将配置更改为每个 VM 1 个节点,以消除 cmets 中提到的所有可能的失败原因。我已将结果发布为对原始问题的更新。
    猜你喜欢
    • 1970-01-01
    • 2016-09-28
    • 2019-07-06
    • 2021-03-03
    • 2019-02-21
    • 2020-09-26
    • 2019-11-30
    • 2016-08-21
    • 2016-11-25
    相关资源
    最近更新 更多