【发布时间】:2021-10-30 07:38:22
【问题描述】:
问题总结: 如果 ADFS 服务仍在运行但 ADFS 和 SQL 数据库之间的连接已断开,则对 ADFS 和 WAP 的 HTTP 探测是不够的。
ADFS 环境:
在环境中使用 HTTP 探测: ADFS environment with HTTP Probes
HTTP 探测: 对 ADFS 环境进行健康检查的常规方法是设置 HTTP 探测器,对每个 WAP 和 ADFS 服务器 URL 或 IP 运行 HTTP 检查。 他们通过 HTTP 端口 80 运行健康检查。返回 200(OK)。 对这些探测端点的响应是 HTTP 200 OK,并且仅在本地检查服务器/服务,不依赖后端服务(SQL 集群\数据库)
结论: 对 ADFS 和 WAP 服务器使用 HTTP 探测是不够的
问题描述: HTTP 端口分别直接连接到 WAP 和 ADFS 服务器。 这意味着他们只检查服务器和服务本身是否正常。 ADFS 后端之间的连接存在一个已知问题 SQL 服务器死了 2-3 分钟。在这段时间, 如果您不走运,ADFS 后端服务器会超时。 这里的问题是当 ADFS 后端服务器超时时, ADFS 服务 本身仍在运行。(就 HTTP 探测而言,ADFS 是 仍在启动和运行。)HTTP 探测器发出信号表明 ADFS 服务正常。 所以负载均衡器直到将最终用户发送到 与 SQL 数据库有死连接的 ADFS 服务 因为它的服务仍在运行。 最终用户在身份验证期间最终会出错。
问题: 如何在 ADFS --> SQL 集群/数据库之间设置适当的运行状况检查? 这样就可以看到 ADFS 之间的通信 --> SQL 不起作用 如预期。就像 ADFS 服务器上的服务仍在运行,但 ADFS 和 SQL 数据库之间的数据库连接已断开的情况一样。 我希望将健康检查作为第一站用于监控。其次,您可以构建一些可以通过运行状况检查执行的恢复步骤。
【问题讨论】:
标签: sql adfs health-check probe