【问题标题】:How to Monitor Uptime of 20 Websites (Ping or HTTP) in Node.js/RoR如何在 Node.js/RoR 中监控 20 个网站(Ping 或 HTTP)的正常运行时间
【发布时间】:2011-01-17 01:17:51
【问题描述】:

每隔 5 分钟 ping 20 个网站的列表(例如)以了解该网站是否响应 HTTP 202 的最佳方法是什么?

不费吹灰之力的想法是将 20 个 URL 保存在数据库中,然后运行数据库并 ping 每个 URL。但是,当一个人不回答时会发生什么?之后的那些人会怎样?

另外,有没有更好但更简单的解决方案?恐怕列表会增长到 20000 个网站,然后在我需要 ping 的 5 分钟内没有足够的时间来 ping 它们。

基本上,我是在描述 PingDom、UptimeRobot 等的工作原理。

我正在使用 node.js 和 Ruby on Rails 构建这个系统。 我也倾向于使用 MongoDB 来保存所有 ping 和监控结果的历史记录。

建议?

非常感谢!

【问题讨论】:

  • 这个问题是对今天早些时候迁移到Server Fault的类似问题的重新提交。
  • 不,不是。这与编程有关。不是windows命令。请不要将此移至服务器故障。
  • 我错了还是您本质上是在问如何构建健壮、可靠和可扩展的网络监控应用程序? :) 我认为你应该更具体。
  • @Mladen,基本上就是这样 ;) 你能告诉我你会怎么做吗?谢谢!
  • 您可以为此目的使用其中一个应用程序,例如 Pingdom 或我开发的称为 Pinglist 的正常运行时间和性能监控应用程序:pingli.st

标签: ruby ruby-on-rails-3 node.js pingdom


【解决方案1】:

Github

我真的很喜欢 node.js,我想解决这个问题,并希望很快在 github 上分享一些代码来实现这一点。请记住,我现在只有一个非常基本的设置,托管在 https://github.com/alfredwesterveld/freakinping

ping 列表的最佳方法是什么 每 5 分钟访问 20 个网站(对于 示例)以了解该站点是否 是否响应 HTTP 202?

PING(ICMP)

首先我想知道您是否真的想执行ping(ICMP),或者您是否只想知道网站是否返回代码 200(OK) 并测量所需时间。我相信从上下文来看,您并不是真的想做一个 ping,而只是一个 http 请求并测量时间。我问这个是因为(我相信)普通用户无法从 node.js/ruby/python 执行 ping,因为我们需要原始套接字(root 用户)从编程语言执行 ping(ICMP)。例如,我在 python 中找到了这个ping 脚本(我也相信我在某处看到了一个简单的 ruby​​ 脚本,尽管我不是一个真正的 ruby​​ 程序员)但需要 root 访问权限。我不相信 node.js 甚至还有一个 ping 模块。

消息队列

还有,有没有更好但更简单的 解决方案?恐怕名单 可以增长到 20000 个网站,然后 没有足够的时间来 ping 它们 一切都在我需要的 5 分钟内 正在ping。

基本上,我描述的是 PingDom, UptimeRobot 等工作。

实现这种规模需要使用message queue,例如redisbeanstalkd 或gearmand。在 PingDom 的规模上,一个工作进程不会削减它,但在你的情况下(我假设)一个工作人员会做。我认为(假设)由于 C(node.js)扩展,redis 将是最快的消息队列,但我应该再次将它与 beanstalkd 进行基准测试,beantalkd 是另一个流行的消息队列(但还没有 C 扩展)。

恐怕列表可以增长到 20000 网站

如果你达到那个规模,你可能必须拥有多个盒子(很多工作线程/进程)来处理负载,但你还没有达到那个规模,而且 node.js 速度非常快。它甚至可以用一个盒子来处理这种负载,尽管我不确定(你需要做/运行一些基准测试)。

数据存储/Redis

我认为这可以在 node.js 中很容易地实现(我真的很喜欢 node.js)。我这样做的方法是使用 redis 作为我的数据存储,因为它非常快!

PING: 20000 ops 46189.38 ops/sec 1/4/1.082
SET: 20000 ops 41237.11 ops/sec 0/6/1.210
GET: 20000 ops 39682.54 ops/sec 1/7/1.257
INCR: 20000 ops 40080.16 ops/sec 0/8/1.242
LPUSH: 20000 ops 41152.26 ops/sec 0/3/1.212
LRANGE (10 elements): 20000 ops 36563.07 ops/sec 1/8/1.363
LRANGE (100 elements): 20000 ops 21834.06 ops/sec 0/9/2.287

使用node_redis(使用hredis(node.js)c 库)。我会使用 sadd 将 URL 添加到 redis。

每 5 分钟运行一次任务

这几乎不需要任何努力就可以实现。我会使用setInterval(callback, delay, [arg], [...]) 反复测试服务器的响应时间。使用 smembers 从 redis 获取 callback 上的所有 URL。我会使用 rpush 将所有 URL(消息)放在消息队列中。

检查响应(时间)

但是,如果不这样做会发生什么 答案?那些会发生什么 之后呢?

我可能不完全理解这句话,但在这里。如果一个失败了,它就失败了。您可以尝试在 5 秒后再次检查 response(time) 或其他内容以查看它是否在线。应该为此设计一个精确的算法。之后的那些不应该与以前的 URL 有任何关系,除非它们指向同一服务器。我猜你也清楚地想到了一些事情,因为那样你不应该同时将所有这些 URL ping 到同一服务器,而是将它们排队或其他东西。

处理网址

从工作进程(现在只要一个就足够了)使用brpop 命令从redis 获取消息(URL)。检查 URL(消息)的响应时间并从列表中获取下一个 URL(消息)。我可能会同时做几个请求来加快这个过程。

【讨论】:

  • 太棒了! ;) 如果您编写一些代码并将其发布在 GitHub 上,请告诉我!优秀的帖子!
  • 我在 github 上托管了一个非常基本的项目设置,我希望以后继续工作 => github.com/alfredwesterveld/freakinping
  • 我去看看!谢谢。顺便说一句,你用什么测试?谢谢。
  • 目前我还没有任何测试。我想我应该为自己感到羞耻。这是清单上的一件大事!
  • @Alfred,我希望你能回答这个问题:stackoverflow.com/questions/4713751/…
【解决方案2】:

没有“基本方法”,因为你必须处理很多用例:

  • http 重定向,
  • https 页面,
  • 请求超时,
  • 用于 ping 的服务器的 CPU 负载,
  • 您需要的报告类型(可用性?正常运行时间?响应能力?停机时间?)
  • 如何按时间聚合 qos 测量结果
  • 您收集的数据的生命周期(每五分钟 ping 几十个目标会很快产生大量数据)
  • 实时警报

Pingdom 等不是“基本”工具,如果您想要类似的东西,您可能需要付费或依赖现有的开源替代品。我肯定知道,因为我自己构建了一个远程监控应用程序。它被称为 Uptime,它是用 Node.js 和 MongoDB 编写的,它托管在 GitHub (https://github.com/fzaninotto/uptime) 上。开发它花费了数周的努力,所以相信我:这不是一件容易的事。

【讨论】:

    【解决方案3】:

    使用 zabbix、nagios、blah blah 等监控工具,它们可以大量衡量服务器的各种参数。

    如果你想在js中实现它,你可以做一个时间间隔的http请求,然后确定http返回状态码,并使用xpath或regex来验证某些元素是否正确

    对于 ruby​​,一个守护进程并使用线程池(多线程思想)和开放 URI 来查看 http 代码和内容,使用 xpath 来验证内容是否行为正确。

    【讨论】:

      【解决方案4】:

      如果您好奇,我已经创建了一个名为 Pinger 的应用程序来执行此操作。它基于 Ruby on Rails 和 Resque 构建:

      https://github.com/austinthecoder/pinger

      【讨论】:

        【解决方案5】:

        有一些免费的优质服务为我们提供了非常稳定的网站正常运行时间检查和通知。您可以查看此说明并查看http://fastjoomlahost.com/how-to-monitor-website-up-time

        【讨论】:

          【解决方案6】:

          您也可以使用 node-ping-monitor 包在 Node.js 中执行此操作。

          【讨论】:

            猜你喜欢
            • 1970-01-01
            • 1970-01-01
            • 1970-01-01
            • 1970-01-01
            • 2011-09-18
            • 1970-01-01
            • 1970-01-01
            • 1970-01-01
            • 1970-01-01
            相关资源
            最近更新 更多