【发布时间】:2012-11-26 20:34:45
【问题描述】:
有很多工具可以检查您的网站正常运行时间。我正在寻找一种相反的工具……也就是说,我每分钟向第 3 方发送一条消息,如果它错过了一条消息,它会提醒我。
我的问题是我有一个长时间运行的进程,一天随机挂起。我无法深入了解它,从那以后它就没有发生过,但我想监控它。我在 Ubuntu 上使用 upstart 来监控进程并在它崩溃时重新启动它......问题是它没有崩溃只是挂起。
【问题讨论】:
-
您可以结合使用 Icinca/Nagios 被动检查 和 检查新鲜度 来获得该行为。或者只是在每次消息通过时
touch一个文件,并让另一个进程监视该文件并在它超过某个阈值时发出警报。 -
第三者是什么意思?那个第三方是谁,你想发送什么样的消息等等? :)
-
@favoretti 类似 pingdom 或 new relic。我只想每分钟发送一次“我还活着”消息,如果第 3 方在 2 分钟内没有收到消息,我会提醒我。
-
嗯,类似 cron 脚本的东西,它不会做吗?你想要一些“解决方案”吗? :)
标签: linux ubuntu process monitoring upstart