四、nagios页面介绍
Nagios 4.0.8版本登录后图片
General(常用)
Home(主页)和Documentation(文档)内容连接nagios官网,主要介绍nagios的内容。
Current Status
Tactical Overview (总览)
这个页面上显示了所有主机的状态信息可以看到停机own、不可达Unreachble、UP启动、等待返回状态pending。同时列出了所有服务的状态信息。所谓服务并非单纯指狭义上的Windows的系统服务,而是该设备上的进程、资源、系统服务等等的一个统称。
Network Outages显示网络中断的统计,如果有中断信息会在下面显示
Network Health显示网络健康状况,会列出主机和服务状况,以绿色进度条显示,进度条满格显示代表主机和服务状况正常。
Hosts:
down代表宕机
Unreachable代表不可到达
UP代表主机在线
Pending表示该主机刚被纳入监控范围,等待第一次检测结果返回中。
Services:
Critical代表紧急告警
Warning代表警告告警
Unknown代表未知告警
Ok代表服务运行正常
Pending代表待定
Monitoring Features:
Flap Detection代表抖动检测;
Notifications代表对外发布告警信息
Event Handlers代表事件句柄
Active Checks代表主动检测
Passive Checks代表被动检查
Map(拓扑图)
这个页面是2D网络拓扑图,列出所有hosts中的状态
通过拓扑图可以查看当前主机的一些信息,包括地址、主机名、状态、多少服务以及服务是否正常
Hosts (主机)
Host 显示的是主机详细信息,用ping探测的。如下图所示:
- Current Network Status:列出当前网络的状态,上次更新的日期以及登录的用户名称等;
- Host Status Totals:显示主机状态的统计信息,相应的统计信息会在下面列出,具体包括:UP,DOWN,Unreachable,Pending,All Problems,All Types; 可双击相应的选项进入查看。
- Service Status Totals:显示服务状态的统计信息,相应的信息会在下面列出;具体包括:UP,DOWN,Unreachable,Critical,Pending,All Problems,All Types;可双击相应的选项进入查看。
- Host Status Details For All Hosts:列出所有的主机的详细信息,包括:Host,Status,Last check,Duration,Status Information。如果想查看相关信息,我们可以点击Host或Service列出的主机和服务名称进行查看。
- Host:列出所有的主机名称。
- Status:列出所有主机的存活状态。
- Last Check:上次检测时间。
- Duration:运行持续时间。
- Status Information:相关状态信息。
点击上图中Host所列的任意一主机名称如下图所示:
针对图中“Host State Information”所列字段信息的说明:
- Host Status:主机存活的状态,UP代表存活,DOWN代表宕机。
- Status Information:状态信息
- Performance Data:性能数据信息
- Current Attempt:目前的尝试次数
- Last Check Time:最后检测时间
- Check Type:检测类型
- Check Latency/Duration:延时检测/持续检测
- Next Scheduled Active Check:下次计划主动检测时间
- Last State Change:上次状态改变时间
- Last notification:上次告警时间
- Is This Host Flapping:主机是否抖动,即反复出现故障,或刚从故障中恢复。
- In Scheduled Downtime:是否计划宕机
- Last Update:上次更新时间
针对图中“Host Commands”所列字段信息的说明:
- Disable active checks of this host:不主动检测这台主机
- Re-schedule the next check of this host:下一次计划检测这个主机,选中后可以自定义时间和是否强制检测,提交后执行即生效。这里默认的检测时间是距当前时间
- Submit passive check result for this host:为这个主机提交被动检测结果
- Stop accepting passive checks for this host:停止接受被动检测此主机
- Stop obsessing over this host:停止被困扰的主机
- Disable notifications for this host:不显示主机告警通知
- Send custom host notification:发送自定义主机告警
- Schedule downtime for this host:为主机提供停机功能,此功能为主机自定义停机时间,维护主机或者割接时常用到此功能,在指定的停机时间内,将不会发出通知;当预定的停机时间到期时,将发出通知些主机。里面会有起始时间和终止时间,可以选择固定或弹性停机,此功能需重点掌握,比较常用。
- Schedule downtime for allservice on this host:为该主机的所有服务提供停机功能,此功能为该主机的所有服务自定义停机时间,维护主机或者割接时常用到此功能,在指定的停机时间内,将不会发出通知;当预定的停机时间到期时,将发出通知些服务。里面会有起始时间和终止时间,可以选择固定或弹性停机,此功能需重点掌握,比较常用。
- Disable notifications for all services on this host:本机上的所有服务不启用告警
- Enable notifications for all services on this host:本机上的所有服务启用告警
- Schedule a check of all services on this host:计划为本机检测所有的服务,用来排定下次检查所有服务指定的主机,可以强制检查。
- Disable checks of all services on this host:禁用为本机检测所有的服务。
- Enable checks of all services on this host:与上面的相反。
- Disable event handler for this host:用来暂时阻止Nagios主机运行事件处理程序
- Disable flap detection for this host:停止本机抖动检测
Services(服务)
Services 显示的是所有服务详细信息。如下图所示: