附录

告警事件级别

级别 级别颜色 说明
灾难 灾难,可能会带来损失
严重 严重事件
问题 一般问题
警告 可能是问题
通知 一般信息
未知 未知问题

事件状态及流程

事件状态描述

级别 说明
未恢复 告警事件初始状态,告警事件从事件源到达系统之后赋予“未恢复”,意味着设备故障发生,未恢复事件不会出现在历史告警中。
已恢复 设备故障修复之后,监控工具发送恢复事件到系统,系统将之前的告警事件恢复状态置为已恢复;有些告警事件没有恢复事件,比如SNMPTrap事件,没有恢复事件的告警事件,会被系统定时恢复掉,默认经过12小时被恢复掉。已恢复事件会归档到历史告警。
未确认 事件确认状态的初始状态,未确认事件表示还没有通知到设备管理员。
已确认 已确认事件表示已经通知到设备管理员,通知方式可能是邮件、事件总线、socket等

事件流程

设备运行状态

WEB检测,PING,进程检测、端口检测依据

检测类型 状态 释义
WEB检测 良好 响应状态为200,401
异常 响应状态值为其他值
PING检测 良好 响应状态为1(UP)
异常 响应状态为0(DOWN)
进程检测 良好 响应状态为1(正常)
异常 响应状态为0(异常)
端口检测 良好 响应状态为1(UP)
异常 响应状态为0(DOWN)

设备状态正常、异常定义规则

设备运行状态有“正常、异常”两种,状态定义见下表说明:

状态 状态颜色 状态值 说明
设备正常 绿色正常 1 无告警事件,或有未知级别、通知级别、警告级别的告警事件发生,
严重告警 红色异常 3 灾难级别严重级别告警事件发生
一般告警 橙色异常 2 问题级别告警事件发生
暂无状态 灰色异常 0 运行时长为空(意味着该设备目前不可被监控,通常是设备已下线,监控项还未删除,或者Agent故障,网络中断与被监控主机失联等原因)
作者:admin  创建时间:2024-12-12 15:57
最后编辑:admin  更新时间:2025-01-03 10:01