运行总览

用户登录后,首先进入“运行总览”页,通过图表的形式对纳管设备的整体运行状况、告警事件发生情况、通知确认情况等,进行展示。

运行总览目前包括“设备运行总览”和“告警事件总览”。

设备运行总览

设备运行总览,是对被监控对象不同维度的统计,通过8个板块反映核心设备的纳管及新增、告警发生、告警转工单状况。8个板块分别是:“纳管设备状态分布、运行监控系统新增纳管、告警级别分布(1h)、历史告警(30天)、TOP5板块、告警设备分布板块、告警分类等级分布板块、告警处理状态分布板块。

默认加载“纳管设备状态分布、运行监控系统新增纳管、告警级别分布(1h)、历史告警(30天)”四个板块,可以根据实际工作需要配置展示“告警设备TOP5、告警设备分布、告警分类等级分布、告警处理状态分布”等板块。

  • 纳管设备状态分布板块

    通过柱状图展示了纳管设备的运行状态分布

设备运行状态有“正常、异常”两种,状态定义见下表说明:

状态 状态颜色 状态值 说明
设备正常 绿色正常 1 无告警事件,或有未知级别、通知级别、警告级别的告警事件发生,运行时长不为空且大于0
严重告警 红色异常 3 灾难级别严重级别告警事件发生,运行时长不为空且大于0
一般告警 橙色异常 2 问题级别告警事件发生,运行时长不为空且大于0
暂无状态 灰色异常 0 运行时长为空(意味着该设备目前不可被监控,通常是设备已下线,监控项还未删除,或者Agent故障,网络中断与被监控主机失联等原因)

统一事件平台的告警级别分为6种,灾难、严重、问题、警告、通知、未知。因为统一事件平台会接入多种监控工具的告警,并且级别关系可由用户灵活自定义,所以命名规则并不完全与Zabbix定义的级别相一致。

图:集中事件平台的告警级别

注:1、Zabbix的告警级别:紧急、严重、次要、警告、信息、未知

图:Zabbix的告警级别

2、设置了屏蔽策略被屏蔽的告警事件,不在此处被统计。

3、有设备运行时长指标的设备:通常为主机、存储、网络、安全等设备,运行时长取值取24小时内最新值,

4、无设备运行时长指标的设备:通常为无线AP、门禁、等非网管设备、一般通过“探测”方式(如Web、Ping、进程、端口等)进行检测

  • 运行监控系统新增纳管板块

    通过柱状图展示了本系统新增纳管设备状况,时间维度上有月与周新增状况,设备分类来自于“数仓配置-设备类别管理”中添加的设备类别。例如服务器硬件、操作系统等的新增状况。

  • 告警级别分布(1h)板块

    通过饼图展示了1小时内告警等级的分布情况

  • 历史告警板块

    通过折线图展示了30天内每天告警等级的分布状况。

  • 告警设备TOP5板块

    通过柱状图展示前日告警设备TOP5

  • 告警设备分布(1h)板块

    展示1小时内告警分类的分布情况,数值代表告警数量。

  • 告警分类等级分布板块

    通过桑基图展示了告警设备、告警事件等级分布状况,桑胜图左侧为告警分类,右侧为告警等级。

  • 告警处理状态分布(1h)板块:

    通过饼图展示告警事件三个处理状态(未确认、处理中、已完成)中不同告警等级的告警事件分布状况。

注:各板块数据权限规则:

板块名称 数据范围
纳管设备状态分布 纳管设备,与权限无关
运行监控系统新增纳管 纳管设备,与权限无关
告警级别分布 根据配置设备权限展示相关设备告警的分布情况
历史告警 根据配置设备权限展示相关设备告警的分布情况
告警设备TOP5 根据配置设备权限且转发到第三方通知平台的告警分布情况
告警设备分布 根据配置设备权限展示相关设备告警的分布情况
告警分类等级分布 根据配置设备权限展示相关设备告警的分布情况
告警处理状态分布 根据配置设备权限展示相关设备告警的分布情况

操作描述

页面标题修改

可以双击页面任意空白处,全屏当前页面。全屏状态下会展示页面标题。默认标题为“核心设备运行总览”,可以点击标题右侧的“”按钮对页面标题文字进行修改。

编辑完成后,点击标题右侧“”按钮,保存为新的页面标题。

每个用户可以独立设置该页面名称,而不互相影响。

板块添加、删除

当前页面默认展示“纳管设备状态分布、运行监控系统新增纳管、告警级别分布(1h)、历史告警(30天)”四个板块,可以通过点击右上角“”按钮,弹出配置弹窗。

通过操作“”按钮控制板块的显示与隐藏,“”表示展示,“”表示隐藏。通过调整排序数值大小调整板块在页面上的展示顺序,顺序越小排序越前。

完成配置后点击“”按钮,配置生效。点击“”按钮,配置不生效。

数据刷新

每个板块的数据每分钟刷新一次。如果需要手动刷新页面数据,可以点击变快右上角的“”按钮,即可手动刷新最新数据。

告警事件总览

告警事件总览展现了各级别的告警事件确认状态(1小时内)、告警级别分布、告警设备分布(分布在哪些类的设备上)、最近30天内告警事件发生趋势,及当前告警滚动播报5个方面进行统计与分析。

设备告警总览中除了历史告警趋势外,其他是1分钟自动刷新一次。

在当前告警板块,当有新告警产生的时候新告警会闪烁、并发出告警提示音。

每条告警信息包括时间、主机、问题严重性、持续时长、确认等字段,问题严重性包括了告警描述和告警级别两个信息,文字颜色代表告警级别,告警级别说明参考附录告警事件级别,点击主机(IP地址)可以下钻设备详情页,可以查看设备更多的监控数据,包括设备基本信息、关键指标、性能详情、性能对比、告警事件、更多指标等;若对应设备没有纳管(如只是Ping监控、web检测、端口探测等),则跳转到实时告警。

双击页面之后页面切换到全屏模式,满足日常大屏展示需求。

根据用户配置设备权限展示相关设备的告警事件的分布情况。

作者:admin  创建时间:2024-12-12 14:26
最后编辑:admin  更新时间:2025-01-03 10:01