运行总览
用户登录后,首先进入“运行总览”页,通过图表的形式对纳管设备的整体运行状况、告警事件发生情况、通知确认情况等,进行展示。
运行总览目前包括“设备运行总览”和“告警事件总览”。
设备运行总览
设备运行总览,是对被监控对象不同维度的统计,通过8个板块反映核心设备的纳管及新增、告警发生、告警转工单状况。8个板块分别是:“纳管设备状态分布、运行监控系统新增纳管、告警级别分布(1h)、历史告警(30天)、TOP5板块、告警设备分布板块、告警分类等级分布板块、告警处理状态分布板块。
默认加载“纳管设备状态分布、运行监控系统新增纳管、告警级别分布(1h)、历史告警(30天)”四个板块,可以根据实际工作需要配置展示“告警设备TOP5、告警设备分布、告警分类等级分布、告警处理状态分布”等板块。
纳管设备状态分布板块
通过柱状图展示了纳管设备的运行状态分布
设备运行状态有“正常、异常”两种,状态定义见下表说明:
状态 | 状态颜色 | 状态值 | 说明 |
---|---|---|---|
设备正常 | 绿色正常 | 1 | 无告警事件,或有未知级别、通知级别、警告级别的告警事件发生,运行时长不为空且大于0 |
严重告警 | 红色异常 | 3 | 有灾难级别或严重级别告警事件发生,运行时长不为空且大于0 |
一般告警 | 橙色异常 | 2 | 有问题级别告警事件发生,运行时长不为空且大于0 |
暂无状态 | 灰色异常 | 0 | 运行时长为空(意味着该设备目前不可被监控,通常是设备已下线,监控项还未删除,或者Agent故障,网络中断与被监控主机失联等原因) |
统一事件平台的告警级别分为6种,灾难、严重、问题、警告、通知、未知。因为统一事件平台会接入多种监控工具的告警,并且级别关系可由用户灵活自定义,所以命名规则并不完全与Zabbix定义的级别相一致。
图:集中事件平台的告警级别
注:1、Zabbix的告警级别:紧急、严重、次要、警告、信息、未知
图:Zabbix的告警级别
2、设置了屏蔽策略被屏蔽的告警事件,不在此处被统计。
3、有设备运行时长指标的设备:通常为主机、存储、网络、安全等设备,运行时长取值取24小时内最新值,
4、无设备运行时长指标的设备:通常为无线AP、门禁、等非网管设备、一般通过“探测”方式(如Web、Ping、进程、端口等)进行检测
运行监控系统新增纳管板块
通过柱状图展示了本系统新增纳管设备状况,时间维度上有月与周新增状况,设备分类来自于“数仓配置-设备类别管理”中添加的设备类别。例如服务器硬件、操作系统等的新增状况。
告警级别分布(1h)板块
通过饼图展示了1小时内告警等级的分布情况
历史告警板块
通过折线图展示了30天内每天告警等级的分布状况。
告警设备TOP5板块
通过柱状图展示前日告警设备TOP5
告警设备分布(1h)板块
展示1小时内告警分类的分布情况,数值代表告警数量。
告警分类等级分布板块
通过桑基图展示了告警设备、告警事件等级分布状况,桑胜图左侧为告警分类,右侧为告警等级。
告警处理状态分布(1h)板块:
通过饼图展示告警事件三个处理状态(未确认、处理中、已完成)中不同告警等级的告警事件分布状况。
注:各板块数据权限规则:
板块名称 | 数据范围 |
---|---|
纳管设备状态分布 | 纳管设备,与权限无关 |
运行监控系统新增纳管 | 纳管设备,与权限无关 |
告警级别分布 | 根据配置设备权限展示相关设备告警的分布情况 |
历史告警 | 根据配置设备权限展示相关设备告警的分布情况 |
告警设备TOP5 | 根据配置设备权限且转发到第三方通知平台的告警分布情况 |
告警设备分布 | 根据配置设备权限展示相关设备告警的分布情况 |
告警分类等级分布 | 根据配置设备权限展示相关设备告警的分布情况 |
告警处理状态分布 | 根据配置设备权限展示相关设备告警的分布情况 |
操作描述
页面标题修改
可以双击页面任意空白处,全屏当前页面。全屏状态下会展示页面标题。默认标题为“核心设备运行总览”,可以点击标题右侧的“”按钮对页面标题文字进行修改。
编辑完成后,点击标题右侧“”按钮,保存为新的页面标题。
每个用户可以独立设置该页面名称,而不互相影响。
板块添加、删除
当前页面默认展示“纳管设备状态分布、运行监控系统新增纳管、告警级别分布(1h)、历史告警(30天)”四个板块,可以通过点击右上角“”按钮,弹出配置弹窗。
通过操作“”按钮控制板块的显示与隐藏,“”表示展示,“”表示隐藏。通过调整排序数值大小调整板块在页面上的展示顺序,顺序越小排序越前。
完成配置后点击“”按钮,配置生效。点击“”按钮,配置不生效。
数据刷新
每个板块的数据每分钟刷新一次。如果需要手动刷新页面数据,可以点击变快右上角的“”按钮,即可手动刷新最新数据。
告警事件总览
告警事件总览展现了各级别的告警事件确认状态(1小时内)、告警级别分布、告警设备分布(分布在哪些类的设备上)、最近30天内告警事件发生趋势,及当前告警滚动播报5个方面进行统计与分析。
设备告警总览中除了历史告警趋势外,其他是1分钟自动刷新一次。
在当前告警板块,当有新告警产生的时候新告警会闪烁、并发出告警提示音。
每条告警信息包括时间、主机、问题严重性、持续时长、确认等字段,问题严重性包括了告警描述和告警级别两个信息,文字颜色代表告警级别,告警级别说明参考附录告警事件级别,点击主机(IP地址)可以下钻设备详情页,可以查看设备更多的监控数据,包括设备基本信息、关键指标、性能详情、性能对比、告警事件、更多指标等;若对应设备没有纳管(如只是Ping监控、web检测、端口探测等),则跳转到实时告警。
双击页面之后页面切换到全屏模式,满足日常大屏展示需求。
根据用户配置设备权限展示相关设备的告警事件的分布情况。
最后编辑:admin 更新时间:2025-01-03 10:01