概览
概览页面中对故障和警报数据做统计分析,并可视化展示,展示事件收敛情况、故障处理状态情况、警报发生频率统计情况、故障MTTx情况和事件接收数据源统计情况。
概览中的各部分会根据右上角时间控件所选择的时间段进行数据的统计与展示。
事件收敛
展示接收到的事件数、事件收敛成的故障数和压缩率。
故障处理
按照故障处理状态,展示打开、处理中、已分配三种状态的故障数量,点击数字可以下钻查看详情。
TOP 10 告警事件
按照告警对象(标签:target)对事件的发生次数进行统计,展示次数前10的告警事件。通过列表您可以了解哪些告警对象频繁发生告警事件,进而可以查排查否是由于告警阈值设置不恰当导致频繁波动报警。如果确实是告警阈值设置不恰当,可以考虑优化告警方式,使异常检测更为准确。
重要故障
重要性是指故障的重要程度。重要性分为5个等级,分别用1星、2星、3星、4星和5星表示。重要程度依次递增,最高重要度为五星。重要性针对的是警报alert和故障incident,不作用于事件event。
重要故障列表按照重要程度展示故障,仅展示4星和5星级别的故障。点击故障可查看故障详情。
MTTx
以曲线图的形式展示MTTA和MTTR的变化趋势。
说明:统计数据的来源为点击过“立即处理”的故障。
事件接收
展示统计时间段内不同数据来源接收到的事件数量的变化趋势。