工作原理
基调听云告警系统基于时间序列预测的异常检测及智能告警算法。
基于数据模型的统计学方法是 APM 应用领域中使用最广泛的异常检测技术,它的基本原则是:针对训练数据集(通常是正常样例)进行统计学的建模,如果某个数据样例不符合训练所得的随机模型,则被判别为异常样例。数据样例不符合随机模型是指样例不太可能由该模型所生成,一般通过统计检验的方式来确定,基于以下假定:正常的数据样例发生在统计学随机模型的高概率区域,而异常的数据样例发生在模型的低概率区域。也就是说,我们基于检验统计量可得到未知数据样例由已知模型生成的概率,如果概率高于某个预定的标准,则认为该样例是异常。
通过基于时间序列预测的异常检测算法,我们可以让告警系统自动地、比较准确地完成故障检测及告警的工作,从而大大地较少繁重的手工设定各个性能指标告警阈值及人工管理的任务,达到故障检测自动化和智能化的目的。