告警规则

系统根据告警规则在一定时间周期内监控特定的指标,当指标数据的状态变化与历史数据相比,或与设定的阈值相比发生变化时即刻产生告警事件。因此,告警功能主要是围绕监控指标和维度做统计学和概率学计算,用户可在告警规则中设置多种告警触发条件。告警触发条件是指标、比较关系、阈值、统计周期和评估周期组成的一个有语义的条件。告警规则可分为基础告警规则和VVIP告警规则。

用户在初次登录系统并单击左侧告警规则菜单时,系统会展示告警配置向导页,以指导客户如何配置完整的告警。配置向导页面左侧通过文字方式介绍告警从配置规则到触发通知的步骤,用户还可以通过点击蓝色字体跳转对应页面进行配置;配置向导页右侧以流程图的形式向用户展示了告警从触发到通知的整个流程。

guide

在用户非初次登录的情况下,系统则会直接展示告警规则列表。告警规则列表展示用户配置的告警规则信息,例如告警规则名称、监控指标、适用于产品线、监控类型、VIP、VIP接收人、是否启用、生效时段、变更事件等。您可以进行以下操作:

  • 勾选多个告警规则,然后点击列表右上角的批量操作按钮,对规则进行批量禁用、批量启用、批量删除操作。

  • 用户可以按照规则名称规则启停监控类型适用于指标数据源所属于VIP指标名称进行告警规则的筛选。

  • 操作列中,用户可以对告警规则进行修改、删除、复制操作。点击操作列的影响对象后,可查看该告警规则目前影响到的具体告警对象实例。默认展示的是近3天的还在触发中的告警对象实例。

新建基础告警规则

基础告警是聚合每分钟数据进行告警,指定时间内,同指标同状态的不再触发告警。新建基础告警规则,请按照以下步骤进行操作:

  1. 在左侧导航栏中选择告警>配置>告警规则,进入告警配置向导页面。

  2. 单击告警规则,进入告警规则列表页面。

    guide1

  3. 在页面右上角点击新建规则,选择基础告警

  4. 配置基础告警规则。

    基本信息

    • 规则名称:告警规则名称,文本格式。
    • 适用于:该告警规则适用于哪个产品线。在第一个下拉菜单选择产品,第二个选择如果有值,就按照值内容选择即可。
    • 告警启停:规则生效开关。
    • 评估周期:您可以选择过去1~60分钟内的任意值。代表使用过去多长一段时间内的数据与阈值比较。
    • 等待时长:等待n分钟无数据,系统将解除警告事件。例如,设置等待时长为10分钟,10:00触发告警事件,10:10开始无数据,那么在10:19的时候,触发该事件的警报状态变更为无数据解除。
    • 生效时段:告警规则生效期。不在这个期限范围产生的告警,系统会丢弃这些告警事件。特例情况:如果接收到的是“解除告警”,则系统会接收。

    监控对象

    • 对象类型:指的是某个产品线下的具体监控对象类型,如APM产品的业务系统、应用、事务等等。

    • 告警分组(可选):按照哪些维度分组统计告警事件。特例情况:如果此时选择VIP用户,则还需要选择具体的VIP用户组。

    • 对象筛选(可选):可以根据该监控对象的“属性”对其进行筛选过滤。可以是多个过滤条件,条件之间的关系为“所有”和“任何一个”。前者为“and”关系,后者为“or”关系。

    触发机制

    • 检测方法:用什么方式对指标数据提供监控检测。目前有三种检测方法,分别为:阈值检测、异常检测和事件检测。其中事件检测只针对“基调听云APM的应用实例”有效。

      • 阈值检测:是传统的固定阈值、基线阈值的检测方法。
      • 异常检测:是通过AI算法提供的检测方式。
      • 事件检测:只针对“无心跳指标”的检测。
    • 前置条件(可选):当符合某一个条件时,才会继续按照“触发条件”进行判断。系统用“每分钟样本量”的统计作为前置条件。

    • 触发条件:真正的判定是否告警的条件。由1-n个“指标+数据统计方式+逻辑表达式”组成,同一指标可重复配置。当比较基准需要设置为动态基线时,可选择合适的动态基线配置。如需创建新的动态基线,请参见动态基线

      用户可以设置多个过滤条件,条件之间的关系为“所有”和“任何一个”。前者为“and”关系,后者为“or”关系。

      适用于选择了指标-第三方时,可配置第三方指标的警报触发条件。

      third-party

      1. 指标框中输入指标名称,系统按照指标名称模糊搜索出匹配条件的指标。

      2. 维度框设置所选指标的分析维度,按照哪些维度分组统计告警事件。例如按主机名host统计。最多可选择5个维度。

      3. 过滤处设置要剔除的数据,系统可以根据该指标的“维度”对其进行筛选过滤。单击img图标,可定义过滤条件。下拉菜单中的or或 and是多个条件之间的关系。

      说明:“在评估周期x分钟内超过x次则触发告警”。如果勾选此项,则是按照“每一分钟的统计数据”与阈值比较。不勾选此项,意味着是用过去评估周期一段时间内的平均值、最大值、最小值或分位值与阈值比较。

    • 告警灵敏度设置(异常检测):用户可以对指标告警的灵敏度进行拖动设置,灵敏度分为低、中、高三个层级。

      • 低:该指标触发告警时,警报的灵敏度较低,触发频率较低。
      • 中:该指标触发告警时,警报的灵敏度正常,触发频率正常。
      • 高:该指标触发告警时,警报的灵敏度较高,触发频率较高。
  5. 点击保存,完成告警规则的创建。

告警规则设置完成后,当触发告警时,仅会在警报页面中展示告警信息,在事件页面中展示事件详细信息。如果需要将事件的告警通知给相关人员,需要先配置推送目标和推送模板,然后配置响应策略。具体的配置介绍,请参见响应配置

新建VVIP告警规则

VVIP告警是每超过一次阈值告警一次。新建VVIP告警规则,请按照以下步骤进行操作:

  1. 在左侧导航栏中选择告警>配置>告警规则,进入告警配置向导页面。

  2. 单击告警规则,进入告警规则列表页面。

    guide1

  3. 在页面右上角点击新建规则,选择VVIP告警

  4. 配置VVIP告警规则。

    基本信息

    • 规则名称:告警规则名称,文本格式。
    • 适用于:该告警规则适用于哪个产品线,目前仅支持APM。在第一个下拉菜单选择产品,第二个选择如果有值,就按照值内容选择即可。
    • 告警启停:规则生效开关。
    • 生效时段:告警规则生效期。不在这个期限范围产生的告警,系统会丢弃这些告警事件。特例情况:如果接收到的是“解除告警”,则系统会接收。

    监控对象

    • 对象类型:指的是某个产品线下的具体监控对象类型,目前仅支持APM产品的事务。
    • 对象筛选(可选):可以根据该监控对象的“属性”对其进行筛选过滤。可以是多个过滤条件,条件之间的关系为“所有”和“任何一个”。前者为“and”关系,后者为“or”关系。

    触发机制

    • 检测方法:用什么方式对指标数据提供监控检测。仅支持阈值检测。

    • 触发条件:真正的判定是否告警的条件,目前仅支持HTTP状态码和响应时间两个指标。由1-n个“指标+数据统计方式+逻辑表达式”组成,同一指标可重复配置。当比较基准需要设置为动态基线时,可选择合适的动态基线配置。如需创建新的动态基线,请参见动态基线

      用户可以设置多个过滤条件,条件之间的关系为“所有”和“任何一个”。前者为“and”关系,后者为“or”关系。

  5. 点击保存,完成告警规则的创建。

告警规则设置完成后,当触发告警时,仅会在警报页面中展示告警信息,在事件页面中展示事件详细信息。如果需要将事件的告警通知给相关人员,需要先配置推送目标和推送模板,然后配置响应策略。具体的配置介绍,请参见响应配置

© 2007-2023 北京基调网络股份有限公司 all right reserved,powered by Gitbook本文档更新于: 2022-05-06 11:41

results matching ""

    No results matching ""