数据预处理

智能故障管理和指标管理产品需要采集第三方数据,对这些数据采取大数据分析、数据挖掘、AI等技术,来实现数字化运营。因此,对于从不同的数据源中获取到的数据格式和内容都存在较大差异。通过数据预处理功能,把不同数据格式和内容转化为系统能识别的数据格式,即标准化标签。除此之外,该功能还可以过滤原始事件。数据预处理提供对数据格式和内容的转化,目前支持“直接映射”、“字段提取”、“字段符合”、“脚本提取”、“扩展表映射”。

在左侧导航栏中选择管理>集成>数据预处理,进入数据预处理页面。

告警事件

对于告警事件的预处理,需要配置数据过滤、数据标准化与丰富。

配置数据过滤

  • 规则名称:事件预处理规则的名字。
  • 数据源类型:不同的数据源类型对应的事件预处理规则不同。
  • 数据过滤选项卡,支持三种过滤方式。
    • 通过key过滤:下拉框为“包含”和“不包含”,后一个为文本框,输入包含的key,可以输入多个key,按回车键即可。
    • 通过Key-value过滤:输入key,然后在value中,选择不同的条件表达式,匹配不同的value值内容。
    • 通过脚本过滤:支持FreeMarker语法。

image-20200813160503865

数据标准化与丰富

经过数据标准化与丰富处理后,将您上传的数据以系统可识别的数据元素建立起对应关系,这样有助于数据标准化过程并使预期的数据更清晰和易于理解。

数据映射

  • 标签列:带“*”星号的标签,为必填选项。

  • 用于算法:说明该标签是否用于“告警收敛”的特征。

  • 映射规则,支持4种映射配置,分别是:直接映射、字段提取、字段复合和groovy脚本映射。

    • 直接映射:接入到的数据字段与标准化的字段含义一致,则直接匹配。
    • 字段提取:从接入到的数据字段对应的值中,通过“正则表达式”提起出想要的字段进行一一对应。
    • 字段符合:接入的多个数据字段以组合的方式,与标准化标签一一对应。
    • groovy脚本映射:通过支持复杂的匹配逻辑,可以通过编写Java代码实现。
  • 操作列:丰富功能,目前用于通过扩展表的方式,来丰富事件标签。如下图:image-20200721224305798

    • 扩展表:选择用于扩展的表名。

    • 查询标签:从前一个页面带过来的“标签”,不可编辑。

    • 关联字段:即通过“查询标签”,关联某一个字段,通过该字段,在扩展表中进行关联结果查询。

    • 结果标签:默认会把扩展表中的“结果字段”都显示出来,鼠标悬浮到某一个标签,可以对其进行删除操作。也可以点击“+”添加按钮,添加结果标签。

    • 点击确定,则会将该结果标签展示在数据映射列表中。如下图:

      image-20200721225420130

用户可以对这些返回的结果标签重新命名、添加描述信息、设置该标签是否用于算法。

扩展映射

  • 点击新增按钮,添加扩展标签。添加时,会出现下拉框,内容为系统已经预定义好的标签。用户可以直接使用。如果需要自定义标签,在文本框中直接输入值即可。

  • 其余内容,和数据映射一致。

image-20200721225654250

变更事件

对于变更事件的预处理,需要配置数据隐藏、数据标准化与丰富。

数据隐藏

用户原始的变更事件数据中如果有敏感信息,可以进行隐藏处理。如果是多个需要隐藏的数据项,请用英文逗号分隔。

hide

数据标准化与丰富

经过数据标准化与丰富处理后,将您上传的数据以系统可识别的数据元素建立起对应关系,这样有助于数据标准化过程并使预期的数据更清晰和易于理解。

  • changeId一般指变更工单号。

  • 在数据映射中,只有target和affectedConfig才可以进行丰富,单击操作列的丰富,可通过扩展表的方式来丰富事件标签。

  • 单击操作列的清除,可清除startTime、endTime和affectedConfig标签。

  • 单击数据映射右上角的排序按钮,可按住鼠标对标签进行移动,单击确定可保存排序结果。

  • 单击扩展映射右上角的新增按钮,添加扩展标签。添加时,会出现下拉框,内容为系统已经预定义好的标签,用户可以直接使用。如果需要自定义标签,在文本框中直接输入值即可。

hide

© 2007-2023 北京基调网络股份有限公司 all right reserved,powered by Gitbook本文档更新于: 2023-11-21 14:34

results matching ""

    No results matching ""