Kafka性能指标
集群指标
| 指标别名 | 指标含义解释 | 单位 |
|---|---|---|
| 版本 | ||
| Partitions总数 | 集群中所有节点Partition数之和 | 个 |
| 未复制分区总数 | 集群中所有节点未复制分区数之和 | 个 |
| 离线分区总数 | 集群中所有节点离线分区数之和 | 个 |
| Controller存活数 | 集群中Controller存活的数量 | 个 |
| 失败请求(生产者) | 集群中所有节点生产者失败请求的速率之和 | 次/s |
| 失败请求(消费者) | 集群中所有节点消费者失败请求的速率 | 次/s |
| 生产者流量 | 集群中所有节点生产者流量之和 | Bytes/s |
| 消费者流量 | 集群中所有节点消费者流量之和 | Bytes/s |
| 生产者QPS | 集群中所有节点生产者QPS之和 | 次/s |
| 消费者QPS | 集群中所有节点消费者QPS之和 | 次/s |
| 存活节点数 | 集群中存活的节点数量 | 个 |
| 每秒流入消息数 | 集群中所有节点流入消息数之和 | 个/s |
| 最大CPU利用率 | 集群中所有节点CPU利用率最大值 | |
| 最大内存利用率 | 集群中所有节点内存利用率最大值 | |
| 最大Heap区利用率 | 集群中所有节点堆内存利用率最大值 | |
| 最大Non-Heap区利用率 | 集群中所有节点非堆内存利用率最大值 | |
| 最大Minor GC次数 | 集群中所有节点每分钟Minor GC次数最大值 | |
| 最大Major GC次数 | 集群中所有节点每分钟Major GC次数最大值 | |
| 最大Minor GC时间 | 集群中所有节点每分钟Minor GC时间 | |
| 最大Major GC时间 | 集群中所有节点每分钟Major GC时间 |
Broker指标
| 指标别名 | 指标含义解释 | 单位 | 是否告警指标 | 默认告警策略 |
|---|---|---|---|---|
| CPU利用率 | % | |||
| 内存利用率 | % | |||
| 内存使用量 | Bytes | |||
| 磁盘吞吐(Read) | Bytes/s | |||
| 磁盘吞吐(Write) | Bytes/s | |||
| 生产者流量 | Bytes | |||
| 消费者流量 | Bytes | |||
| 生产者QPS | ||||
| 消费者QPS | ||||
| 是否是Controller | 0:不是,1:是 | |||
| Follower落后Leader最大消息量 | 个 | |||
| Partition总数 | 该节点分区总数 | 个 | ||
| Leader分区总数 | 个 | |||
| 未复制分区总数 | 个 | |||
| ISR扩大速率 | 个/s | |||
| ISR收缩速率 | 个/s | |||
| 离线分区总数 | 个 | |||
| Broker拒绝的消息 | Byte/s | |||
| 生产者失败请求 | 次/s | |||
| 消费者失败请求 | 次/s | |||
| 生产者请求响应时间分位值 | request="Produce" | ms | ||
| 消费者请求响应时间分位值 | request="FetchConsumer" | ms | ||
| fetch请求速率 | ||||
| 失败的fetch请求数 | ||||
| zookeeper 连接断开速率 | 客户端已断开与服务器的连接,并尝试重新连接。会话不一定过期。 | |||
| zookeeper 会话过期速率 | ||||
| broker请求zk响应时间分位值 |
Topic指标
| 指标别名 | 指标含义解释 | 单位 | 是否告警指标 | 默认告警策略 |
|---|---|---|---|---|
| 生产者流量 | ||||
| 消费者流量 | ||||
| 生产者QPS | ||||
| 消费者QPS | ||||
| Topic大小 |
ConsumperGroup指标
| 指标别名 | 指标含义解释 | 单位 | 是否告警指标 | 默认告警策略 |
|---|---|---|---|---|
| 生产者QPS | ||||
| 消费者QPS | ||||
| Current-Offset | ||||
| Log-End-Offset | ||||
| Lag | ||||
| 消费组状态 |