Kubernetes监控

集群列表

在云原生中,通过Kubernetes集群列表,可查看当前监控的所有Kubernetes集群概要信息,包括版本、Node数量、Pod数量、CPU利用率和内存利用率,以此简单判断集群当前的状态是否负载过高。

image-20200416092703542

集群概览

集群概览页面用于查看该集群的主要信息,包括概要信息、集群使用率、集群性能、Top 5 Pod/Node展示、Node信息列表。

image-20200416093834334

概要信息

在集群概览页面,单击集群名称后的属性信息,可以看到该Kubernetes集群的各类资源统计信息,包括以下内容:

  • 正常/总 的Pods数量

  • 正常/总 的Node数量

  • 正常/总 的Namespaces数量

  • 正常/总 的Deployment数量

  • 正常/总 的Daemonsets数量

  • 正常/总 的StatefulSets数量

  • 正常/总 的Jobs数量

  • 总 的CronJobs数量

  • 总 的Endpoint数量

  • 总 的Service数量

  • 总 的ConfigMaps数量

  • 绑定/总 的PVC数量

  • 总的Secrets 数量

image-20200416093834334

Events

Events列表部分展示最近30分钟Kubernetes集群发生的事件。

集群使用率

集群利用率图表可以观测到当前集群总的CPU、内存资源,以及申请的Requsts资源和还可以申请的Request资源。同时下方展示了当前集群内Node节点数量和运行Ready的Node节点数。

image-20200416093955720

集群性能

集群性能图表可查看当前k8s集群的CPU利用率和内存利用率的历史趋势,判断是否需要扩容。同时可以查看集群内容器的requests、limits、avaliable的资源使用情况。

image-20200416095930798

TOP5

TOP5 展示了消耗最多CPU资源和内存资源的5个Pod和5个Node,通过该图表可以推测出Node资源分配是否合理,是否需要迁移,Pod消耗的资源是否过大,是否需要优化等信息。

image-20200416100710274

Node列表

Node列表可看到当前k8s集群所有Node的信息,包括Node运行状态,是否有CPU利用率过高,磁盘分布不足等异常、CPU和内存的使用情况等信息,点击某个Node节点可跳转到对应Node节点的主机监控,查看主机相关指标是否有异常。

image-20200416100851828

Namespace页面

Namespace页面中,可以查看所有Namespace的相关统计指标。用户可根据Namespace查询,从而帮助用户定位具体Namespace的问题。

namespace

Namespace指标图表

上方的四个图表分别展示Namespace的CPU、内存、网络吞吐、磁盘吞吐的变化趋势图。如果上方有筛选条件,则展示筛选后的结果。

单击每个图右下角的图标,可将图表添加到大屏组件或者智能报告图表库中。

namespace1

Namespace列表

Namespace列表会展示筛选后的Namespace 详细信息,列表字段展示Namespace、Workloads、CPU requests、CPU limit、CPU request、CPU limit等信息。

namespace2

Namespace详情

在Namespace列表中,单击一个Namespace条目,上方可看到该Namespace在统计时间段内的性能时序图。单击要查看的Namespace前的add图标,下侧会展开显示所属Namespace的Kubernetes WorkLoads信息,Kubernetes WorkLoads信息包含名称、类型、pods、部署环境等信息。

单击Workload名称,可跳转至Workloads页签中,帮助用户判断是哪个Workload出现了问题。

namespace3

Workloads页面

Workloads页面用于查看Workload相关指标,帮助用户定位具体Workload的问题。用户可根据名称、Namespace、部署环境、类型(StatefulSet、Deployment、DaemonSet三类)等维度组合查询。

workload

Workload指标图表

上方的四个图表分别展示Workload的CPU、内存、网络吞吐、磁盘吞吐的变化趋势图。如果上方有筛选条件,则展示筛选后的结果。

单击每个图右下角的图标,可将图表添加到大屏组件或者智能报告图表库中。

Workload列表

Workload列表会展示筛选出来的Workload详细信息,列表字段包括名称、类型、Pods、Namespace、部署环境等信息。

说明:Workload列表只展示StatefulSet、Deployment、DaemonSet三类的性能数据。

workload1

Workload详情

在Workload列表中,单击一个Workload条目,上方可看到该Workload在统计时间段内的性能时序图。单击要查看的Workload前的add图标,下侧会展开显示所属Workload的Pod信息和APM应用信息。

单击Pod名称,可跳转至Pods页签中;单击APM应用的应用名称,可跳转到APM应用。将Workload和Pod、APM应用关联在一起,可以更方便的帮助用户定位问题的根因是Pod还是APM应用。

workload2

Pods页面

Pods页面用于查看具体的Pods相关指标,帮助用户定位具体Pods的问题。用户可根据Namespace、Pod名称、Node名称、Node IP等维度组合查询。

image-20200416101403964

Pod列表

Pod列表会展示出筛选出来的Pod 详细信息,包括运行状态,所属Namespace、CPU使用、内存使用、网络吞吐、磁盘吞吐、重启次数等信息。

image-20200416101636473

Pod详情

在Pod列表中,单击一个Pod条目,上方可看到该Pod在统计时间段内的性能时序图。单击要查看的Pod前的add图标,下侧会展开显示Pod的详细信息,包括该Pod的标签信息、Pod包含的容器信息、进程信息、APM应用信息和Event信息。

基调听云Infra实现了Pod到容器的跳转、Pod到进程的跳转、Pod到APM应用和实例的跳转、容器到进程的跳转,将Pod、容器、进程和APM应用关联在一起,可以更方便的帮助用户定位问题的根因是进程、容器、还是Pod。

image-20200416102224516

results matching ""

    No results matching ""