Kubernetes监控
集群列表
在云原生中,通过Kubernetes集群列表,可查看当前监控的所有Kubernetes集群概要信息,包括版本、Node数量、Pod数量、CPU利用率和内存利用率,以此简单判断集群当前的状态是否负载过高。
集群概览
集群概览页面用于查看该集群的主要信息,包括概要信息、集群使用率、集群性能、Top 5 Pod/Node展示、Node信息列表。
概要信息
在集群概览页面,单击集群名称后的属性信息,可以看到该Kubernetes集群的各类资源统计信息,包括以下内容:
正常/总 的Pods数量
正常/总 的Node数量
正常/总 的Namespaces数量
正常/总 的Deployment数量
正常/总 的Daemonsets数量
正常/总 的StatefulSets数量
正常/总 的Jobs数量
总 的CronJobs数量
总 的Endpoint数量
总 的Service数量
总 的ConfigMaps数量
绑定/总 的PVC数量
总的Secrets 数量
Events
Events列表部分展示最近30分钟Kubernetes集群发生的事件。
集群使用率
集群利用率图表可以观测到当前集群总的CPU、内存资源,以及申请的Requsts资源和还可以申请的Request资源。同时下方展示了当前集群内Node节点数量和运行Ready的Node节点数。
集群性能
集群性能图表可查看当前k8s集群的CPU利用率和内存利用率的历史趋势,判断是否需要扩容。同时可以查看集群内容器的requests、limits、avaliable的资源使用情况。
TOP5
TOP5 展示了消耗最多CPU资源和内存资源的5个Pod和5个Node,通过该图表可以推测出Node资源分配是否合理,是否需要迁移,Pod消耗的资源是否过大,是否需要优化等信息。
Node列表
Node列表可看到当前k8s集群所有Node的信息,包括Node运行状态,是否有CPU利用率过高,磁盘分布不足等异常、CPU和内存的使用情况等信息,点击某个Node节点可跳转到对应Node节点的主机监控,查看主机相关指标是否有异常。
Namespace页面
Namespace页面中,可以查看所有Namespace的相关统计指标。用户可根据Namespace查询,从而帮助用户定位具体Namespace的问题。
Namespace指标图表
上方的四个图表分别展示Namespace的CPU、内存、网络吞吐、磁盘吞吐的变化趋势图。如果上方有筛选条件,则展示筛选后的结果。
单击每个图右下角的图标,可将图表添加到大屏组件或者智能报告图表库中。
Namespace列表
Namespace列表会展示筛选后的Namespace 详细信息,列表字段展示Namespace、Workloads、CPU requests、CPU limit、CPU request、CPU limit等信息。
Namespace详情
在Namespace列表中,单击一个Namespace条目,上方可看到该Namespace在统计时间段内的性能时序图。单击要查看的Namespace前的图标,下侧会展开显示所属Namespace的Kubernetes WorkLoads信息,Kubernetes WorkLoads信息包含名称、类型、pods、部署环境等信息。
单击Workload名称,可跳转至Workloads页签中,帮助用户判断是哪个Workload出现了问题。
Workloads页面
Workloads页面用于查看Workload相关指标,帮助用户定位具体Workload的问题。用户可根据名称、Namespace、部署环境、类型(StatefulSet、Deployment、DaemonSet三类)等维度组合查询。
Workload指标图表
上方的四个图表分别展示Workload的CPU、内存、网络吞吐、磁盘吞吐的变化趋势图。如果上方有筛选条件,则展示筛选后的结果。
单击每个图右下角的图标,可将图表添加到大屏组件或者智能报告图表库中。
Workload列表
Workload列表会展示筛选出来的Workload详细信息,列表字段包括名称、类型、Pods、Namespace、部署环境等信息。
说明:Workload列表只展示StatefulSet、Deployment、DaemonSet三类的性能数据。
Workload详情
在Workload列表中,单击一个Workload条目,上方可看到该Workload在统计时间段内的性能时序图。单击要查看的Workload前的图标,下侧会展开显示所属Workload的Pod信息和APM应用信息。
单击Pod名称,可跳转至Pods页签中;单击APM应用的应用名称,可跳转到APM应用。将Workload和Pod、APM应用关联在一起,可以更方便的帮助用户定位问题的根因是Pod还是APM应用。
Pods页面
Pods页面用于查看具体的Pods相关指标,帮助用户定位具体Pods的问题。用户可根据Namespace、Pod名称、Node名称、Node IP等维度组合查询。
Pod列表
Pod列表会展示出筛选出来的Pod 详细信息,包括运行状态,所属Namespace、CPU使用、内存使用、网络吞吐、磁盘吞吐、重启次数等信息。
Pod详情
在Pod列表中,单击一个Pod条目,上方可看到该Pod在统计时间段内的性能时序图。单击要查看的Pod前的图标,下侧会展开显示Pod的详细信息,包括该Pod的标签信息、Pod包含的容器信息、进程信息、APM应用信息和Event信息。
基调听云Infra实现了Pod到容器的跳转、Pod到进程的跳转、Pod到APM应用和实例的跳转、容器到进程的跳转,将Pod、容器、进程和APM应用关联在一起,可以更方便的帮助用户定位问题的根因是进程、容器、还是Pod。