Collector在线部署
在部署各语言探针前,请先部署好Collector。
Agent Collector 3.6.2.0及以上版本支持在线部署。
Agent Collector(以下简称Collector)是由APM Collector、Infra Collector和12个组件探针构成的。
12个组件探针分别是Apache HTTP Server、Nginx、MySQL、Oracle、Redis、SNMP、PostgreSQL、MongoDB、Elasticsearch、RabbitMQ、Kafka、Network组件探针,负责采集对应组件的性能数据。其中,Network组件探针负责采集HTTP、TCP、ICMP协议数据。Infra Collector负责收集和汇总UniAgent采集的主机性能数据、组件性能数据和协议数据。
一套基调听云悟空平台系统可以部署多个Agent Collector。在同一环境部署多个Collector时,必须保证多个Collector版本相同,升级Collector时要尽快升级全部的Collector以保证功能一致。
准备主机资源
部署Collector的主机推荐配置如下:
- 操作系统:Linux x86/64 并需要systemd服务,Linux发行版建议: CentOS 7及以上、 Redhat 7及以上、Ubuntu 18及以上
- CPU:4 Core及以上
- 物理内存:8GB及以上
单个Collector每秒可以处理的trace数量和trace内span的数量有关系,单个trace内span数量越多,需要的计算资源就越多。部署在4 Core、8GB机器上的Collector通常可以承受4000TPS的trace数据。
CPU使用情况还和Collector相关的应用实例数量有关系,应用实例数量越多,需要的计算资源就越多。
在实践中,我们推荐按照以下公式计算需要部署的Collector数量:
Collector数量 = Max(应用实例总数/100, 一天内TPS的峰值/4000) + 1
环境信息确认
⚠️ 确认平台服务器和Collector所部署的服务器网络是否通畅
⚠️ 确认Collector部署的服务器CPU是ARM64还是x86_64架构
⚠️ 在Collector服务器端的操作都需要使用root权限
⚠️ 私有化部署时,上传Collector包之前先确认Collector包的类型是否和预期的CPU架构一致
开通网络策略(演示)
⚠️ 下面是演示的IP地址,请根据实际项目内的地址信息开通网络策略
源地址 | 目标地址 | 开通端口 | 说明 |
---|---|---|---|
192.168.5.2 | 192.168.5.3 | 19109 | Infra Collector主动拉取主机探针数据,主机探针监听19109端口 |
192.168.5.2 | 192.168.5.1 | 10100,10400,11000,8080 | Collector上传数据到平台 |
192.168.5.3 | 192.168.5.2 | 7665,7666 | 后端服务器探针推送数据到Collector, APM Collector使用7665端口, Infra Collector使用7666端口 |
192.168.5.3 | 192.168.5.1 | 8080 | 后端服务器探针在线升级 |
用户 | 192.168.5.1 | 8080 | 平台报表访问 |
部署步骤
登录基调听云悟空平台,在左侧导航栏中依次选择 管理 -> 部署状态 -> Collectors管理。
在 Collectors管理 页签的右上角单击 新增,并配置Collector参数。
选择操作系统CPU类型:默认选择Linux x86_64系统,目前只支持Linux x86_64, 如需ARM64包请联系后台技术人员。
选择Collector版本:私有化部署时,Collector安装包需要通过超级管理员admin登录系统,提前进行上传,才能在此处显示版本号。
安装路径:路径须以/开头,路径仅允许包含字母、数字、下划线、中划线。默认安装路径是opt目录,没有特殊要求,建议不要对其进行修改。
⚠️ 部署环境:用来标识Collector所在的数据中心、VPC、机房,相同部署环境的多个Collector之间会做负载均衡以及 Failover 处理,因此建议不要使用默认值。可以根据实际情况进行编写,例如:shenzheData,shanghaiData。在多个环境(例如不同机房、测试/生产)部署时,部署环境必须使用不同的值,否则会导致探针定向到错误的Collector地址无法建立连接、连接时断时续、探针获取到错误的配置、产生跨机房或网段的网络流量等各种故障。
⚠️ Collector多网卡:当Collector所部署到的主机对外有多个IP时,可指定使用哪个IP与UniAgent进行通信,IP地址需要与UniAgent的IP地址同网段,如果IP指定不当,可能会产生探针与Collector网络不通、产生跨网段流量等问题。
Collector Port:Collector 进程监听的端口,默认:APM Collector使用7665端口, Infra Collector使用7666端口。如果没有特殊要求建议不要对其进行修改。如果进行修改需调整对应开通的网络策略。
下载Collector安装脚本。
方法一:单击点击生成,系统会生成一条命令,单击右侧的copy按钮后,在目标服务器上执行这条命令,Token有效时间是10分钟,失效后不能将执行命令,需刷新页面,获取新的命令。
方法二:网络不通时,可直接单击右侧下载按钮下载安装脚本,并将安装脚本传到目标服务器。
校验安装脚本。单击右侧的copy按钮后,在目标服务器上执行校验命令。校验脚本的目的是保证安装脚本下载完整,如果脚本未下载完整系统会给出提示信息。
安装Collector。
单击点击生成,系统会生成一条命令,然后单击右侧的copy按钮后,在安装脚本所在目录,执行这条命令安装Collector,因为需要在系统中安装服务,用于重启自启动,所以需要root权限。
验证
安装目录默认为
/opt/tingyun-collector/
使用以下命令查看运行状态
systemctl status tingyun-collector
完成部署后,在新增Collector部署页面最下方,单击查看部署状态按钮,跳转到Collectors管理页面,大约1分钟后在Collector列表中可查看新部署的Collector。