Collector在线部署

在部署各语言探针前,请先部署好Collector。

Agent Collector 3.6.2.0及以上版本支持在线部署。

Agent Collector(以下简称Collector)是由APM Collector、Infra Collector和12个组件探针构成的。

12个组件探针分别是Apache HTTP Server、Nginx、MySQL、Oracle、Redis、SNMP、PostgreSQL、MongoDB、Elasticsearch、RabbitMQ、Kafka、Network组件探针,负责采集对应组件的性能数据。其中,Network组件探针负责采集HTTP、TCP、ICMP协议数据。Infra Collector负责收集和汇总UniAgent采集的主机性能数据、组件性能数据和协议数据。

一套基调听云悟空平台系统可以部署多个Agent Collector。在同一环境部署多个Collector时,必须保证多个Collector版本相同,升级Collector时要尽快升级全部的Collector以保证功能一致。

准备主机资源

部署Collector的主机推荐配置如下:

  • 操作系统:Linux x86/64 并需要systemd服务,Linux发行版建议: CentOS 7及以上、 Redhat 7及以上、Ubuntu 18及以上
  • CPU:4 Core及以上
  • 物理内存:8GB及以上

单个Collector每秒可以处理的trace数量和trace内span的数量有关系,单个trace内span数量越多,需要的计算资源就越多。部署在4 Core、8GB机器上的Collector通常可以承受4000TPS的trace数据。

CPU使用情况还和Collector相关的应用实例数量有关系,应用实例数量越多,需要的计算资源就越多。

在实践中,我们推荐按照以下公式计算需要部署的Collector数量:

Collector数量 = Max(应用实例总数/100, 一天内TPS的峰值/4000) + 1

环境信息确认

⚠️ 确认平台服务器和Collector所部署的服务器网络是否通畅

⚠️ 确认Collector部署的服务器CPU是ARM64还是x86_64架构

⚠️ 在Collector服务器端的操作都需要使用root权限

⚠️ 私有化部署时,上传Collector包之前先确认Collector包的类型是否和预期的CPU架构一致

开通网络策略(演示)

⚠️ 下面是演示的IP地址,请根据实际项目内的地址信息开通网络策略

源地址 目标地址 开通端口 说明
192.168.5.2 192.168.5.3 19109 Infra Collector主动拉取主机探针数据,主机探针监听19109端口
192.168.5.2 192.168.5.1 10100,10400,11000,8080 Collector上传数据到平台
192.168.5.3 192.168.5.2 7665,7666 后端服务器探针推送数据到Collector, APM Collector使用7665端口, Infra Collector使用7666端口
192.168.5.3 192.168.5.1 8080 后端服务器探针在线升级
用户 192.168.5.1 8080 平台报表访问

部署步骤

  1. 登录基调听云悟空平台,在左侧导航栏中依次选择 管理 -> 部署状态 -> Collectors管理。

  2. 在 Collectors管理 页签的右上角单击 新增,并配置Collector参数。

    • 选择操作系统CPU类型:默认选择Linux x86_64系统,目前只支持Linux x86_64, 如需ARM64包请联系后台技术人员。

    • 选择Collector版本:私有化部署时,Collector安装包需要通过超级管理员admin登录系统,提前进行上传,才能在此处显示版本号。

    • 安装路径:路径须以/开头,路径仅允许包含字母、数字、下划线、中划线。默认安装路径是opt目录,没有特殊要求,建议不要对其进行修改。

    • ⚠️ 部署环境:用来标识Collector所在的数据中心、VPC、机房,相同部署环境的多个Collector之间会做负载均衡以及 Failover 处理,因此建议不要使用默认值。可以根据实际情况进行编写,例如:shenzheData,shanghaiData。在多个环境(例如不同机房、测试/生产)部署时,部署环境必须使用不同的值,否则会导致探针定向到错误的Collector地址无法建立连接、连接时断时续、探针获取到错误的配置、产生跨机房或网段的网络流量等各种故障。

    • ⚠️ Collector多网卡:当Collector所部署到的主机对外有多个IP时,可指定使用哪个IP与UniAgent进行通信,IP地址需要与UniAgent的IP地址同网段,如果IP指定不当,可能会产生探针与Collector网络不通、产生跨网段流量等问题。

    • Collector Port:Collector 进程监听的端口,默认:APM Collector使用7665端口, Infra Collector使用7666端口。如果没有特殊要求建议不要对其进行修改。如果进行修改需调整对应开通的网络策略。

  3. 下载Collector安装脚本。

    • 方法一:单击点击生成,系统会生成一条命令,单击右侧的copy按钮后,在目标服务器上执行这条命令,Token有效时间是10分钟,失效后不能将执行命令,需刷新页面,获取新的命令。

    • 方法二:网络不通时,可直接单击右侧下载按钮下载安装脚本,并将安装脚本传到目标服务器。

  4. 校验安装脚本。单击右侧的copy按钮后,在目标服务器上执行校验命令。校验脚本的目的是保证安装脚本下载完整,如果脚本未下载完整系统会给出提示信息。

  5. 安装Collector。

    单击点击生成,系统会生成一条命令,然后单击右侧的copy按钮后,在安装脚本所在目录,执行这条命令安装Collector,因为需要在系统中安装服务,用于重启自启动,所以需要root权限。

  6. 验证

    安装目录默认为 /opt/tingyun-collector/

    使用以下命令查看运行状态 systemctl status tingyun-collector

  7. 完成部署后,在新增Collector部署页面最下方,单击查看部署状态按钮,跳转到Collectors管理页面,大约1分钟后在Collector列表中可查看新部署的Collector。

results matching ""

    No results matching ""