安全和可靠性

安全

由于应用与微服务产品使用了应用内探针技术，通过用户的配置可以采集性能和业务等敏感数据，因此整个系统对安全需要有较高的要求。应用与微服务系统通过以下几方面来保证安全性。

采集安全

在采集数据的探针上，通过配置选项，允许用户对采集到的敏感数据做混淆，例如：对用户名、密码、手机号等敏感信息。数据混淆在探针端完成，保证传输到Agent Collector上的数据不包含敏感数据，从而保证数据的安全。

同时探针提供审计模式，在审计模式运行时，探针将采集并上报的数据以日志的形式输出到本地的文件中，以便用户对上报数据进行安全审计，发现有敏感信息上报即可通过修改混淆设置进行屏蔽。
传输安全

在数据传输上，探针与Collector，Collector与DC端采用加密的HTTPS传输协议，保证数据在传输网络过程中的安全。
存储安全

应用与微服务采用高可用的存储架构对数据进行存储，对每种类型的数据存储都提供高度冗余和分布式的高可用存储方案，并提供健全的自动备份、恢复和容灾措施，最大限度的保证数据存储的安全性和可靠性。
账号安全

应用与微服务提供完整的角色和权限管理系统、可对每个功能模块和数据项设置特定的用户或角色访问权限，不同角色和用户只能访问被允许访问的功能和数据，特别是敏感的业务分析和业务数据，可以限定到特定的访问用户和角色上。

同时平台使用安全的 HTTPS 加密访问和权限校验，保证用户账号与密码的安全。

应用与微服务探针的可靠性保证机制如下：

当被监控的应用较繁忙或者已经没有足够的资源时，为了保证被监控系统的稳定运行，探针将关闭部分功能以减少对应用资源的消耗。当内存使用率或者Garbage Collection CPU时间占比超过采样阈值时，探针将对Trace数据进行采样；当内存使用率或者Garbage Collection CPU时间占比超过停止采集数据阈值时，探针将不再采集Trace数据。
当网络出现异常时，探针和Agent Collector之间的缓冲区能够保存1024条trace数据，最新采集的数据会不断的覆盖旧的数据，待网络恢复正常后，Agent Collector会将缓冲区中的数据继续上传到基调听云系统。
当部署多个Agent Collector时（推荐），即使其中一个Agent Collector出现故障不能正常上传数据，其他的Agent Collector会在5分钟内接替其工作继续上传，确保数据不会丢失。