产品价值及典型场景
提升架构梳理效率
痛点:对系统运营部门或新上任的IT管理者来说,外包开发或新接手的业务系统通常是一个黑箱,系统中的架构和应用逻辑调用关系是不清楚的。当这些团队需要快速接手一个复杂的业务系统并且制定后续的维护和优化计划时,通常需要对整个业务系统进行梳理,而这个工作在采用APM产品之前完全依赖于原有业务系统的开发团队提供足够详细的架构和开发文档来完成,工作量巨大。并且一旦文档中有任何遗漏将会导致整个架构梳理不完整甚至进行不下去。
基调听云解决方案:通过在业务系统的应用上简单的部署基调听云应用与微服务探针,团队可以非常便捷且直观地获得整个业务系统的逻辑调用关系和实时的拓扑逻辑图,包括各系统之间相互的接口调用,应用与服务器资源和服务组件之间的依赖关系等等,极大提高了系统梳理的效率。同时在业务系统后续进行变更和优化时也能提供实时的架构状态变化反馈,供团队进行快速的调整和响应。
缩短故障时间
痛点:对业务系统的IT和运维团队来说,最重要的工作目标就是保障系统的服务可用性,在故障发生时能快速解决,缩短故障时间。
基调听云解决方案:通过使用基调听云应用与微服务,团队在系统出现异常和故障时及时得到警报通知,并且通过警报邮件和数据报表分析平台,可以在几分钟之内快速定位此次故障的根本原因、涉及的业务接口、应用、实例或服务组件等,以及影响的用户和业务范围。通过快速的根因定位,团队可以制定计划,快速响应,进行故障修复或设置自动化运维工具进行后续同类故障的自愈管理,极大缩短了故障的持续时间,提高系统的总体可用性。
助力数字化转型
痛点:没有一个工具把业务和IT系统关联监控起来。作为业务负责人,无法从孤立的业务数据发现真实的业务可用性和业务性能,当业务表现异常时也无法准确判断是业务本身出问题了还是IT系统异常导致的问题;作为IT系统负责人,无法从孤立的IT监控数据中发现不契合业务需求的系统问题,也无法清楚地知晓性能问题影响的业务范围。
基调听云解决方案:作为 IT 和运维一体化监控的核心,APM 承载了最重要的 IT 监控功能,同时也是业务数据采集的重要手段。在基调听云应用与微服务产品中,除了优化和完善传统的服务端 APM 监控之外,还对产品架构进行了重新设计,支持建立业务指标与 IT 指标的关联,评估故障对业务表现的影响,更好的为业务分析提供数据支持,为用户产生更大的价值。
事务追踪
痛点:在应用出现错误时,研发和运维团队通常是利用应用输出的日志来对代码或用户的请求进行追踪,从而确定产生问题的原因。而当应用没有预先输出日志、日志格式不规范、日志量太大、应用间的日志无关联时,进行事务追踪变得异常困难甚至不可能。
基调听云解决方案:利用基调听云应用与微服务可以轻松地在应用和应用之间进行全流程事务调用的追踪,并在追踪信息中提供详细的性能、事务数据以及代码的执行堆栈和各类相关变量,提高定位问题的效率。在复杂的容器化、微服务和Service Mesh场景下为团队提供全量的分布式调用链追踪,无论是同步还是异步的调用,都能够清晰追踪每一笔交易和请求,不遗失任何一个数据细节。同时通过探针将追踪信息输出到日志中,还可以结合日志系统来完成更精准和详细的事务追踪溯源。
持续交付,持续优化
痛点:在DevOps中,对业务快速的迭代要求让团队必须保持敏捷的持续优化和持续交付过程。在此过程中,需要DevOps团队里的研发、运维和测试人员对系统中存在的性能瓶颈和问题拥有同样的可见度和认知,才能对性能问题进行快速的响应和优化迭代。
基调听云解决方案:详细的 SQL 语句和代码性能剖析为研发团队优化业务表现实现快速迭代提供可靠的数据支撑。通过将基调听云应用与微服务融入到CI/CD工具链中,可以保证每个团队从不同的阶段、视角和方位全面了解业务系统存在的性能瓶颈和问题点,为高效的产品交付提供动力。
智能告警与服务自愈
痛点:在管理大规模的服务架构下,一旦发生系统故障,随之而来的告警数量非常之多,这就导致了大量重复的、无用的告警风暴,运维人员排查工作量巨大。
基调听云解决方案:基于机器学习的异常检测智能告警更加灵敏和精确,减小排查工作量,能够在服务还未完全不可用之前及时发送告警通知并驱动自动化脚本进行服务自愈,降低故障恢复时间,提升业务可用性。