请求分析
背景
某电商App进行为期一周的促销活动,活动第三天运维发现「订单接口」和「支付接口」的访问量已经趋于水平并未持续增长,同时客服接到用户投诉:商品图片打不开或要等很久才能打开的情况,导致整体收入有些许下降趋势且影响用户体验。
案例分析
通过下图可以看出,最近三天的请求量的高峰时段集中在18点~22点,请求次数突增伴随着大量的网络错误和慢请求。
通过下图可以看出在19点~20点的时候,平均响应时间为 628ms高于行业均值 590ms。
进一步拆解响应时间后发现导致响应时间缓慢的原因为首包时间较长,该时段的首包时间为 471 ms。
针对下图中的Top域名查看「首包时间」发现「t.live.xxx.cn」这个域名的首包时间在19点~20点达到峰值。
对下图继续下钻可以发现是该域名下的「png」图片资源的首包时间过长。
通过下图分析17点~22点时段的「Top主机建联」可以发现绝大多数的请求都分布在「111.xxx.xxx.205」和「106.xxx.xxx.26」这两台主机。
解决方案
运维人员修改了负载均衡策略,下图中该域名的首包时间从631ms降至473ms优化了近158 ms。