典型场景

CDN加速评估及选型

国内的主要网站为了解决不同地区、不同运营商访问速度慢的问题,使用CDN服务。CDN服务是一个黑盒子式的服务,如何评估CDN服务的质量,基调听云Network在国内率先推出CDN监测服务,对CDN服务质量进行全面评估。

CDN解析策略监测

正确的时间,访问正确的地点、获得正确的内容,是对CDN的服务的要求。也就是说CDN服务商在高峰时间段,将用户的访问指向到最近的节点、性能最优的服务器上,获取正确的访问内容。基调听云可以对以上的CDN策略的合理性能进行监测,结合CDN节点分布策略,可以判断出CDN对用户的指向的合理,包括区域及运用商指向的匹配度。

CDN节点性能监测

CDN服务商的某个节点可能有多台服务器支撑,那么这些服务器的性能如何,基调听云Network的数据中提供对每台服务器访问的性能、可用性的分析,通过这些数据网站运营者可以分析某些地区访问性能差,是否是由于被分配到了性能差的服务器上。对CDN服务商提供的服务器性能进行监测,通过数据可以要求CDN服务商适当的调整,保证用户访问性能。

CDN解析策略变化监测

当CDN服务商将网站日常服务的数据量,从一台服务切换至另外一台服务时,基调听云Network系统的CDN指向变化趋势会监测到这种数据变化的情况,并且评估次变化对网站性能带来的影响,帮助网站规范CDN服务质量及服务规范。

CDN内容更新监测

CDN 节点中的内容与源站内容的同步对于网站来说是比较重要的,如果内容同步出现问题将影响大面积用户的访问及页面浏览,基调听云Network提供CDN内容同步的监测,通监测平台对页面更能进行实时扫描,如果发现内容没有进行更新,系统会即时发送报警短信及报警邮件给运维人员。

网站对标分析

用户往往对自身网站响应性能及竞争对手的网站响应性能比较关注。通过使用基调听云Network的监测,用户可以实时掌握网站应用在全国各地网站访问性能数据,全面优化网络结构,保证在全国各区域能够成功访问,并且保证各项性能指标是行业网站中的领先者。

基调听云Network通过多年积累的服务经验,掌握各行业的网站访问性能情况,并提供互联网网站行业数据标准,帮助用户了解业内对比情况,有针对性的为用户提供网站优化建议及解决方案。行业数据标准主要是反映网站在行业中的运营水平及网站价值,基调听云通过对主要行业网站的数据监测,通过科学的数据分析,提供客观、科学、准确的第三方数据体系及行业数据标准。

网站应用压力测试分析

压力测试方式

网站的运营者需要知道自己的网站在某个时段端(高峰访问时段)能够承受的访问峰值,需要通过集中在一个时间段使用大量监测点对其网站应用发起监测,通过监测观察这个时段网络、服务器等能够承受访问的峰值,并且分析其对网站访问造成何种影响,基调听云Network的集中压力测试能够令所有监测点在同一个时段发起访问,最小集中5分钟,并能够通过各维度的报表清晰呈现压力测试的情况。

另外,基调听云Network还可以采用持续压力测试检测网站在承受不断增加的访问量时,网站访问的各个性能指标的变换情况,以检验网站在承受不断增加的访问量的情况下,用户访问的真实用户体验。

监测原理

通过基调听云Network监测端工具对静态及动态页面发起访问,真实的浏览器并发环境监测,这种监测方式接近于真实的网民访问量的骤增,能够对网站的各项性能指标的变化情况进行监测分析。区别于以往的压力测试,基调听云Network的压力测试和网民访问的情况相同,它反映了真实网络流量剧增情况下网站的真实承受压力。

压力测试分析数据

  • 性能波动分析

    两个相邻5分钟的性能均值若相差10s,性能较高点对应的并发则被视为并发瓶颈。

  • 错误时段分析

    若错误量从某一时段出现超过5%的递增,对应的并发则被视为并发瓶颈。

对网站进行性能评估和优化

基调听云Network可以帮助用户对网站进行性能评估和优化。主要会从网络和页面结构两个方面入手,根据基调听云对网站重点性能指标的监测数据,并结合自身经验为互联网、金融、电子商务等各领域客户提出合理化建议,如DNS优化、建立连接时间优化、第一个数据包时间优化等。

另外,页面结构优化是网站性能优化的重要部分,网站结构的合理性直接决定了网站优化的效果。基调听云Network为客户提供完整的页面结构优化方案,包括对页面结构、页面元素、HTTP请求优化等,使您不需要投入太多的资源就能够极大的提升网站性能及用户体验。

具备可观测混合压测场景

压测背景

近年来,在企业数字化转型过程中,企业内部逐步对业务系统进行更新和迭代。为了保障业务系统的稳定性,一般在业务系统上线前进行容量测试,即压力测试。然而大多数企业仅仅在内网通过开源工具JMeter进行测试,在压测过程中主要观察的是在不同的压力值下服务器资源的使用情况,而忽略了业务本身,导致系统上线后依然无法保障业务的稳定性,出现各种问题。

压测具有天然的结果不可预见性,再好的压测方案如果不能得到有效的数据来分析都会使效果大打折扣。尤其是在复杂的、深度的系统环境下,通过获取全链路的追踪数据及指标数据实现整个压测过程的可观测性显得尤为重要。

压测方案

通过基调听云具备可观测性的混合型全链路压测方案,采用真实用户的网络环境及设备发起并发压力,同时结合基调听云的主动+被动的多种遥测手段,采集用户端、网络层、服务端等相关指标数据,及时发现前后端性能问题,及时优化调整。

img

前端压力:利用基调听云预先部署在全球各地区的30万+的真实电脑设备、真实网络、真实操作系以及真实浏览器用户+云端JMeter方式对业务系统发起“业务流程”及“API接口”的混合压测。

遥测手段:通过多种遥测手段,在压测期间,让业务系统具备可观测性,以便及时发现性能瓶颈及快速的问题定位。

输出内容:

  • 真实用户体验情况:从真实用户角度观测关键业务流程可用性和性能指标。

  • 应用服务器的代码性能瓶颈:通过部署APM探针,观察应用服务器及各组件的性能波动情况。

  • 主机服务器的资源消耗情况:通过部署Infra(基础组件)探针,观察主机服务器的CPU、内存、磁盘等资源消耗情况。

  • 组件的性能情况:通过APM探针,观察数据库SQL执行、数据库连接数等情况。

DNS劫持监测-CNAME监测

监控背景

当前CDN技术已经十分成熟。在大流量和高并发的情况下,很多客户都需要使用CDN。如果客户想要监测自己的网站是否被劫持到其他的主机上(DNS劫持),按照之前Network劫持检测功能,需要将所有的主机IP填写到IP白名单中。但是CDN的主机可能非常多,有的多达上千余台。客户填写起来非常麻烦,并且我们的数据库中给IP白名单预留的存储上限是2000字左右,IP不一定能够全部写进去。

监控原理

为了满足客户的需求,Network产品推出了新的劫持监测功能:CNAME劫持监测。原理是通过监测任务执行过程解析的CNAME,来做到DNS劫持监测,CNAME不会被劫持,只要CNAME是正确的,那么解析回来的IP一定是正确的。如果CNAME不正确,则认定为劫持。目前该功能由PC节点率先支持。

VPN质量监控

监控背景

随着最近两年疫情的爆发,远程办公的场景在企业中越来越普及,因此VPN的使用也变得越来越频繁和重要了。VPN技术的天然不足以及高负载下带来的访问性能下降问题也越来越突出,这变成了很多企业运维保障工作的一个新的难点和痛点。

解决方案

针对C/S的VPN客户端的登录状况监控,监控场景如下:

  • VPN登录成功率监控:通过协议级别进行监控,配置任务时,选择“VPN私有协议”,配置VPN登录服务器地址,监控指标包括VPN客户端启动时间、连接VPN服务器时间、VPN登录时间、可用性、页面下载时间、DNS时间等。

  • 登录VPN后业务系统可用性监控:需要在基调听云SaaS监测点上,提前部署好客户的VPN账号,保持长期登录,然后再通过事务流程脚本录制,对业务系统可用性进行监控。

  • 全国各区域到VPN服务器的网络测试:不需要部署VPN客户端,利用基调听云在全国各地的SaaS监测点主动对VPN服务器地址进行网络延时、丢包的监控。

支持范围:目前只支持深信服EasyConnect、OpenVPN客户端,跟协议无关。如果VPN是其他客户端,需要研发进行适配。

IMG_256

场景价值

通过主动监控VPN,提前发现问题,提前解决,有效提升员工的办公效率,提升用户体验。

WiFi质量监控

监控背景

在当今互联网如此发达的时代,Wi-Fi无处不在,我们出门在外,最害怕的不是手机没带,而是出现“网络不给力,请尝试更换网络或稍后再试”。同样,在企业内部,Wi-Fi质量不稳定更是影响员工的办公效率。然而,目前Wi-Fi网络覆盖存在盲区/死角、信道间存在干扰,这些问题无法及时被发现,还有AP设备的稳定性和性能会导致一些连接问题,IT人员无法快速定位。

解决方案

针对Wi-Fi质量监控,可以使用软硬一体化解决方案,将Network产品的拨测盒子部署在任意有电源、网线插口的位置即可进行持续监测,监控指标包括:Wi-Fi可用性、信号强度、连接成功率、文件下载时间等,每分钟模拟真实用户自动连接、断开,监控Wi-Fi的可用性。

场景价值

简单方便的帮助企业IT人员确定各区域的Wi-Fi信号强度的覆盖情况,有针对性的增加AP设备的覆盖,提高使用体验,减少用户投诉。

短信服务质量监控

监控背景

在日常生活中,我们手机每天收到大量的短信验证码:“【xxx】您的验证码是xxx(有效期5分钟)”。互联网时代,大量的网站、手机App和小程序等都在使用短信验证码作为验证用户身份的安全技术措施,在电商节和节假日期间,企业的促销、抽奖、互动活动等也让会员营销短信迎来高峰期,生活中企业与用户之间用到短信的场景非常多,我们的日常生活离不开短信。

短信应用场景增多,就催生了较多的短信服务厂商,然而对企业来说,他们对短信服务厂商服务质量完全不可控,所以企业需要有数据可量化短信服务厂商的送达率及及时性等服务质量,另外规模较大的企业一般会选用多家短信服务厂商,避免某一家出现问题时影响最终用户。然而企业并不清楚哪家短信服务厂商服务质量好,无法选型。

正常的短信发送流程如下(以企业发送验证码为例):

1、用户在企业的网站中输入手机号并点击获取“验证码”后,即触发了该企业的短信API接口。

2、该API接口通知短信网关将短信通过运营商网络,将验证码发送给用户手机。

IMG_256

在此过程中,可能会因为网络、短信网关负载、终端用户设备等多种原因,导致短信达到延时或获取验证码失败。

解决方案

基调听云的解决方案是:利用听云在全国各地部署的移动4G、5G的拨测手机监控客户端,模拟主动监控短信到达率和时延,以及验证发送内容是否正确。监控的指标包括短信到达时间和短信到达可用性。支持按照运营商、省份运营商、城市运营商、省份、城市维度查看。

在短信到达率监控中,涉及四类设备:

设备名称 作用 其他说明
手机测试终端 在终端会员手机上,安装了一个短信监控客户端NBSMS,用来请求短信监控任务,以及上传测试数据到基调听云报表服务器。 基调听云会根据会员手机接的任务数给出对应的报酬。
基调听云的调度服务器 根据配置任务情况,调度全国各区域、运营商的手机做任务。
基调听云中转服务器 为了短信网关的安全,基调听云使用固定IP的服务器向短信网关申请短信。(因为如果有某个手机频繁向短信网关请求短信,有可能会被识别为恶意攻击) 一般客户可以将该固定IP加到客户短信网关服务器的白名单中。
各厂商短信服务器 给测试手机发送短信。

IMG_256

场景价值

通过基调听云的短信监测,可以帮助客户了解到各短信厂商的可用性,帮助客户对短信厂商进行选型。

API主动监控

监控背景

今天的数字世界其实是一个以API为中心的世界。例如在电子商务交易、社交媒体交互等行业,API是非常重要的一部分,它广泛集成在工作和娱乐的应用中,因此当它们无法正常工作时,我们的生活会受到很大影响。

解决方案

使用基调听云Network拨测产品,利用遍布在全球各地的30万+的模拟用户主动对您的API接口做主动监控,此方案无须您的开发人员做任何嵌码,是基于URL的监控,该API URL只要能在互联网上被访问,就可以通过主动监控提前发现API接口的错误或性能问题,提前解决,减少对用户的影响,帮您提升业务用户体验。

场景价值

  • 对于关键API设置主动监控告警

  • 根据告警分析API的可用性

  • 通过对应应用的APM监控找到问题原因

  • 还可以通过应用代码级性能监控,找出API接口错误、性能问题的根因

证书监控

监控背景

目前在生产环境中,大多数业务系统的访问都被调整成了HTTPS,我们的使用证书都有时间限制,例如3个月过期一次,那么如果证书过期,会带来什么影响呢?对于网站来说,SSL证书到期不仅会导致浏览器的“不安全”警告,还会影响网站页面的正常显示,用户无法正常浏览,影响用户的浏览体验。

尤其是对于涉及资金交易的网站来说,无疑是很多不法分子所针对的目标,倘若SSL证书过期未及时续期,那么就有可能给不法分子可乘之机,造成用户的财产损失。

证书功能如此重要,作为运维人员,面对海量SSL证书,记住每一个证书的过期时间非常困难,那么如何监控每个证书的状态,是运维人员重点关注的问题之一。

解决方案

基调听云可以提供页面监测功能,利用预先部署在全球800多城市、运营商的SaaS监测点,模拟真实用户,主动对客户页面监控。

将任务配置中的证书监控功能打开,节点在访问客户页面时,建连成功后,握手时验证证书的 颁发机构名称、时间等指标。如有证书错误,即可抛出对应错误,详细信息都可以在日志信息中展示。

场景价值

通过模拟用户主动拨测,主动发现证书报错问题,提前解决,减少对用户的影响。

MTR网络链路监控

监控背景

国内三大运营商的路由策略错综复杂,网络链路的不稳定,对各个行业都有非常大的影响,比如游戏、直播等对网络的依赖度非常高,因此各企业的IT人员需要了解各区域用户到机房或目标主机的网络链路情况,可以有针对性的进行优化,以便提升用户的业务访问体验。

解决方案

针对网络链路监控与优化,基调听云选用的是MTR的监控方式,采用全国各地区拨测客户端模拟真实用户的真实网络对目标主机发起MTR测试——My tracerout集合Ping、Traceroute的特性,相比Traceroute只会做一次链路跟踪测试,MTR会对链路上的相关节点做持续探测并给出相应的统计信息,它能避免节点波动对测试结果的影响,所以其测试结果更正确。

IMG_256

指标 指标说明 解释
Loss% 丢包率 以最后目标主机丢包率判断整体链路的丢包情况。如果丢包率较高,则通过查看整条链路中哪一跳有问题,可以联系机房通知运营商优化。
Send 发送的数据包大小 默认每次发送100个数据包。
Last(ms) 最后一次发送数据包延时
Avg(ms) 平均延时
Best(ms) 最好延时
Worst(ms) 最差延时
StdDev 标准差(抖动情况) 抖动越高,说明链路越不稳定
Hop 跃点数 从测试点到目标主机的路由跳数

行业参考:

正常
同省同运营商 延时:<20ms 丢包:<5% 延时:20~80ms 丢包:5%~10% 延时:>80ms 丢包:>10%
不同省同运营商 延时:<50ms 丢包:<10% 延时:50~100ms 丢包:10%~15% 延时:>100ms 丢包:>15%
不同运营商 延时:<100ms 丢包:<15% 延时:100~150ms 丢包:15%~20% 延时:>150ms 丢包:>20%

企业业务质量监控

监控背景

对于IT人员来说,现在企业中的各类业务系统,不论是面向企业内部工作人员,还是面向互联网用户的互联网应用系统,保障其业务系统的高可用性,一直是悬在IT技术人员的一把刀,在当今“时间”就是一切的大背景下,如何在出现问题时第一时间主动感知,缩短MTTR,提高业务高可用性,这对每个企业都来说都非常重要。

解决方案

采用基调听云企业拨测方案,针对to C应用,利用预先部署在全球800多城市、运营商的SaaS监测点,模拟真实用户,主动对业务系统关键业务流程进行监控;针对企业内部的应用,需要在企业内部部署监控客户端(或基调听云拨测盒子),主动对内网的业务系统关键业务主动监控,通过定期主动的监控,提前发现问题,提前解决,减少对用户或员工的影响,提高用户体验,提高企业员工的工作效率。

img

场景价值

通过业务流程的主动监控,我们可以清晰掌握到业务系统的可用性情况,为企业的数字体验的优化提供有力的数据支撑,有效帮助企业真正提高业务系统的访问质量,提升用户体验。

端到端场景监控

监控背景

在现有的拨测能力下,对监控任务的性能仅限于网络层数据监控和展示,站在用户视觉分析数据较为单一,不能完全体现出任务性能的真实性。

解决方案

拨测支持从基调听云Network到基调听云APM端到端追踪,同一个合同账号ID,当后端APM安装了探针,在散点瀑布图里就会有追踪到后端的响应时间数据调用。用户从拨测不仅可以看到网络层数据,还可以看到服务端响应数据,这样从客户视角提升了整体数据分析的完整性。

© 2007-2023 北京基调网络股份有限公司 all right reserved,powered by Gitbook本文档更新于: 2023-06-15 20:26

results matching ""

    No results matching ""