云计算公网质量评测方法和最佳实践

本文涉及的产品
传统型负载均衡 CLB,每月750个小时 15LCU
应用型负载均衡 ALB,每月750个小时 15LCU
公网NAT网关,每月750个小时 15CU
简介: 云计算的公网质量评测作为企业上云选型的关键流程已经变得越来越重要,但当前业界并没有一套完整的云计算公网质量的评测方法和原则的指导。本文对国内和海外的云计算公网质量评测方法做了较深入的分析,并提供了网络层的云计算公网质量评测的最佳实践供大家参考。

云计算通过互联网提供服务的模型

云计算的IDC机房连接到运营商的骨干网上对运营商内的用户提供服务。

用户通过移动终端或固定终端接入运营商的本地网络,并通过运营商的骨干网络访问阿里云上的各种服务,包括大家熟知的淘宝,天猫,高德,钉钉等。

image.png


从上图可以看到,用户访问云上服务涉及的环节还是比较多的,包括用户的本地网络,运营商网络和阿里云网络。

本地网络的情况一般是比较复杂的,尤其是移动网络,用户的本地网络的场景可能是弱网环境,比如说地铁,公交,高铁等。也可能是比较好的网络,比如说家庭或办公室。

运营商网络和云网络是比较稳定和确定的。

理论上来讲,任何一个网络环节出问题,都会影响用户的使用体验。

 

云公网质量评测的两种方式

应用层云公网质量评测

如果是评测一个应用的端到端的公网质量,最好是能够对用户终端到云上应用做全流程的测试。

image.png

这样能全流程覆盖用户本地网络,运营商网络和阿里云网络。

但这种评测方法复杂度和成本比较高,需要有大量的真实的客户端进行测试才比较有效和可信,因为只有至少上千规模的客户端才能排除本地网络和用户终端自身的变化的影响。

 

网络层云公网质量评测

 

如果是评测网络层的云计算公网质量,一般情况下测试运营商骨干网络或本地网络到阿里云应用的公网质量。

image.png

从运营商本地网络和骨干网络到云网络部分的公网质量是云厂商重点关注和重点优化的环节,只要这部分的质量好,服务和应用的端到端的公网质量就不会很差,如果这部分的质量不好,那么服务和应用的端到端的体验就很难做好。

此外对于用户本地网络和用户终端上的问题云厂商可以调优工作也很有限。


这种网络层的公网质量是一个基础和准入的评测,另外这种测试方式相对简单高效,所以在客户上云选型时被普遍采用。

 

两种评测方式的对比

 

评测方式

优点

缺点

应用层云公网质量评测

更贴近真实的端到端用户公网质量

测试成本较高且有一定复杂度,适合已经具备一定用户规模的企业客户

网络层云公网质量评测

测试成本低,测试方法简单

适合作为云厂商的横向对比测试

不完全反应最终的端到端的公网质量

更适合做准入门槛测试

 

网络层云公网质量评测的最佳实践

最佳实践原则

 

1.     选取TOP运营商探测点进行测试

因为TOP运营商中的用户多,所以应优先关注TOP运营商的质量情况。

比如对于国内的运营商,优先选取不同省份的电信,移动,联通的公网IP探测点进行测试,如果有余力再选择其他运营商的公网IP进行探测。

尽量不选择云厂商的BGP类型的服务器做探测点,因为不同的云厂商之间有可能通过IXP直接互联,流量路径和运营商到云厂商的不一样。

 

2.     测试时长大于1

互联网的也存在波峰波谷,闲时忙时的效应。

所以测试时长要至少一天得到的数据才比较可信。

 

3.     选择成熟的拨测平台进行测试

当前公网质量的拨测平台比较多,但也存在鱼龙混杂的问题。最好选择业界中口碑比较好的平台进行测试。

国内成熟的公网质量拨测平台包括:阿里云站点监控,听云,博睿等

海外成熟的公网质量拨测平台包括:CatchPoint

 

拨测平台

客户群

特点

网站链接

阿里云站点监控

个人和企业

优势:国内各省份运营商公网IP探测点很全面,海外探测点较缺乏

劣势:报表和结果分析易用性较差

https://cloudmonitor.console.aliyun.com/#/newSite/list/

听云

企业

优势:国内探测点和海外运营商探测点都有,报表和结果分析易用性好

劣势: 面向企业用户,首次服务开通流程较慢

https://saas.tingyun.com/

博睿

企业

优势:国内探测点和海外运营商探测点都有,报表和结果分析易用性好

劣势: 面向企业用户,首次服务开通流程较慢

https://www.bonree.com/

CatchPoint

企业

优势:海外运营商探测点较多

劣势:国内营商探测点较少。面向企业用户,首次服务开通流程较慢

https://www.catchpoint.com/

 

国内网络层基础公网质量评测最佳实践

1.     拨测平台选择

阿里云站点监控开通和使用比较简单,直接注册阿里云账号就可以使用

 

2. 公网探测任务类型选择

最简单的就是ICMPping探测,云服务器上不需要部署任何应用,只需要放通ICMP的安全组即可。

 

3. 公网探测点选择

根据业务的需求选择具体省份和地域的运营商。一般情况下优选一线和二线城市的电信,联通,移动的探测点,因为用户相对密集。


 

4. 结果分析

公网质量拨测平台对于公网质量主要提供两个指标,一个是时延,一个是丢包率。带宽这个指标一般情况都不是太大的问题,因为云上的公网带宽一般情况下都比较充足。

不同应用所侧重的公网质量不同,但大的原则是时延在一定范围内满足业务需求即可,重点看丢包率。

不同应用对时延的需求,请参考文章:https://mp.weixin.qq.com/s/jHv__zvDMS41BHzVh1YgsQ

 

海外网络层公网质量评测最佳实践

海外的公网质量评测相对比较复杂,国内的TOP运营商就3家,海外有很多家。

我们重点关注3G/4G/5G移动运营商到云的公网质量,主要是因为其覆盖的用户数多。

以亚太为例,我们整理了对应的TOP运营商列表,以及对应的3G/4G移动互联网用户数。

其中用户数的数据来源于互联网大体上正确但不够精确。



亚太区域TOP运营商和运营商内部互联网用户数

区域 区域TOP运营商 区域运营商的3G/4G/5G用户数(万) 拨测平台探针情况
中国香港 香港移动通信 CSL 800  
中国香港 3香港 3HK 600  
中国香港 中国移动香港 500 听云有探针
中国台湾 中华电信 1,100 听云、博睿、Catchpoint有探针
中国台湾 大哥大/Taiwan Mobile 800 博睿有探针
中国台湾 远传电信 700 听云、Catchpoint有探针
新加坡 Sinqtel 410 听云、博睿、Catchpoint有探针
新加坡 StarHub 220 听云、博睿、Catchpoint有探针
新加坡 M1 Limited (M1) 170  
马来西亚 Celcom 8,400 博睿有探针
马来西亚 DiGi Telecommunications 1,100  
马来西亚 Maxis 1,000  
泰国 Advanced Info Service (AIS) 4,500  
泰国 Digital Total Access Communication 2,600 听云有探针
泰国 TRUE 2,600 Catchpoint有探针
日本 NTT DOCOMO 8,000 听云、博睿、Catchpoint有探针
日本 KDDI (au) 6,000 博睿、Catchpoint有探针
日本 Softbank 4,000 听云有探针
韩国 SKT 3,500 听云、博睿、Catchpoint有探针
韩国 KT 2,100 听云、博睿、Catchpoint有探针
韩国 LG Uplus 1,400 听云、博睿、Catchpoint有探针
越南 Viettel Telecom 2,800 听云有探针
越南 MobiFone 1,600  
越南 VNPT-Vinaphone 1,300 听云, 博睿有探针
菲律宾 PLDT 3,000 博睿、Catchpoint有探针
菲律宾 Globe Telecom 3,000  
印度尼西亚 Telkomsel/PT 6,000 博睿,Catchpoint有探针
印度尼西亚 Indosat  2,600  
印度尼西亚 XL Axiata 2,000  
印度 Reliance Jio 38,800 博睿、Catchpoint有探针
印度 Vodafone Idea 33,000 听云、博睿、Catchpoint有探针
印度 Bharti Airtel 32,000 听云、博睿、Catchpoint有探针


欧美区域TOP运营商和运营商内部互联网用户数

区域 区域TOP运营商 区域运营商的3G/4G/5G用户数(万) 拨测平台探针情况
美国 AT&T 18,000 听云、博睿、Catchpoint有探针
美国 Verizon 12,000 听云、博睿、Catchpoint有探针
美国 T-Mobile US 10,000  
加拿大 Bell 1,100 博睿、Catchpoint有探针
加拿大 Rogers 1,100 博睿有探针
加拿大 Telus 1,100  
德国 Deutsche Telekom/T-Mobile 4,600 听云、博睿有探针
德国 Vodafone Germany 3,000 Catchpoint有探针
德国 Telefonica O2 2,200  
英国 BT Mobile/EE. T-mobile 2,700 听云、Catchpoint有探针
英国 O2 2,600  
英国 Vodafone UK 1,700  
法国 Orange 2,000 博睿、Catchpoint有探针
法国 Bouygues 1,700  
法国 SFR 1,400 Catchpoint有探针
意大利 Telecom Italia  3,000 听云、博睿、Catchpoint有探针
意大利 Wind Tre 2,100 博睿有探针
意大利 Vodafone Italia 1,300 博睿有探针



当前的公网质量拨测平台中没有一个能完全覆盖上述TOP运营商的,所以海外的公网质量拨测是一个比较大的难点。


阿里云采用另外一种方式进行公网质量的拨测,通过在云上的服务器主动探测具体运营商网的公网质量,收集探测数据并分析和汇总公网质量数据。


后续我们将对外逐步开放对应的统计数据供有需求的客户进行参考。

 

 

 

相关实践学习
通过云拨测对指定服务器进行Ping/DNS监测
本实验将通过云拨测对指定服务器进行Ping/DNS监测,评估网站服务质量和用户体验。
目录
相关文章
|
6月前
|
存储 数据管理 虚拟化
云计算——存储虚拟化简介 与 存储模式及方法
云计算——存储虚拟化简介 与 存储模式及方法
361 0
|
运维 安全 中间件
云计算万字长文 - 企业上云策略全览与最佳实践(长文)1
云计算万字长文 - 企业上云策略全览与最佳实践(长文)
535 0
|
4天前
|
人工智能 边缘计算 云计算
2024.11|云计算行业的商业模式创新方法及实践
截至2024年,全球云计算行业迈入全新阶段,从IaaS到大规模AI模型平台,技术与商业模式不断创新。本文分析全球最新技术进展,探讨云计算商业模式创新策略与实践,解析云服务厂商如何通过技术革新实现价值最大化,推动企业数字化与智能化转型。重点讨论AI与云计算的深度融合、边缘计算与去中心化发展、平台化与生态系统建设,以及数据安全与绿色云计算等关键议题。
53 30
|
6月前
|
安全 Java 网络安全
Java中的异常处理:理解、实践与最佳实践云端防御线:云计算环境下的网络安全与信息保护
【5月更文挑战第28天】 在编程中,异常是无法避免的一部分,特别是在Java这种静态类型语言中。本文将深入探讨Java中的异常处理机制,包括如何理解异常,如何在代码中实现异常处理,以及一些关于异常处理的最佳实践。我们将通过实例和代码片段来阐述这些概念,以帮助读者更好地理解和应用Java的异常处理。 【5月更文挑战第28天】 随着企业数字化转型的深入,云计算服务已成为支撑现代业务的关键基础设施。然而,云服务的广泛采用也带来了前所未有的安全挑战。本文深入探讨了在云计算环境中维护网络安全和信息保护的策略和技术,分析了云服务模型对安全措施的影响,并提出了综合的安全框架以应对不断演变的威胁。通过采用加
|
6月前
|
供应链 Cloud Native 数据管理
云计算在企业数字化转型中的关键作用及最佳实践
云计算重塑企业数字化转型,提供弹性、可扩展的计算平台,降低成本,提升运营效率和客户体验。其优势包括成本效益、灵活性、高可用性及创新加速。企业应制定云计算战略,开发云原生应用,采用混合云架构,并注重数据安全与合规。案例中,一制造企业通过云计算实现全球业务统一,简化供应链,加速产品创新,优化生产并保障数据安全。
|
6月前
|
测试技术 Go 云计算
Go语言优化云计算与容器化环境的策略与最佳实践
【2月更文挑战第15天】在云计算和容器化环境中,Go语言的应用和优化策略对于提高系统的性能和效率至关重要。本文深入探讨了如何使用Go语言优化云计算和容器化环境,包括内存管理、并发编程、代码优化等方面的最佳实践,旨在帮助开发者充分利用Go语言的优势,提升系统的整体性能。
|
监控 测试技术 持续交付
持续集成与持续交付(CI/CD):探讨在云计算中实现快速软件交付的最佳实践
蓝绿部署和灰度发布: 使用蓝绿部署和灰度发布等策略,逐步将新版本应用程序引入生产环境,降低风险。
223 0
|
存储 测试技术 数据库
云计算万字长文 - 企业上云策略全览与最佳实践(长文)2
云计算万字长文 - 企业上云策略全览与最佳实践(长文)
148 0
|
存储 安全 数据安全/隐私保护
云计算安全性:数据保护和身份认证的最佳实践
云计算的兴起为软件开发带来了巨大的便利和灵活性,但与此同时,安全性也成为了一个重要的关注点。在云环境中,数据保护和身份认证是确保应用程序和用户信息安全的关键方面。本文将介绍云计算中的数据保护和身份认证的最佳实践,以帮助开发人员构建安全可靠的云应用。
417 0
|
云计算