2021年10月,中国信息通信研究院(以下简称“中国信通院”)对阿里云MaxCompute大数据平台进行了为期7天的新型稳定性测试。阿里云MaxCompute大数据平台在13轮不同程度的破坏性测试中,性能水平并未明显下降,被证明为韧性型系统。这是业内首个由第三方测试机构利用混沌工程测试方法论,对大数据产品进行新型稳定性测试的案例。
阿里云MaxCompute 是阿里巴巴自主研发的海量数据处理平台和数仓解决方案,主要提供存储、计算、大数据资源管理能力,提供SQL、Spark、Python等多种计算和分析服务,同时提供完善的安全解决方案,用于管理数据,提升数据价值。
大数据技术利用分布式架构解决了数据处理、数据分析场景中数据量大、计算逻辑复杂、计算效率要求高的问题,同时大数据产品的功能、易用性、安全性等企业级能力也在方方面面支撑着业务的高速发展,但随着分布式集群节点规模逐渐增大、网络结构越来越复杂,数据和业务越来越重要,随之而来的故障风险和问题影响也越来越大。随着 2021 年《关键信息基础设施安全保护条例》出台,稳定性已成为各领域客户在功能、性能之外,对大数据技术产品能力评价的重要指标。
本次稳定性测试通过注入负载或故障,模拟CPU、内存、磁盘空间、磁盘读写高负载,网络抖动、丢包、包损坏、单节点线程故障,并设置不同强度综合测试及故障恢复验证测试,根据多个贴近生产故障的验证用例,比较故障前后功能和性能的差异,来证明大数据系统的稳定性,具备科学性和实用性。 MaxCompute 历经多年双十一锤炼,可以承载超大规模负载压力,并稳定地提供计算功能和性能。诸如多副本的数据可靠性,多租户资源隔离和调度能力,DAG2.0 动态执行图故障转移能力,保证了MaxCompute 顺利通过稳定性测试。
此外,阿里云多款大数据产品近期通过信通院多项评测。其中,大数据开发治理平台DataWorks通过数据开发平台基础能力专项评测、数据分类分级工具基础专项能力评测;实时数仓 Hologres通过了分布式分析型数据库性能专项评测,实时计算Flink版通过了分布式流处理平台稳定性专项评测。阿里云大数据产品不仅具备敏捷业务、简单易用、全托管的优势,同时兼具开箱即用、企业级安全、随意弹性、开放兼容的特点,帮助企业释放数据价值、保障数据安全、激活数据生产力。