双11实战 | 高并发场景下的流量安全

本文涉及的产品
Web应用防火墙 3.0,每月20元额度 3个月
云安全中心 防病毒版,最高20核 3个月
云安全中心漏洞修复资源包免费试用,100次1年
简介: 2021天猫双11是首个100%的云上双11整体计算成本三年下降30%。在高并发极限场景考验下,WAF产品性能相较去年提升36%,节约服务器资源20%DDoS防护“千人千面”......

1.gif
2021天猫双11是首个100%的云上双11

整体计算成本三年下降30%

在高并发极限场景考验下,

WAF产品性能相较去年提升36%

节约服务器资源20%

DDoS防护“千人千面”

......


2.jpg


每年双11护航都是一个典型的高并发场景下的流量安全问题。阿里云安全团队将护航双11的实战经验用到服务云上百万客户,同时又将服务云上百万客户得来的广阔视野反哺双11的安全护航,安全产品、专家经验、技术实力在实战中被不断的打磨和丰富,形成了阿里云安全每天抵御60亿次攻击的防御实力。

对于阿里云安全团队来说,高并发场景不只在双11期间才会遇到,在服务云上诸多客户形形色色业务的时候也会经常遇到,尤其是数字化越来越深入发展的现在,业务流量经常出现较大程度的波动。为了更好的服务客户,以及应对双11的极限场景,阿里云安全团队将这种高并发场景下的安全护航做到日常,以“四两拨千斤”之力应对云上高度复杂且经常翻新的安全风险。


3.jpg

双11护航



01

统一边界,安全策略自动全网覆盖


所有生产网流量必须经过一个统一的接入层,抗DDoS攻击、Web应用防护等安全能力统一部署在接入层,基于云上全局视野,安全策略及时动态调整,一旦变更,全网自动覆盖,安全产品自动联动响应。同时,统一接入层拥有专属硬件集群,可以弹性扩容,支撑业务动态波动,安全防护无感丝滑。

这里的统一接入层有点类似于DMZ上云,云上DMZ更加适应大流量、高并发、强波动的业务特点,相较于传统DMZ区,云上安全不再“各自为战”,云盾平台统一安全管控,云端威胁情报动态感知,单点威胁全网阻断,自动化编排响应,安全事件处置效率提升百倍,数字化开放生态平台,无感应对复杂场景扩容。更多可以参考《上云之前靠体力,上云之后靠脑力》


4.jpg


5.jpg

绿色双十一



02

自动化的原生安全能力解“海量”之困


自动化发现公网IP,降低漏网之鱼


双十一期间业务激增,需要更多的云服务资源,会新增很多公网IP。

传统做法是人工将新增的公网IP一 一上报给安全团队,安全团队上线安全策略。

这种做法的弊端是人工上报很容易漏掉一些IP,漏掉的公网IP没有被安全策略覆盖,一旦被黑客发现,即使你拥有再厉害的安全产品也无济于事。彼时,安全人期待是,不要出现“漏网之鱼”。

而当业务上云后,基于原生的安全能力,系统可以自动去捞取随着业务扩容而新增的公网IP,尤其针对一些核心业务系统的IP可以重点探查,让漏网之鱼无网可漏。


自动发现误拦截


在高并发场景下进行Web防御时很容易出现误拦截的情况,阿里云安全基于全局视野,从IP类型、拦截频率、拦截数量等不同维度,通过近实时的计算,自动化的发现误拦截情况,排除一定不是误拦截的情况后再进行更进一步判断,将安全专家从海量告警中解放出来,留出更多精力专注在真正的风险研判和处置之上


联动商业化产品,高等级安全防护自动切换


尤其是针对DDoS攻击,当攻击超过设定好的机房承受能力峰值时,系统会自动切换到阿里云具有更高防御能力的DDoS防护产品,防御能力瞬间提升20-50倍,抵御上T攻击,保障业务稳定平稳度过。


6.jpg



03

与业务场景深度结合,

防御策略也可以“千姿百态”


以往由于无法判断每个IP所代表的具体业务场景,只能对所有核心IP进行一致化的防护策略。业务上云后,基于云天然一体的原生优势,通过打通域名、网络资源管理、业务等不同系统,可以精准判断出单IP的多维度属性,进而判断每个IP背后所代表的业务敏感性与重要性。基于此可以实现:

Ÿ  

从针对群像IP到单IP的个性化防护策略

尤其是面对DDoS攻击,当某一IP达到清洗阈值时,系统会自动判断,采取不同的防御策略。

特殊业务场景定制化防护策略

对于一些特殊的业务场景,DDoS防护能与业务版块联动,根据每个业务的个性化需求采用不同的处置策略。

结合业务场景,提升检测准确率

对于一些比较关键的业务场景,单从流量本身进行分析很容易出现误伤,结合流量背后的业务场景综合分析,可大幅提升检测准确率。


7.jpg

回归客户价值,聚焦客户体验



04

打铁还需自身硬

提升产品底层性能,应对极限场景考验


双11期间业务范围增大,为了提升防御效果会上线更多且复杂的防御策略,如何用有限的资源去承载更多的安全防护业务,就需要有效降低每个策略所占用的CPU资源,因此安全产品底层性能也需要调优,以支撑已有以及新增的安全策略高效执行。


01 代码逻辑优化,性能提升20%

对于WAF安全引擎自身的性能,通过分析性能开销与热点,进行针对性内部代码逻辑优化,性能提升超过20%。


02 优化安全策略逻辑,性能提升16%

为每个安全策略进行详细性能优化,包括哪行策略存在性能热点,并给出专业的优化建议。梳理线上空跑策略,进行下线处理。通过优化安全策略的逻辑,性能提升超过16%。


03 精准定位原因,提升检测成功率

提升性能的最终目的是提升检测成功率。首先了解现有的检测成功率,针对网络抖动原因等因素进行定向分析,对症治疗,最终提升检测成功率。目前阿里云在web安全的检测成功率可达到99.999%。


8.jpg


实战经验沉淀进安全产品,为客户所用

阿里云将护航双11的实战经验沉淀成产品能力,服务云上广大客户。


“千人千面”的DDoS防护

在护航双11过程中,阿里云安全团队沉淀出了结合业务场景进行个性化防御的能力,并将这种能力沉淀进DDoS防护产品。


阿里云DDoS防御可以提供“千人千面”的防护能力,针对不同客户的业务流量与站点自身的容量构建基线模型,学习站点可承受的流量范围,同时辅助情报积累实现防御策略的个性化设置。

防误伤的机制,秒级调整处置策略

在“千人千面”的基础上,阿里云的DDoS防护内置了 “防误伤机制”。防误伤机制在客户业务流量发生突变时可以自动学习这种突变是由正常用户带来还攻击者导致的,如果是正常用户因为促销等因素导致的频繁访问,进而造成业务流量异常,安全防御策略会自动回收,以保障业务稳定进行,防止误伤正常用户。

 
“大促模式”一键开启,无感防护

“大促模式”是双11护航的另一个经验沉淀,客户可以在DDoS防护产品中一键开启该模式,只需要设置大促的起止时间,相关的安全策略会自动生效,不需要安全人员做任何操作,即可保障大促期间不因安全策略导致业务误伤的情况,与防误伤机制相比,无论是客户还是最终用户,提供的都是无感防护。


9.jpg


双11已经走过十年之久,安全护航也经历了从最开始的手忙脚乱到现在的镇定自若。所谓实践出真知,安全实力只有在真正的攻防对抗下才能真正精进,也只有在这个过程中才能得以验证有效性。阿里云致力于将经过实践检验的安全产品、服务和方案提供给云上客户,为中国数字化转型的发展保驾护航。

相关文章
|
3月前
|
缓存 监控 Cloud Native
Java Solon v3.2.0 高并发与低内存实战指南之解决方案优化
本文深入解析了Java Solon v3.2.0框架的实战应用,聚焦高并发与低内存消耗场景。通过响应式编程、云原生支持、内存优化等特性,结合API网关、数据库操作及分布式缓存实例,展示其在秒杀系统中的性能优势。文章还提供了Docker部署、监控方案及实际效果数据,助力开发者构建高效稳定的应用系统。代码示例详尽,适合希望提升系统性能的Java开发者参考。
143 4
Java Solon v3.2.0 高并发与低内存实战指南之解决方案优化
|
3月前
|
关系型数据库 MySQL 分布式数据库
Super MySQL|揭秘PolarDB全异步执行架构,高并发场景性能利器
阿里云瑶池旗下的云原生数据库PolarDB MySQL版设计了基于协程的全异步执行架构,实现鉴权、事务提交、锁等待等核心逻辑的异步化执行,这是业界首个真正意义上实现全异步执行架构的MySQL数据库产品,显著提升了PolarDB MySQL的高并发处理能力,其中通用写入性能提升超过70%,长尾延迟降低60%以上。
|
3月前
|
缓存 NoSQL 算法
高并发秒杀系统实战(Redis+Lua分布式锁防超卖与库存扣减优化)
秒杀系统面临瞬时高并发、资源竞争和数据一致性挑战。传统方案如数据库锁或应用层锁存在性能瓶颈或分布式问题,而基于Redis的分布式锁与Lua脚本原子操作成为高效解决方案。通过Redis的`SETNX`实现分布式锁,结合Lua脚本完成库存扣减,确保操作原子性并大幅提升性能(QPS从120提升至8,200)。此外,分段库存策略、多级限流及服务降级机制进一步优化系统稳定性。最佳实践包括分层防控、黄金扣减法则与容灾设计,强调根据业务特性灵活组合技术手段以应对高并发场景。
900 7
|
2月前
|
数据采集 监控 网络协议
基于aiohttp的高并发爬虫实战:从原理到代码的完整指南
在数据驱动时代,传统同步爬虫效率低下,而基于Python的aiohttp库可构建高并发异步爬虫。本文通过实战案例解析aiohttp的核心组件与优化策略,包括信号量控制、连接池复用、异常处理等,并探讨代理集成、分布式架构及反爬应对方案,助你打造高性能、稳定可靠的网络爬虫系统。
150 0
|
4月前
|
NoSQL 算法 安全
redis分布式锁在高并发场景下的方案设计与性能提升
本文探讨了Redis分布式锁在主从架构下失效的问题及其解决方案。首先通过CAP理论分析,Redis遵循AP原则,导致锁可能失效。针对此问题,提出两种解决方案:Zookeeper分布式锁(追求CP一致性)和Redlock算法(基于多个Redis实例提升可靠性)。文章还讨论了可能遇到的“坑”,如加从节点引发超卖问题、建议Redis节点数为奇数以及持久化策略对锁的影响。最后,从性能优化角度出发,介绍了减少锁粒度和分段锁的策略,并结合实际场景(如下单重复提交、支付与取消订单冲突)展示了分布式锁的应用方法。
311 3
|
5月前
|
SQL 安全 测试技术
2025接口测试全攻略:高并发、安全防护与六大工具实战指南
本文探讨高并发稳定性验证、安全防护实战及六大工具(Postman、RunnerGo、Apipost、JMeter、SoapUI、Fiddler)选型指南,助力构建未来接口测试体系。接口测试旨在验证数据传输、参数合法性、错误处理能力及性能安全性,其重要性体现在早期发现问题、保障系统稳定和支撑持续集成。常用方法包括功能、性能、安全性及兼容性测试,典型场景涵盖前后端分离开发、第三方服务集成与数据一致性检查。选择合适的工具需综合考虑需求与团队协作等因素。
591 24
|
8月前
|
缓存 NoSQL 架构师
Redis批量查询的四种技巧,应对高并发场景的利器!
在高并发场景下,巧妙地利用缓存批量查询技巧能够显著提高系统性能。 在笔者看来,熟练掌握细粒度的缓存使用是每位架构师必备的技能。因此,在本文中,我们将深入探讨 Redis 中批量查询的一些技巧,希望能够给你带来一些启发。
638 23
Redis批量查询的四种技巧,应对高并发场景的利器!
|
8月前
|
弹性计算 NoSQL 关系型数据库
高并发交易场景下业务系统性能不足?体验构建高性能秒杀系统!完成任务可领取锦鲤抱枕!
高并发交易场景下业务系统性能不足?体验构建高性能秒杀系统!完成任务可领取锦鲤抱枕!
|
9月前
|
缓存 NoSQL Java
高并发场景秒杀抢购超卖Bug实战重现
在电商平台的秒杀活动中,高并发场景下的抢购超卖Bug是一个常见且棘手的问题。一旦处理不当,不仅会引发用户投诉,还会对商家的信誉和利益造成严重损害。本文将详细介绍秒杀抢购超卖Bug的背景历史、业务场景、底层原理以及Java代码实现,旨在帮助开发者更好地理解和解决这一问题。
291 12
|
监控 算法 Java
企业应用面临高并发等挑战,优化Java后台系统性能至关重要
随着互联网技术的发展,企业应用面临高并发等挑战,优化Java后台系统性能至关重要。本文提供三大技巧:1)优化JVM,如选用合适版本(如OpenJDK 11)、调整参数(如使用G1垃圾收集器)及监控性能;2)优化代码与算法,减少对象创建、合理使用集合及采用高效算法(如快速排序);3)数据库优化,包括索引、查询及分页策略改进,全面提升系统效能。
153 0