阿里云丁玉杰:构建全场景服务引擎

简介: 2023全球边缘计算大会·上海站,阿里云边缘云演讲分享

近日,第八届全球边缘计算大会在上海成功举办。会上,阿里云高级技术专家丁玉杰,分享了阿里云边缘云多场景一站式加速解决方案,以及在边缘加速、边缘FaaS、边缘安全领域的前沿技术和实践应用。




一、全场景需求


在传统云计算场景下,企业通常都需要云的几大件——存储,计算,网络,安全等,往往需采购很多基础服务或产品,并进行整合。在这种情况下,企业的需求是全场景化的


第一,企业存在很多复合型业务,例如,在A厂商购买安全,在B厂商购买加速,如何把这两个产品或场景很容易地搭建组合起来,是一个巨大的挑战,因为不同厂家之间,产品化的开通、API的交互,其实存在很大差异。这增大了产品管理或者多云管理的成本和难度。


第二,在产品功能之外,很多企业还要求低延时和防攻击能力,同时,对于算力,也可能存在更细粒度的类似FaaS的场景需求。


以赛事或票务场景为例,由于赛事是实时的,一些数据也是实时产生的,对于时效性和安全都有很高的需求。这些场景动态性强,往往需要多个服务之间的快速组合和构建。



基于全场景需求,阿里云边缘云从基础化的产品服务,逐渐演化为基于多场景的一站式服务能力


在基础加速和安全加速基础之上,阿里云扩展出很多关于非加速场景的能力,如安全和计算。比如,在基础场景下,阿里云在CDN的边缘节点,构建了可编程CDN, 让节点具备计算的能力。此外,加速场景也衍生出了安全能力,包括基层的安全,四层的安全,机器的流量管理等。


在全站加速场景下,CDN从只做静态内容的分发,到针对需要回源、全透传的场景,阿里云边缘云也进行了能力的建设和提升,朝着全栈式的方向演进升级。




二、核心能力构建


针对加速、计算和安全领域,丁玉杰分别介绍了阿里云边缘云核心能力的构建,即运力、算力和防力。


1.运力


在加速场景,CDN拥有海量的边缘节点,而源站一般是偏集中化的。如果要把一个用户的访问,送到源站上,其核心的技术手段或方案,其实就两类,如同在高速开车一样,首先,是要构建一条高速公路;其次,是跑在公路上的车的性能要足够好。这相当于在链路和传输这两方面去进行工作。


在路径或者选路方面,阿里云边缘云关注三个维度:第一,需要找到整个网络中的最优链路;第二,找到链路之后,如何进行链路的流量管理;第三,实施策略之后,需要得到实际效果的反馈,进行策略的迭代。


在传输方面,对于边缘侧、边缘的核心骨干网、骨干网到源站,这三个维度的网络的传输优化手段存在差异性。



关于路径规划,可以直观认为,链路在运输数据时存在很多限制,例如成本、延时等。同时,边缘是数据或流量高度复用的场景,安全场景、点播直播场景、动态业务场景,这么多混合业务一起使用基础的数据情况下,如何保证资源之间不打架,如何最大化利用资源,就需要去计算各种限制情况下的最优解,这可能是全局的性能最优,或是成本最优,或是性价比的均衡等。


此外,还需考虑海量业务下计算的效率。随着业务规模的高速增长,产生的海量的端、节点、以及客户,能否保证服务工作的持续运行,保证策略实现的秒级或者分钟级的效果。阿里云对此进行了一些状态压缩以及聚类方面的操作,让业务增长和计算消耗保持非常平滑的变化。



关于传输,传输包括接入段、中间段和回源段网络,不同链路的优化手段不同,对于边缘来说,则需重点关注弱网环境。弱网环境下,常规的TCP的叠加优化或QUIC的方式,是通用的解决方案,无法很好满足细分场景需求。


阿里云边缘云,针对低延时,下载成功率,不同网络特征等,进行协议上的算法优化,以及QUIC协议的支持,从而实现不同场景需求。


在核心网方面,阿里云边缘云在三层的基础设施之上,构建了四层或者更上层的传输协议,实现性能优化手段在应用层的更可控,更高效



2.算力


在计算场景下,阿里云边缘云在FaaS方向进行了一些技术迭代,目前已在众多客户中大规模使用。不同于以往FaaS更多基于中心云的视角,阿里云边缘FaaS结合边缘优势,让计算在离用户更近的位置上发生,从而极大降低整体的延时。



以边缘FaaS在冬奥会场景中的应用为例,由于奖牌榜是实时的,页面上包括一些静态内容,同时也有关于奖牌排名和数量的动态变化。组委会基于阿里云边缘FaaS,在页面模板之上,配合算法逻辑,很轻量级地在边缘实现了动静混合页面的动态生成,而不需要在中心生成并访问拉取。



3.防力


关于安全,一般的攻击较多发生在偏动态类的场景,与静态内容放置在边缘节点不同,动态场景如游戏互动、交易、电商等场景,流量都需要回源。在不做任何安全防护的情况下,加速会放大对于远程的攻击,管道在加速传输的同时,也在加速对用户的攻击,经过网络拓展到源站,因此,需要在边缘集成安全能力,阻挡攻击的透传。



在边缘集成安全能力,相比在中心集成,有一个很大的优势。一般边缘调度都是就近的,面向中心式源站的攻击,会全球集中在一个点,从而面临全球的压力,而在边缘节点构建安全,即可把流量牵引限制在局部,只有部分流量或较小的区域受到影响。


此外,攻击容易产生大量带宽,如果攻击发生在边缘,由于边缘的资源高度复用,单位带宽成本很低,由攻击而产生的带宽成本相比中心云,就会大大降低。


目前,阿里云边缘云的安全能力可以达到Tb级,特别是DDos防护能力,而CC的处置,可以实现秒级的自动处理。




三、能力的量化


目前,依托强大技术实力,阿里云边缘云打造了包含加速、计算、安全的超大规模平台服务,拥有3200+节点数量,覆盖100+国家和地区,每日峰值带宽达到180T,此外还包括100w+域名数量,15w+ LDNS IP,以及800+ ISP。


在调度感知与逃逸方面,面向边缘海量节点,单个节点容易出现异常和故障。对于此,阿里云边缘云可以将跑超控制在0.5%的水平,同时,当单个节点出现问题导致节点服务不能满足要求时,会在5s内完成感知和逃逸。此外,在调度时,针对不同区域、不同水位情况,阿里云边缘云将策略误差可以控制在5%内。


在QUIC和协议优化方面,由于不同业务的关注指标不同,阿里云边缘云针对不同场景,进行协议栈和QUIC的差异化算法优化,实现了不同业务场景下效果的普遍提升,帮助企业提升业务价值。


短视频业务中,下载速度提高20%,相对卡顿率下降10%;

• 在下载业务中,程序下载耗时下降25%,整体业务下载耗时下降40%;

• 在图片业务中,下耗时下降14%,首屏渲染完成时间下降6%。


针对全球回源场景,阿里云边缘云可以实现分钟粒度下的实时路径规划,承载千万级QPS和十万级域名。经过动态加速后,相比BGP直接访问源站,下载平均耗时下降80ms左右,小于30ms的最极致性能区间,从6%上升至39%,大大优化了企业的延时体验。



未来,阿里云边缘云希望与更多行业合作伙伴一起,通过产品、技术、资源的深度融合,提供丰富的边缘能力,支撑边缘应用场景,助力企业持续创造价值。


目录
相关文章
当用户需求不详细时,如何有效应对
当用户需求不详细时,如何有效应对
1080 0
|
文字识别
印刷文字识别产品使用合集之识别不准确,该如何优化
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
Shell Linux Apache
学习Nano编辑器:入门指南、安装步骤、基本操作和高级功能
学习Nano编辑器:入门指南、安装步骤、基本操作和高级功能
3978 0
|
网络协议 Linux 网络安全
|
SQL 缓存 大数据
【秋招面试】分享一则大数据面经:货拉拉大数据平台实习岗
【秋招面试】分享一则大数据面经:货拉拉大数据平台实习岗
385 0
|
Web App开发 数据采集 边缘计算
阿里云全球实时传输网络GRTN—QOE优化实践
阿里云GRTN核心网技术负责人肖凯,为我们分享GRTN核心网的运作机制、运用方面以及QOE的网络模型在业务板块的实践优化。
1249 0
阿里云全球实时传输网络GRTN—QOE优化实践
|
存储 人工智能 边缘计算
阿里云付哲:边缘云技术创新 让“云”无处不在
在8月19日的2022中国数字服务大会【边缘服务专题论坛】上,阿里云边缘云团队博士后研究员兼技术专家付哲以《边缘云技术创新 让“云”无处不在》为主题,分享了阿里云在边缘计算与边缘云方面的技术演进路线、商业场景实践与学术研究探索上的工作。
1187 0
阿里云付哲:边缘云技术创新 让“云”无处不在
|
边缘计算 Kubernetes 自动驾驶
重磅新书 丨 一文带你读懂《CDN技术架构》
CDN技术架构,阿里云CDN技术团队出品,文末有电子链接~
2940 0
重磅新书 丨 一文带你读懂《CDN技术架构》
|
调度 CDN
《CDN技术架构》电子版地址
本书详解CDN技术架构,分享流量调度、节点软件、网络传输及运营支撑系统关键技术;详解4大场景化实践、CDN命中率提升、应用市场下载加速、超低延时互动课堂及点播加速、动态加速实践。干货多,读得懂!经出版社授权线上上架30%内容,更多详情可自行网上购买~
431 0
《CDN技术架构》电子版地址