阿里云丁玉杰:构建全场景服务引擎

简介: 2023全球边缘计算大会·上海站,阿里云边缘云演讲分享

近日,第八届全球边缘计算大会在上海成功举办。会上,阿里云高级技术专家丁玉杰,分享了阿里云边缘云多场景一站式加速解决方案,以及在边缘加速、边缘FaaS、边缘安全领域的前沿技术和实践应用。




一、全场景需求


在传统云计算场景下,企业通常都需要云的几大件——存储,计算,网络,安全等,往往需采购很多基础服务或产品,并进行整合。在这种情况下,企业的需求是全场景化的


第一,企业存在很多复合型业务,例如,在A厂商购买安全,在B厂商购买加速,如何把这两个产品或场景很容易地搭建组合起来,是一个巨大的挑战,因为不同厂家之间,产品化的开通、API的交互,其实存在很大差异。这增大了产品管理或者多云管理的成本和难度。


第二,在产品功能之外,很多企业还要求低延时和防攻击能力,同时,对于算力,也可能存在更细粒度的类似FaaS的场景需求。


以赛事或票务场景为例,由于赛事是实时的,一些数据也是实时产生的,对于时效性和安全都有很高的需求。这些场景动态性强,往往需要多个服务之间的快速组合和构建。



基于全场景需求,阿里云边缘云从基础化的产品服务,逐渐演化为基于多场景的一站式服务能力


在基础加速和安全加速基础之上,阿里云扩展出很多关于非加速场景的能力,如安全和计算。比如,在基础场景下,阿里云在CDN的边缘节点,构建了可编程CDN, 让节点具备计算的能力。此外,加速场景也衍生出了安全能力,包括基层的安全,四层的安全,机器的流量管理等。


在全站加速场景下,CDN从只做静态内容的分发,到针对需要回源、全透传的场景,阿里云边缘云也进行了能力的建设和提升,朝着全栈式的方向演进升级。




二、核心能力构建


针对加速、计算和安全领域,丁玉杰分别介绍了阿里云边缘云核心能力的构建,即运力、算力和防力。


1.运力


在加速场景,CDN拥有海量的边缘节点,而源站一般是偏集中化的。如果要把一个用户的访问,送到源站上,其核心的技术手段或方案,其实就两类,如同在高速开车一样,首先,是要构建一条高速公路;其次,是跑在公路上的车的性能要足够好。这相当于在链路和传输这两方面去进行工作。


在路径或者选路方面,阿里云边缘云关注三个维度:第一,需要找到整个网络中的最优链路;第二,找到链路之后,如何进行链路的流量管理;第三,实施策略之后,需要得到实际效果的反馈,进行策略的迭代。


在传输方面,对于边缘侧、边缘的核心骨干网、骨干网到源站,这三个维度的网络的传输优化手段存在差异性。



关于路径规划,可以直观认为,链路在运输数据时存在很多限制,例如成本、延时等。同时,边缘是数据或流量高度复用的场景,安全场景、点播直播场景、动态业务场景,这么多混合业务一起使用基础的数据情况下,如何保证资源之间不打架,如何最大化利用资源,就需要去计算各种限制情况下的最优解,这可能是全局的性能最优,或是成本最优,或是性价比的均衡等。


此外,还需考虑海量业务下计算的效率。随着业务规模的高速增长,产生的海量的端、节点、以及客户,能否保证服务工作的持续运行,保证策略实现的秒级或者分钟级的效果。阿里云对此进行了一些状态压缩以及聚类方面的操作,让业务增长和计算消耗保持非常平滑的变化。



关于传输,传输包括接入段、中间段和回源段网络,不同链路的优化手段不同,对于边缘来说,则需重点关注弱网环境。弱网环境下,常规的TCP的叠加优化或QUIC的方式,是通用的解决方案,无法很好满足细分场景需求。


阿里云边缘云,针对低延时,下载成功率,不同网络特征等,进行协议上的算法优化,以及QUIC协议的支持,从而实现不同场景需求。


在核心网方面,阿里云边缘云在三层的基础设施之上,构建了四层或者更上层的传输协议,实现性能优化手段在应用层的更可控,更高效



2.算力


在计算场景下,阿里云边缘云在FaaS方向进行了一些技术迭代,目前已在众多客户中大规模使用。不同于以往FaaS更多基于中心云的视角,阿里云边缘FaaS结合边缘优势,让计算在离用户更近的位置上发生,从而极大降低整体的延时。



以边缘FaaS在冬奥会场景中的应用为例,由于奖牌榜是实时的,页面上包括一些静态内容,同时也有关于奖牌排名和数量的动态变化。组委会基于阿里云边缘FaaS,在页面模板之上,配合算法逻辑,很轻量级地在边缘实现了动静混合页面的动态生成,而不需要在中心生成并访问拉取。



3.防力


关于安全,一般的攻击较多发生在偏动态类的场景,与静态内容放置在边缘节点不同,动态场景如游戏互动、交易、电商等场景,流量都需要回源。在不做任何安全防护的情况下,加速会放大对于远程的攻击,管道在加速传输的同时,也在加速对用户的攻击,经过网络拓展到源站,因此,需要在边缘集成安全能力,阻挡攻击的透传。



在边缘集成安全能力,相比在中心集成,有一个很大的优势。一般边缘调度都是就近的,面向中心式源站的攻击,会全球集中在一个点,从而面临全球的压力,而在边缘节点构建安全,即可把流量牵引限制在局部,只有部分流量或较小的区域受到影响。


此外,攻击容易产生大量带宽,如果攻击发生在边缘,由于边缘的资源高度复用,单位带宽成本很低,由攻击而产生的带宽成本相比中心云,就会大大降低。


目前,阿里云边缘云的安全能力可以达到Tb级,特别是DDos防护能力,而CC的处置,可以实现秒级的自动处理。




三、能力的量化


目前,依托强大技术实力,阿里云边缘云打造了包含加速、计算、安全的超大规模平台服务,拥有3200+节点数量,覆盖100+国家和地区,每日峰值带宽达到180T,此外还包括100w+域名数量,15w+ LDNS IP,以及800+ ISP。


在调度感知与逃逸方面,面向边缘海量节点,单个节点容易出现异常和故障。对于此,阿里云边缘云可以将跑超控制在0.5%的水平,同时,当单个节点出现问题导致节点服务不能满足要求时,会在5s内完成感知和逃逸。此外,在调度时,针对不同区域、不同水位情况,阿里云边缘云将策略误差可以控制在5%内。


在QUIC和协议优化方面,由于不同业务的关注指标不同,阿里云边缘云针对不同场景,进行协议栈和QUIC的差异化算法优化,实现了不同业务场景下效果的普遍提升,帮助企业提升业务价值。


短视频业务中,下载速度提高20%,相对卡顿率下降10%;

• 在下载业务中,程序下载耗时下降25%,整体业务下载耗时下降40%;

• 在图片业务中,下耗时下降14%,首屏渲染完成时间下降6%。


针对全球回源场景,阿里云边缘云可以实现分钟粒度下的实时路径规划,承载千万级QPS和十万级域名。经过动态加速后,相比BGP直接访问源站,下载平均耗时下降80ms左右,小于30ms的最极致性能区间,从6%上升至39%,大大优化了企业的延时体验。



未来,阿里云边缘云希望与更多行业合作伙伴一起,通过产品、技术、资源的深度融合,提供丰富的边缘能力,支撑边缘应用场景,助力企业持续创造价值。


相关实践学习
Serverless极速搭建Hexo博客
本场景介绍如何使用阿里云函数计算服务命令行工具快速搭建一个Hexo博客。
目录
相关文章
|
3天前
|
存储 SQL OLAP
分析性能提升40%,阿里云Hologres流量场景最佳实践
分析性能提升40%,阿里云Hologres流量场景最佳实践
|
2天前
|
存储 NoSQL 文件存储
阿里云文件存储CPFS如何满足大模型智算场景的存储需求
阿里云文件存储CPFS如何满足大模型智算场景的存储需求
|
4天前
|
弹性计算 网络协议 Linux
阿里云主机构建FRP内网穿透家用服务器避坑指南
详述了利用FRP工具搭建内网穿透的流程,包括阿里云ECS的配置、家用服务器的准备、FRP工具的下载与配置,以及通过SSH远程访问本地服务器的解决策略,确保了内外网间的稳定连接。
22 0
阿里云主机构建FRP内网穿透家用服务器避坑指南
|
8天前
|
域名解析 运维 Java
阿里云云效操作报错合集之流水线构建过程中出现了实时查询异常,该怎么解决
本合集将整理呈现用户在使用过程中遇到的报错及其对应的解决办法,包括但不限于账户权限设置错误、项目配置不正确、代码提交冲突、构建任务执行失败、测试环境异常、需求流转阻塞等问题。阿里云云效是一站式企业级研发协同和DevOps平台,为企业提供从需求规划、开发、测试、发布到运维、运营的全流程端到端服务和工具支撑,致力于提升企业的研发效能和创新能力。
|
2天前
|
存储 人工智能 自然语言处理
阿里云Elasticsearch AI场景语义搜索最佳实践
本文介绍了如何使用阿里云Elasticsearch结合搜索开发工作台搭建AI语义搜索。
|
8天前
|
运维 Ubuntu Shell
阿里云云效操作报错合集之流水线构建Docker镜像时,遇到报错:“error: failed to solve: rpc error: code”,该怎么办
本合集将整理呈现用户在使用过程中遇到的报错及其对应的解决办法,包括但不限于账户权限设置错误、项目配置不正确、代码提交冲突、构建任务执行失败、测试环境异常、需求流转阻塞等问题。阿里云云效是一站式企业级研发协同和DevOps平台,为企业提供从需求规划、开发、测试、发布到运维、运营的全流程端到端服务和工具支撑,致力于提升企业的研发效能和创新能力。
|
8天前
|
JavaScript Shell 应用服务中间件
阿里云云效操作报错合集之Node.js构建报错,该如何排查问题
本合集将整理呈现用户在使用过程中遇到的报错及其对应的解决办法,包括但不限于账户权限设置错误、项目配置不正确、代码提交冲突、构建任务执行失败、测试环境异常、需求流转阻塞等问题。阿里云云效是一站式企业级研发协同和DevOps平台,为企业提供从需求规划、开发、测试、发布到运维、运营的全流程端到端服务和工具支撑,致力于提升企业的研发效能和创新能力。
|
8天前
|
网络协议 前端开发 测试技术
阿里云云效操作报错合集之Dockerfile流水线构建中,参数未获取到,是什么导致的
本合集将整理呈现用户在使用过程中遇到的报错及其对应的解决办法,包括但不限于账户权限设置错误、项目配置不正确、代码提交冲突、构建任务执行失败、测试环境异常、需求流转阻塞等问题。阿里云云效是一站式企业级研发协同和DevOps平台,为企业提供从需求规划、开发、测试、发布到运维、运营的全流程端到端服务和工具支撑,致力于提升企业的研发效能和创新能力。
|
8天前
|
资源调度 前端开发 开发工具
阿里云云效操作报错合集之Node-Sass模块在构建过程中,出现报错"ENOENT: no such file or directory, scandir ",该如何处理
本合集将整理呈现用户在使用过程中遇到的报错及其对应的解决办法,包括但不限于账户权限设置错误、项目配置不正确、代码提交冲突、构建任务执行失败、测试环境异常、需求流转阻塞等问题。阿里云云效是一站式企业级研发协同和DevOps平台,为企业提供从需求规划、开发、测试、发布到运维、运营的全流程端到端服务和工具支撑,致力于提升企业的研发效能和创新能力。
|
8天前
|
弹性计算 运维 Kubernetes
阿里云云效操作报错合集之构建流程中遇到 "origin_value 类型错误,取不到DOCKER_URL" 这样的错误,该怎么办
本合集将整理呈现用户在使用过程中遇到的报错及其对应的解决办法,包括但不限于账户权限设置错误、项目配置不正确、代码提交冲突、构建任务执行失败、测试环境异常、需求流转阻塞等问题。阿里云云效是一站式企业级研发协同和DevOps平台,为企业提供从需求规划、开发、测试、发布到运维、运营的全流程端到端服务和工具支撑,致力于提升企业的研发效能和创新能力。

热门文章

最新文章