阿里云 肖文鹏:边缘云创新场景探索与实践

简介: 在9月16日下午召开的边缘云论坛上,阿里云高级技术专家 肖文鹏发表了题为《边缘云创新场景探索与实践》的精彩演讲。

在9月16日下午召开的边缘云论坛上,阿里云高级技术专家 肖文鹏发表了题为《边缘云创新场景探索与实践》的精彩演讲。

image.png

中心+边缘的新型云计算架构体系

肖文鹏首先介绍了中心+边缘的新型云计算架构体系,目前阿里云有20多个数据中心,即传统的中心云,这些中心具有较大的单点规模,并且拥有较强的计算以及存储能力,但是距离终端较远。

image.png

相较于中心云,边缘节点单点规模较小,能承载的计算以及存储规模有限。但正是由于这一特性,使得边缘节点能够更加灵活快速的铺开,目前阿里云已经拥有超过2800个边缘节点。这些节点遍布全球各地以及不同运营商,并且距离终端用户更近。

中心和边缘一起,面向各类应用以及产业互联网场景,提供一体化的解决方案。

在5G时代下,视频和图片因其强大的信息承载力,已经成为数据内容的主要载体和信息传播的主要方式,根据爱立信最新报告显示,76%的网络数据为视频和图片,也就是视图。而5G的大带宽、低时延、广连接的特性激活了视频监控、云游戏、物联网等场景应用,从消费互联网到产业互联网的延伸,更加促进了终端应用和视图数据的爆发。

这些终端和数据具有位置分散、规模大、以及价值密度相对较低等特点。以摄像头为例,IHS的研究指出,目前全球有10亿个监控摄像头在持续的产生视图数据。这个数据量是ZB级,但其中绝大部分数据价值较低,我们更需要留存其中的关键片段以及其结构化信息,这样的场景和需求对计算和存储的方式带来了严峻挑战和根本性变化。

基于边缘的新一代接入、计算以及存储的分布式系统架构有效的解决了这样的问题。它能够将80%以上的流量、计算以及数据收敛到本地,显著的降低网络传输以及存储成本、提升计算效率,同时带来超低延迟的体验。

在这样的云计算体系之上构建业务系统,其核心在于网、算、管、存四部分。

肖文鹏以城市大脑为例进行了讲解,他说,终端设备如摄像头分布在全国各地,位置相对分散且流量分布不均。一些重计算如切片录制、实时AI分析等需要回云后在中心完成。同时由于数据规模之大,对于终端设备管理、视图内容的检索等,带来很大的挑战。最后,由于海量的数据需要回云,对成本、时延等等,都带来很大的问题。

回到核心,如何提供一张就近、位置无感的接入、计算和存储网络,成为了视图上云的首要任务。同时,由于不同业务需求以及资源的异构,比如CPU、GPU、ARM阵列等,需要我们有按需的弹性计算能力,并且需要和接入网紧密结合。其次,面对海量的终端设备以及视图数据,云边一体的视图管理以及安全的云边通道,是数据流转的关键。最后,由于视图数据价值密度的差异,我们需要将大部分数据在边缘进行卸载,同时经过计算,将高价值以及序列化数据回云,其核心,就是解决如何存的问题。

边缘云创新场景-视图计算

综合对上述问题的思考,边缘创新团队基于阿里云广覆盖的ENS底座,孵化出视图计算平台。它主要面向视图以及终端上云场景,如直点播、安防监控、城市大脑、云游戏等,提供了位置无感的链接、计算以及周期性存储服务。

image.png

视图计算从基础设施开始,通过资源纳管、虚拟化以及资源切片,将资源进行分池,并且提供多租隔离的能力。同时利用网、算、存一体化的调度,屏蔽底层异构的资源以及物理位置,根据业务特性、终端位置和资源状态,进行协同调度,在保障业务低延时、高可用的同时,实现业务对计算、存储和连接的位置无感。

应用场景较为广泛,比如在安防、交通物流等摄像头上云场景,设备/流媒体接入和处理会综合考虑节点算力、网络带宽和存储容量等状态,就近选取最匹配的节点,节点位置更靠近内容的生产端,也就是视图终端。而云游戏等场景,需要特定的渲染计算资源(如ARM板卡),同时也更靠近内容的消费端(手机端),当需要多人观战直播时,又可以推流到CDN网络进行分发和异地观看。

视图计算云-边-端协同架构

肖文鹏表示,云、边、端一体化的协同架构是视图计算的核心,也是未来边缘计算的发展趋势。
image.png

终端设备负责视图内容的生产、采集以及上传,同时一些瘦终端也会负责视图的解码和播放。

视图计算基于广覆盖的边缘节点构建了分布式接入网关,能够与视图终端快速构建安全、低延迟的双向通道,实现了多样化的终端上云能力。同时也支持视频以及图片的快速上传。这些视图内容会在边缘就近进行周期性存储。同时也会与计算联动,在同节点或者临近节点内进行计算,如录制切片、AI处理等。计算的结果如AI序列化数据、有效视频片段等,通过云边安全、可靠的回云通道,实现快速回云。节点资源也会根据水位进行弹性伸缩,同时节点间也会进行协同和灾备。

视图计算会在中心进行统一的节点以及视图管理,同时进行一体化的服务编排以及Meta汇聚。视图终端会在中心映射为一个影子设备,对影子设备的操作,都会通过信令通道快速的下发到终端执行并得到反馈。
通过云、边、端的协同,用户不需要再关心云的具体位置,从而实现只有一个交互面,给用户一朵云的体验。

位置无感的多点协同计算

image.png

在计算方面,视图计算经过多样化的场景积累和打磨,提供了三种典型的计算能力。

第一种是基础计算,主要面向直点播场景,它包含转码、录制、截图等。通过对编码器的优化,在相同画质下尽可能降低码率,实现窄带高清。同等画质可节省20%-40%的带宽以及存储空间。

第二种是视图AI计算。结合达摩院在视觉算法上积累,视图计算提供各种场景化、结构化的AI分析能力,如移动侦测、人脸识别、事件监测等。

第三种是自定义计算。视图计算打破自身计算边界,允许用户自主上传算子进行托管,用户可根据自身业务按需申请算力,极大降低业务接入成本。

这些计算最大的特征是算随网动。计算随着数据的流动而展开,在每个流转节点进行数据卸载和分流计算,避免全量数据回云,实现中心算力的下沉以及终端算力的上移。同时,由于计算节点更靠近终端,在计算时延、响应速度等方面,都会有大幅提升。另外也避免的大量数据的回云,比如互联网直播场景,对于80%无人或者极少人观看的冷流,可以在边缘直接收敛,从而极大降低回云带宽。

可自定义的场景计算

在很多场景下,用户可能已经拥有了自己的算子或者应用,这些可能是自研,也可能来自第三方。视图计算提供了可自定义的场景计算能力,用户可将算子托管到视图计算。
image.png

肖文鹏以云游戏为例讲解道,游戏包就是一种算子或应用。游戏厂商上传游戏包后,会在云端发起算子托管的流程,视图计算会内部对应用进行审核并加入应用市场。

下一步配置好渲染规格后,云端会进行兼容性适配,同时进行算力评估来计算所需的资源。

接下来会进行算子的编排以及部署,这时候,用户无需关心计算资源的生产和管控,视图计算会实现资源的弹性伸缩和多维度的负载均衡,并且保证就近接入。其中为了资源复用率的提升,视图计算也会尽可能的将不同计算进行混跑。

当游戏开始运行的时候,我们也会实时的对任务进行画像分析,动态校准资源消耗。比如游戏的接入人数、不同的分辨率、码率和输出规格等,都会一定程度上影响实际的资源消耗,整体的算力是动态上下浮动的,实时的动态分析和校准,可以保证调度的精准度,最终带来良好的游戏体感。

这种托管的模式,使终端不再需要具备复杂的计算能力,只需要简单的播放,即可享受超强的体验。对于云厂商来说能够非常好的实现资源复用。同时对于客户来说,可以更加灵活、敏捷的进行部署和迭代,并且有效降低成本。

位置无感分布式协同存储

视图计算的另一个核心,是解决海量视图数据的存储问题。刚刚我们说到,终端上云往往具有位置分散、数据规模大、值密度极低的特点,同时还有一点就是带宽反转,上行带宽远大于下行。长期的回云会造成较大的带宽压力以及存储成本,同时最重要的一点,无法保证就近、低延迟。

视图计算提供了位置无感的分布式协同存储。全球各地的数据源都可以通过视图计算在边缘节点就近存取,存储的位置也会参考数据接入和计算的位置,确保整体亲和性。

同时,视图计算通过边缘加速网络解决了跨地域、跨运营商上传延迟大、速度慢等问题,实现了回云的中转加速,提供了高可靠的回云通路。

依靠新的协同存储,我们可以将终端产生的大量视图数据周期性的存储在边缘,比较典型的如摄像头的周期录像。同时依靠与计算相结合,我们可以将我们所关心的关键视频片段以及AI分析等序列化的结果进行回云,并长期保存。

分布式协同存储平台

在整体架构上,通过边缘统一网关进行异构资源的适配,不管是从API、SDK还是授权体系,完全兼容现有的使用方式,这对于海量的存量设备来说,只需要简单配置,便可以快速将视图数据上传到协同存储,从而确保给用户云边一体化的使用体验,并且整体传输速度提升40%以上。
image.png

基于多点协同调度的能力,它实现了视图数据的就近存取,并且复用CDN场景下闲置的上行带宽,从而最大限度的利用带宽资源。同时它可以快速的根据单点水位进行资源动态规划以及数据复制和迁移,实现服务的高可用和数据的高可靠,整个过程用户无感知。

同时阿里云搭建了可靠、安全的数据回云通路,可以按需在闲时将数据中转回云,从而实现数据的分级管理,用户可以灵活调整数据价值和成本之间的平衡点。

视图上云一站式PAAS服务

视图计算提供了视图上云的一站式PAAS服务,包括视图数据的采集、计算、存储以及内容消费。接下来我们将重点放到视图终端的链接部分。

肖文鹏表示,链接的重心主要在于以下两点:
第一,设备的接入和管控。如设备的录入、认证、事件采集等。同时也包含一些如语音对讲、PTZ云台、摄像头机位控制等操作。
第二,视图数据的接入和管理。如流媒体的接入、协议转换、视图上传以及内容检索等。

链接是视图上云的第一环,结合前面已经介绍过的位置无感的计算平台以及分布式协同存储,共同构成了视图上云的一整套网、算、管、存体系。链接的易用性、安全性、可靠性等因素很大程度上决定了视图上云的规模。

终端一键上云,引领行业从封闭走向开放
终端设备以及上云标的准具有多样化的特性。以安防监控领域为例,就包含国标28181、ONVIF等多种协议,同时很多设备厂商均创建了自己的私有协议,且协议相对各自封闭,这使得视图上云增加了很大的适配难度,并且安全性、兼容性无法得到保障。

为了让视图终端更加便捷的一键上云,视图计算推出了两个安全、可靠的上云通道,即信令传输通道和数据传输通道。信令通道用于实现云与终端设备的信令控制和双向通讯。数据通道用于流媒体等视图内容的接入与消费。

同时我们也推出了开放设备上云协议ODCAP。它拥有多样化的视图终端适配性,支持主流信令传输如websocket、mqtt等。同时在数据传输上,支持rtmp、HLS、webrtc等流媒体传输协议。任何支持这类协议的终端,均可快速的使用开放协议一键上云。同时我们提供了透明的双向通道,厂商和开发者也可按需自定义扩展。

在安全性以及兼容性上,我们也做了一系列增强,保证了一键上云的开放性、易用性、安全性和灵活性。通过一键上云体系,我们希望能够将之前无法上云的内容快速上云,引领这些行业从封闭走向开放。

肖文鹏在研究最后表示,目前,视图计算已经在多样化的场景下落地,持续为客户提供优质、可靠的云服务。在未来,希望能够和更多的行业伙伴一起持续探索,推动整个边缘云行业的快速发展,为客户创造更大的价值!

目录
相关文章
|
5天前
|
存储 人工智能 边缘计算
AI时代下, 边缘云上的技术演进与场景创新
本文介绍了AI时代下边缘云的技术演进与场景创新。主要内容分为三部分:一是边缘云算力形态的多元化演进,强调阿里云边缘节点服务(ENS)在全球600多个节点的部署,提供低时延、本地化和小型化的价值;二是边缘AI推理的创新发展与实践,涵盖低时延、资源广分布、本地化及弹性需求等优势;三是云游戏在边缘承载的技术演进,探讨云游戏对边缘计算的依赖及其技术方案,如多开技术、云存储和网络架构优化,以提升用户体验并降低成本。文章展示了边缘云在未来智能化、实时化解决方案中的重要性。
|
5月前
|
边缘计算 Kubernetes Cloud Native
边缘计算问题之边缘资源的不同场景对资源分配和算力如何解决
边缘计算问题之边缘资源的不同场景对资源分配和算力如何解决
98 1
|
2月前
|
边缘计算 运维 Cloud Native
阿里云基于云原生的大规模云边协同关键技术及应用荣获浙江省科学技术进步一等奖
11月22日, 2023年度浙江省科学技术奖获奖成果公布,阿里云与浙江大学、支付宝、谐云科技联合完成的基于云原生的大规模云边协同关键技术及应用获得浙江省科学技术进步一等奖。
|
2月前
|
边缘计算 监控 自动驾驶
揭秘云计算中的边缘计算:架构、优势及应用场景
揭秘云计算中的边缘计算:架构、优势及应用场景
|
3月前
|
边缘计算 人工智能 安全
阿里云边缘云连续四年蝉联第一
全球领先的IT市场研究和咨询公司IDC发布《中国边缘云市场跟踪研究,2023H2》报告,中国边缘公有云服务市场阿里云连续四年蝉联第一。
|
5月前
|
存储 边缘计算 运维
边缘计算问题之OpenYurt 对边缘计算场景中的运维难题如何解决
边缘计算问题之OpenYurt 对边缘计算场景中的运维难题如何解决
55 1
|
5月前
|
边缘计算 运维 Kubernetes
边缘计算问题之OpenYurt 适应边缘计算场景如何解决
边缘计算问题之OpenYurt 适应边缘计算场景如何解决
39 0
|
8月前
|
存储 人工智能 搜索推荐
阿里云佘俊泉:边缘云场景的探索与机遇
2024全球分布式云大会·北京站,阿里云演讲《创新涌现,边缘云场景的探索与机遇》
172 8
阿里云佘俊泉:边缘云场景的探索与机遇
|
8月前
|
存储 人工智能 边缘计算
对话阿里云佘俊泉:边缘云的持续突破和创新
2024全球分布式云大会·北京站,阿里云佘俊泉专访内容分享
130 3
|
边缘计算
阿里云最新产品手册——阿里云核心产品——边缘节点服务ENS ——边缘计算
阿里云最新产品手册——阿里云核心产品——边缘节点服务ENS ——边缘计算自制脑图界面
153 4