《云计算加速开源创新》——云原生驱动数据抽象与缓存加速开源技术发展

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
容器服务 Serverless 版 ACK Serverless,952元额度 多规格
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 《云计算加速开源创新》——云原生驱动数据抽象与缓存加速开源技术发展

一、 云原生对数据处理平台的影响

image.png

 

过去十年,云原生大数据人工智能系统在开源浪潮下发展迅猛,以Docker和K8S为代表的云原生技术在近些年取得了长足的发展,应用广泛,已经成为云计算的新一代重要技术。

 

以Hadoop、Spark、Flink为代表的大数据计算和存储系统已经成为大数据处理领域某种意义上的事实标准。在人工智能框架领域,以Tensorflow、PyTorch为代表的主流人工智能框架在用户的反复使用和社区的开发中也逐步成熟。

 

大数据的应用和AI的应用诞生之初面向大规模数据计算分析而设计,彼时更多的是运行在单机甚至常规固定规模的分布式集群中。

 

近些年,由于云原生平台在资源成本、扩容效率和高效部署方面的优势,越来越多的大数据和人工智能的框架已运行在云原生平台上。Gartner预测,到2023年,70%的AI的应用会以容器化的方式部署运行。Spark也在很早的版本上开始尝试与Kubernetes scheduler进行对接,拥抱云原生环境。

 

image.png

 

云原生计算架构正在重塑众多行业的服务与应用,其底部计算层面的关键技术包括计算存储分离、容器及其编排以及无服务器计算等,进一步往上诞生了很多重要的基础开源软件,比如云原生容器技术、云函数计算技术、云数据传输技术以及云原生存储技术这些方向的CNCF开源软件等。基于云原生开源软件可以构建很多云原生应用,进一步服务于各行各业的应用于服务。

 

image.png

 

云原生为数据处理平台带来了哪些优势?

 

第一,计算存储分离带来更低的扩容成本。不同应用、不同时刻对扩容存储和计算的配比都不一样,而计算存储分离的架构使得扩容变得非常灵活,成本也会更低。

第二,K8S和Docker非常好的容器及其编排技术,负载均衡变得更容易,可以灵活地对计算负载进行扩容和缩容,且可以应对不同流量。

 

第三,以函数计算为代表的轻量级的灵活计算,使得运行逻辑需要的资源变得更少,资源更轻,节约了成本,也更高效灵活。

 

image.png

 

任何计算框架都需要运行在基础设施上。

 

2012年,Hadoop技术应用较为广泛,此时大数据主要的计算引擎仅有MapReduce,底下大数据存储为HDFS,通常部署在分布式集群平台,当时也称为云平台,更接近于一个普通的集群,不易扩展。特点为计算存储要求本地化高效的并行计算,资源调度粒度通常较粗。

 

经过大数据时代的不断发展,用户对计算逻辑的处理要求越来越高,批计算已经难以满足很多场景的需求,出现了以社交网络为代表的图处理的需求、以实时消息数据流为代表的流处理的需求,以及迭代计算、机器学习等。底下的存储也不再仅限于HDFS,还有对象存储、NFS存储等。

 

总而言之,上层的计算框架和底下的数据源变得越来越丰富,并开始逐步解耦。此时,Alluxio问世,它可以对计算框架和数据源进行很好的桥接,并且实现数据统一的抽象往上层提供。框架解耦后,云平台支撑的环境的特点为支持多样化的框架,但环境维护相对复杂,不易进行弹性扩容。

如今,越来越多的应用被部署在云原生环境上,使用 K8S和Docker 来对资源进行标准化的封装和调度编排,底下的存储也变得更多样,甚至可以支持本地和公有云构建的混合存储。云原生环境下,我们对标准化数据的加速需求愈发强烈。

 

二、 云原生的标准化数据加速需求

image.png

 

数据密集型应用上云之后面临着巨大挑战。

 

第一,异构数据源带来的复杂性。用户需要管理很多数据源,存储系统也非常多样,难以实现最优的方案和最好的效果。

 

第二,计算存储分离架构下,数据密集应用需要频繁访问数据会带来IO的瓶颈,特别是算力的变化使得IO的需求不断变化,而存储分离架构难以适应。

 

第三,云原生环境不断地扩容缩容以及跨作业的运行,数据的感知和调度变得越来越更弱。

 

image.png

 

我们试图将数据看作商品,将存储看作超市,将应用看作消费者。

 

image.png

 

线上购物模式为:以客户为中心,商品贮藏在仓库,客户线上挑选商品, 由现代化物流交付商品,高效便捷、交易量更大。我们从线上购物模式中得到启发,发现云架构下缺少高速的数据物流(传输)概念。至此,云原生对于标准化数据的加速需求诞生。

 

三、 云原生数据抽象加速开源项目

 

image.png

我们设计了云原生数据抽象与加速的开源项目——Fluid。Fluid意为气流、流体,我们希望数据能够像云朵和气流一样,在云计算中心被高速运转、处理,而且可以便捷地被访问到。

 

Fluid项目建立之初需要面对三大挑战

 

云原生环境下数据访问和存储系统的配置复杂。

数据访问速率需求的动态变化。

异构环境下数据感知调度困难。

 

针对上述挑战,我们提出了三个理念,分别为数据服务抽象、数据自动加速以及数据感知,实现面向应用场景的高层数据抽象与缓存自适应配套、数据处理实时感知的数据加速弹性伸缩机制,以及数据分布感知的应用运行机制和调度优化策略。

 

image.png

 

首先,我们提供了云原生级别的数据集抽象,类似于Spark的RDD,我们将其进一步泛化到云原生平台,目前仅针对于数据集的资源特性。底下每个数据集Dataset均可对接不同的存储数据源,并提供统一的标准化访问接口。同时,会为每个Dataset绑定一个分布式缓存,为数据集定制化地进行分布式缓存的优化和参数调优。

 

image.png

 

面向IO的弹性需求,我们提出了自适应扩缩容机制,类似于TCP拥塞控制协议里的感知自适应机制。当我们感知到计算应用对数据访问的需求量变大且即将成为瓶颈时,会自动对缓存系统进行水平扩容,使得对数据访问的需求可以高效地被满足。

 

image.png

 

另外,我们还提出了数据感知的应用协同编排调度,用于感知不同作业之间依赖的数据集关系,从而进行协同编排调度。

 

比如数据集A被J1、J3、J7依赖,数据集B被J2、J6、J8依赖。如果需要以最快速度将这批作业完成,应该对作业的次序进行合理排序,使得数据集依赖的作业尽量在一起运行,而这一切的感知需要与开发者调度进行结合。

 

image.png

 

开源Fluid系统架构利用了很多k8s组件,对K8s保持了生态低侵入性,且支持很多定制化的环境系统,包括Alluxio、JindoFS、GooseFS等。

 

我们对于Fluid研究的相关工作已经汇总为论文进行了发表。

 

image.png

 

南京大学与阿里云团队、Alluxio等单位联合发起的Fluid开源项目已经进入CNCF官方沙箱,得到了云计算产业的广泛关注。

 

image.png

 

相关技术也进入国际云原生技术生态体系,推动了Fluid项目的发展。Fluid开源项目入选了CNCF LandScape,并获得中国信通院尖峰开源项目奖项。

 

image.png 

 

未来,我们计划支持更多类型的数据密集型应用运行在云原生平台上,为其提供高层的数据抽象。另外,面对不同的数据应用需求,考虑更复杂、更多样的调度,联合启动编排策略。最后,希望与更多云原生现有的调度和编排工具进行集成。

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
16天前
|
存储 人工智能 Cloud Native
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
在9月20日2024云栖大会上,阿里云智能集团副总裁,数据库产品事业部负责人,ACM、CCF、IEEE会士(Fellow)李飞飞发表《从数据到智能:Data+AI驱动的云原生数据库》主题演讲。他表示,数据是生成式AI的核心资产,大模型时代的数据管理系统需具备多模处理和实时分析能力。阿里云瑶池将数据+AI全面融合,构建一站式多模数据管理平台,以数据驱动决策与创新,为用户提供像“搭积木”一样易用、好用、高可用的使用体验。
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
|
28天前
|
Kubernetes Cloud Native 持续交付
云计算的转型之路:云原生技术的崛起与实践####
【10月更文挑战第16天】 本文深入探讨了云原生技术在现代IT架构变革中的核心作用,不同于传统概述,本摘要将聚焦于云原生如何促进企业实现敏捷开发、弹性伸缩及高效运维,通过具体案例分析展现其在实际业务场景中的创新应用,揭示这一技术趋势对企业数字化转型的深远影响。 ####
44 2
|
1月前
|
监控 安全 网络安全
云计算与网络安全:保护数据的关键策略
【9月更文挑战第34天】在数字化时代,云计算已成为企业和个人存储、处理数据的优选方式。然而,随着云服务的普及,网络安全问题也日益凸显。本文将探讨云计算环境中的网络安全挑战,并提供一系列策略来加强信息安全。从基础的数据加密到复杂的访问控制机制,我们将一探究竟如何在享受云服务便利的同时,确保数据的安全性和隐私性不被侵犯。
65 10
|
2月前
|
存储 安全 网络安全
云计算与网络安全:守护数据,构筑未来
在当今的信息化时代,云计算已成为推动技术革新的重要力量。然而,随之而来的网络安全问题也日益凸显。本文从云服务、网络安全和信息安全等技术领域展开,探讨了云计算在为生活带来便捷的同时,如何通过技术创新和策略实施来确保网络环境的安全性和数据的保密性。
|
15天前
|
存储 安全 网络安全
云计算与网络安全:保护数据的新策略
【10月更文挑战第28天】随着云计算的广泛应用,网络安全问题日益突出。本文将深入探讨云计算环境下的网络安全挑战,并提出有效的安全策略和措施。我们将分析云服务中的安全风险,探讨如何通过技术和管理措施来提升信息安全水平,包括加密技术、访问控制、安全审计等。此外,文章还将分享一些实用的代码示例,帮助读者更好地理解和应用这些安全策略。
|
23天前
|
存储 安全 网络安全
云计算与网络安全:如何保护您的数据
【10月更文挑战第21天】在这篇文章中,我们将探讨云计算和网络安全的关系。随着云计算的普及,网络安全问题日益突出。我们将介绍云服务的基本概念,以及如何通过网络安全措施来保护您的数据。最后,我们将提供一些代码示例,帮助您更好地理解这些概念。
|
1月前
|
Cloud Native 持续交付 云计算
云计算的未来:探索云原生技术的崛起与影响
【10月更文挑战第9天】 在当今数字化转型的浪潮中,云计算已成为推动企业创新和效率提升的关键力量。随着技术的进步和市场需求的演变,一种新兴的技术趋势——云原生,正逐渐崭露头角,引领着云计算进入一个全新的发展阶段。本文将深入探讨云原生的概念、核心原则、关键技术以及它如何改变企业的运营模式和业务策略。通过分析云原生技术的优势、挑战和未来趋势,我们将揭示这一技术变革背后的深层含义,以及它如何塑造未来的数字生态系统。
|
1月前
|
存储 人工智能 弹性计算
阿里云何川:云计算,为数据基础设施的建设提速|数据对话
中国信通院工业互联网与物联网研究所特别策划“数据对话”专题,旨在通过专家的深度分析和独特视角,回答社会关切话题,探讨前沿技术和应用趋势。
|
1月前
|
Cloud Native 持续交付 云计算
云端新纪元:探索云原生技术的奥秘在当今数字化时代,云计算已成为推动企业创新和增长的关键动力。随着云平台的不断成熟,云原生技术应运而生,以其独特的优势引领着一场新的技术革命。本文将深入探讨云原生的核心概念、主要特点以及它如何改变现代软件开发和部署的方式,为您揭开云原生这一神秘面纱。
云原生是一种构建和运行应用程序的方法,充分利用了云平台的弹性、分布式本质以及声明式基础设施。本文将解析云原生的十二要素,微服务架构的优势,以及容器化、持续集成与持续部署(CI/CD)等核心技术的实践应用。通过深入浅出的方式,让读者理解云原生不仅是一种技术,更是一种文化和方法论,它正在重塑软件开发流程,提高资源利用率和应用系统的可扩展性与容错性。
|
1月前
|
存储 人工智能 Cloud Native
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
阿里云瑶池在2024云栖大会上重磅发布由Data+AI驱动的多模数据管理平台DMS:OneMeta+OneOps,通过统一、开放、多模的元数据服务实现跨环境、跨引擎、跨实例的统一治理,可支持高达40+种数据源,实现自建、他云数据源的无缝对接,助力业务决策效率提升10倍。