云栖发布|企业级互联网架构全新升级 ,助力数字创新

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
云原生网关 MSE Higress,422元/月
简介: 云原生产品家族全面升级,让业务技术团队有了更多选择,通过简单、丰富、开放和低成本的 PaaS 服务,帮助企业客户更简单、更高效的进行在云上创新,搭建更符合业务需要和团队情况的技术体系。

作者|白玙


在 2021 杭州·云栖大会现场,阿里云智能云原生应用平台产品负责人李国强以《企业互联网架构转型之道 - 阿里云中间件升级发布》为主题,全面解读阿里云云原生产品创新实践。过去一年中,为应对愈发激烈的行业竞争,重构应用架构已成为大势所趋,据权威机构数据显示,80% 以上的用户已使用或计划使用微服务,超过 68% 的机构在生产环境中使用容器。85% 以上用户使用分布式追踪,监控工具,日志。这些变化都凸显出企业对于应用架构云原生化、部署运维云原生化、稳定性升级的强烈诉求。


1.jpg


阿里巴巴集团作为云原生受益者,通过云原生充分获得云计算技术红利,并实现全球最大规模的云原生实践,所有业务 100% 跑在公共云上,应用 100% 云原生化。基于容器软硬一体优化,在线业务部署百万容器规模,带来 CPU 资源利用率提升 30%、万笔交易成本下降 80%、研发运维效率提升 20% 的技术价值。也是基于此,阿里巴巴将这些最佳实践、解决方案分享给社会,帮助税务、人社、银行、保险、石油石化、零售快消、汽车制造、互联网平台等众多行业挖掘更多社会价值。经过多年技术沉淀,阿里云提供超过 300 款云产品、近千个解决方案。在这其中,消息队列 MQ、应用实时监控服务 ARMS、企业级分布式应用服务 EDAS 等已经成为不少企业在分布式互联网架构中必不可少的组件。而此次云栖大会也首次对外曝光了这些产品的全新特性。


2.png


RocketMQ5.0 重磅升级


消息队列作为当代应用的通信基础设施,微服务架构应用的核心依赖,通过异步解耦能力让用户更高效地构建分布式、高性能、弹性健壮的应用程序。就数据与价值角度而言,消息队列的价值不断深化。消息队列中流动的业务核心数据涉及集成传输、分析计算和处理等不同环节与场景。伴随着不断演进,我们可以预见消息队列势必在数据通道、事件集成驱动、分析计算等场景不断产生新价值,创造新的“化学反应”。


3.png


此次,阿里云 RocketMQ 发布 5.0 版本全面升级为一站式“消息、事件、流”融合处理平台,并具备以下两大亮点:


(1)消息核心场景扩展:覆盖事件驱动与消息流式处理等众多场景;

(2)一站式融合处理技术架构迭代:实现一份消息存储支持流式计算、异步投递、集成驱动等多种场。


除去两大亮点的同时,RocketMQ5.0 带来全新三大功能:


(1)RocketMQ 基础架构全新升级

  • 轻量版 SDK 的开放和全链路可观测系统的提升
  • 消息级负载均衡
  • 多网络访问支持
  • 海量分级存储

(2)在 Streaming 流式处理场景推出轻量级消息 ETL 功能

  • 轻量无依赖
  • 开发门槛低
  • Serverless 弹性

(3)EDA 云上最佳实践——事件中心 EventBridge

  • 统一标准化的事件集成生态
  • 全球事件互通网络
  • Serverless 低代码开发


微服务产品家族再升级


微服务作为如今应用互联网架构重要代表,随着微服务与容器不断融合,可以看到企业对于微服务应用架构与业务要求不断明晰。架构方面,如 Spring Cloud、Dubbo 基于 Java 的微服务体系,以及随着多元趋势出现而逐渐兴起的 Service Mesh 技术体系成为主流。需求方面,业务开发设计面向微服务、软件基础架构原生容器化、应用生产运维升级鸟瞰式成为核心诉求。阿里云通过是微服务引擎 MSE、服务网络 ASM 去完美支撑这两类不同微服务体系。


4.png


虚拟化时期的微服务架构下,业务通常采用流量网关 + 微服务网关的两层架构,流量网关负责南北向流量调度和安全防护,微服务网关负责东西向流量调度和服务治理,而在容器和 Kubernetes 主导的云原生时代,Ingress 成为 Kubernetes 生态的网关标准,赋予了网关新的使命,使得流量网关 + 微服务网关合二为一成为可能。


此次,阿里云 MSE 发布的云原生网关在能力不打折的情况下,将两层网关变为一层,不仅可以节省 50% 的资源成本,还可以降低运维及使用成本。MSE 云原生网关依托于 Envoy 和 Istio 进行构建,实现了统一的控制面管控,并直连后端服务,支持了 Dubbo3.0、Nacos,打通阿里云容器服务 ACK,自动同步服务注册信息。


MSE 云原生网关早已在阿里巴巴内部经历千锤百炼。目前已经在支付宝、钉钉、淘宝、天猫、优酷、飞猪、口碑等阿里各业务系统中使用,并经过 2020 双 11 海量请求的考验,大促日可轻松承载每秒数 10 万笔请求,日请求量达到百亿级别。


作为业内首个全托管 Istio 兼容的服务网格产品,阿里云服务网格(简称 ASM)作为统一管理微服务应用流量、兼容Istio的托管式平台,专注打造全托管、安全、稳定、易用的服务网格。支持跨地域多集群、多云混合云服务的统一治理,让无处不在的应用服务轻松跨多种异构计算基础设施进行相互通信。今日更是对外发布 ASM Pro 专业版,覆盖更多应用场景,主要包括:


  • 支持 Dubbo 等微服务框架与扩展协议:通过提供更多场景化能力满足客户灰度发布、金丝雀发布、服务流量无损下线、以及全链路灰度等不同诉求。
  • 全面融合多种服务注册中心:充分融合 Nacos 服务注册中心的高可用能力、跨注册中心的多语言服务互通、以及高性能、大规模场景支持。
  • 云边一体的统一服务网格能力:支持跨地域多集群、多云混合云上的服务的统一治理、支持 ACK Edge 边缘集群,探索边缘计算中服务网格的场景。
  • 优化现有应用进行现代化改造:统一支持容器、虚拟机等多种异构计算基础设施的混合部署, 助力虚拟机应用的迁移;增强 OPA 策略动态执行能力,无代码改造实现零信任安全,简化管理多种类型的计算基础设施上的应用。
  • 全栈优化:通过操作系统和软硬一体方式降低服务通信时延和加密开销,提升 TLS 加解密的效率及数据面的性能。


通过流量控制、网格观测、服务间通信安全等功能,服务网格 ASM 全方位简化服务治理,为运行在异构计算基础设施上的服务提供统一管理能力,适用于无处不在的 Kubernetes 集群、Serverless Kubernetes 集群、ECS 虚拟机以及自建集群。


最后,微服务应用在开发过程中,需要一个全站式平台覆盖应用架构设计、开发、测试、上线、运维整个体系。一站式云原生应用研发支撑对于用户的提效具备着非凡的意义。因此,云原生应用设计&开发平台 ADD 应运而生,帮助企业快速进行原生开发,以应用视角全生命周期管理云原生应用,并具备以下特性:


一、应用开发&架构设计:实现支持应用架构图的拖拉拽式设计,提供预置及企业自定义应用架构模板。

二、云原生资产商店:为企业提高开箱即用的中间件服务,并沉淀企业的公共业务组件、公共技术中间件,实现企业软件资产的标准化、产品化、分享和复用。


与此同时,企业级分布式应用服务 EDAS v4.0,重新构建用户应用发布与上线的整个流程,实现鸟瞰式运维以及双模治理,助力应用运维现代化,加速在线业务云原生化。


ARMS 3.0 - 企业可观测体系 All in one


作为企业技术架构中的重要组成部分,不同社区、机构对于可观测领域的趋势观点愈发收敛一致:


  • 全栈一体化:当一个请求进到业务系统,从前端到应用层到固定资源上,企业如何把整个链路串联起,一体化的将纵向链路与横向数据打通,成为考验运维团队的关键能力。
  • 云原生可观测标准化:当可观测开源领域 Grafana、Prometheus、OpenTelemetry成为事实标准,企业搭建云原生可观测体系更加高效、有迹可循。
  • AIOps:随着每个企业技术不断扩张,其拥有的运维数据规模与维度不断增加,包括海量指标、logging 以及 tracing数据。AI 在这过程中发挥巨大作用,更快速、更高效的发现、解决异常及问题。


5.png


为了满足以上趋势与需求,阿里云发布 ARMS 3.0,帮助企业实现可观测体系 All in one,实现统一接入、统一指标、统一链路、统一计量、统一面板、统一告警。


  • 支持 50+ 技术组件,从接入体验、业务应用到基础设施层纵向全链路打通;
  • Metric,Logging,Tracing 横向打通,加速问题诊断;
  • 全面支持 Prometheus、Grafana、OpenTelemetry 云原生可观测三大开源标准;
  • 支持接入 10+ 监控告警系统接入,实现离散告警消息的统一管理,同时结合算法与阿里经验,提供智能降噪和根因分析能力。


值得一提是,阿里云凭借 ARMS 成为国内唯一入选《2021 年 Gartner APM 魔力象限》的云厂商,产品能力和战略愿景获得 Gartner 分析师高度认可。


高可用


高可用家族中的应用高可用服务 AHAS 也进行了一次重大的产品升级,应用高可用服务(Application High Availability Service)专注于提高应用及业务的高可用能力,主要提供流量防护、故障演练、多活容灾三大核心能力。此次升级各模块都在为用户业务的稳定性和韧性方面有了很大的产品提升。


首先在流量防护方面,创新性的提供集群防护功能,帮助客户解决业务单机流量不均、集群小流量等典型集群流控问题。同时网关防护场景下,目前已经支持基于 C/C++ 原生版本的 nginx 插件方案,稳定支持 Sentinel 核心流控及 API 归组能力的同时,性能损耗大大降低,吞吐量损耗 5% 以内,CPU 占用在 0.8 核以内。除此之外,监控告警能力和防护场景化方面都从业务场景维度和易用性维度有了较大的提升与优化。


故障演练(Chaos)是云原生混沌工程平台,提供了大规模、低成本、影响可控、形式多样化的故障演练服务。Chaos 提供一站式架构分析、故障巡检、故障注入、系统稳态度量等功能,帮助用户增强分布式系统的容错性和可恢复性,帮助系统平稳上云。此次故障演练平台也从演练场景、演练形式、易用性和开源兼容等多方面进行了全面的升级。


  • 演练场景上,支持 Windows 类型的演练节点;支持预检、断网、恢复、复盘一站式的容灾断网演练;微服务演练也升级至 2.0,支持服务级别的强弱依赖自动化验证。
  • 演练形式方面,此次重磅发布可视化演练,支持基于业务架构拓扑一键发起演练。
  • 开源兼容性方面,支持社区版在线托管至企业版,且支持一键升级至企业版。


多活容灾(MSHA)方案由业务异地多活容灾解决方案全面升级至业务多活容灾解决方案,更兼容、更稳定、更简单。


  • 兼容更丰富的容灾架构与业务组件。

新增同城双活/多活容灾架构、异地双活容灾架构和异地应用双活容灾架构。新增对 MQTT、ScheduleX、K8S、PolarDB 等组件模块的多活容灾支持。


  • 核心容灾能力加固,稳定性提升 50% 以上。

通过对接入层、服务层、消息层、任务调度层和数据层的多活容灾架构优化和加固,自上而下的的流量穿透优化,容灾能力整体稳定性提升 50% 以上。


  • 同城零改造,异地容灾改造工作量下降 20% 以上。

同城场景下,业务零改造,平均 3h 内完成同城多活容灾业务上线。异地容器业务场景下,依托 pilot 快速集成 agent,大大降低容灾改造成本。


此次全面升级,让业务技术团队有了更多选择,通过简单、丰富、开放和低成本的 PaaS 服务,帮助企业客户更简单、更高效的进行在云上创新,搭建更符合业务需要和团队情况的技术体系。

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
14天前
|
机器学习/深度学习 编解码 人工智能
超越Transformer,全面升级!MIT等华人团队发布通用时序TimeMixer++架构,8项任务全面领先
一支由麻省理工学院、香港科技大学(广州)、浙江大学和格里菲斯大学的华人研究团队,开发了名为TimeMixer++的时间序列分析模型。该模型在8项任务中超越现有技术,通过多尺度时间图像转换、双轴注意力机制和多尺度多分辨率混合等技术,实现了性能的显著提升。论文已发布于arXiv。
132 83
|
3月前
|
存储 SQL 缓存
快手:从 Clickhouse 到 Apache Doris,实现湖仓分离向湖仓一体架构升级
快手 OLAP 系统为内外多个场景提供数据服务,每天承载近 10 亿的查询请求。原有湖仓分离架构,由离线数据湖和实时数仓组成,面临存储冗余、资源抢占、治理复杂、查询调优难等问题。通过引入 Apache Doris 湖仓一体能力,替换了 Clickhouse ,升级为湖仓一体架构,并结合 Doris 的物化视图改写能力和自动物化服务,实现高性能的数据查询以及灵活的数据治理。
快手:从 Clickhouse 到 Apache Doris,实现湖仓分离向湖仓一体架构升级
|
1月前
|
人工智能 Cloud Native 算法
|
2月前
|
存储 消息中间件 人工智能
ApsaraMQ Serverless 能力再升级,事件驱动架构赋能 AI 应用
本文整理自2024年云栖大会阿里云智能集团高级技术专家金吉祥的演讲《ApsaraMQ Serverless 能力再升级,事件驱动架构赋能 AI 应用》。
148 10
|
2月前
|
分布式计算 大数据 Serverless
云栖实录 | 开源大数据全面升级:Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展
在2024云栖大会开源大数据专场上,阿里云宣布推出实时计算Flink产品的新一代向量化流计算引擎Flash,该引擎100%兼容Apache Flink标准,性能提升5-10倍,助力企业降本增效。此外,EMR Serverless Spark产品启动商业化,提供全托管Serverless服务,性能提升300%,并支持弹性伸缩与按量付费。七猫免费小说也分享了其在云上数据仓库治理的成功实践。其次 Flink Forward Asia 2024 将于11月在上海举行,欢迎报名参加。
241 6
云栖实录 | 开源大数据全面升级:Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展
|
29天前
|
机器学习/深度学习 存储 人工智能
政务部门人工智能OCR智能化升级:3大技术架构与4项核心功能解析
本项目针对政务服务数字化需求,建设智能文档处理平台,利用OCR、信息抽取和深度学习技术,实现文件自动解析、分类、比对与审核,提升效率与准确性。平台强调本地部署,确保数据安全,解决低质量扫描件、复杂表格等痛点,降低人工成本与错误率,助力智慧政务发展。
|
2月前
|
设计模式 测试技术 持续交付
架构视角下的NHibernate:设计模式与企业级应用考量
【10月更文挑战第13天】随着软件开发向更复杂、更大规模的应用转变,数据访问层的设计变得尤为重要。NHibernate作为一个成熟的对象关系映射(ORM)框架,为企业级.NET应用程序提供了强大的支持。本文旨在为有一定经验的开发者提供一个全面的指南,介绍如何在架构层面有效地使用NHibernate,并结合领域驱动设计(DDD)原则来构建既强大又易于维护的数据层。
42 2
|
2月前
|
存储 SQL 分布式计算
湖仓一体架构深度解析:构建企业级数据管理与分析的新基石
【10月更文挑战第7天】湖仓一体架构深度解析:构建企业级数据管理与分析的新基石
149 1
|
2月前
|
存储 消息中间件 运维
架构升级的救星!流量回放自动化测试的必备指南
大家好,我是小米,一名29岁的技术宅。今天分享一个物联网领域的实用技能——流量回放自动化测试。系统重构后,测试工作量巨大,本文介绍如何通过日志收集和数据回放进行自动化测试,包括离线、实时和并行回放模式,帮助快速定位Bug,提升测试效率和系统稳定性。欢迎关注我的微信公众号“软件求生”,获取更多技术干货!
61 3
|
2月前
|
存储 SQL 缓存
Apache Doris 3.0 里程碑版本|存算分离架构升级、湖仓一体再进化
从 3.0 系列版本开始,Apache Doris 开始支持存算分离模式,用户可以在集群部署时选择采用存算一体模式或存算分离模式。基于云原生存算分离的架构,用户可以通过多计算集群实现查询负载间的物理隔离以及读写负载隔离,并借助对象存储或 HDFS 等低成本的共享存储系统来大幅降低存储成本。
Apache Doris 3.0 里程碑版本|存算分离架构升级、湖仓一体再进化