企业IT架构云化中的七大挑战|对话阿里云MVP苏炎(中)

本文涉及的产品
公网NAT网关,每月750个小时 15CU
应用型负载均衡 ALB,每月750个小时 15LCU
网络型负载均衡 NLB,每月750个小时 15LCU
简介: IT架构云化的七项挑战看企业云平台应对挑战需要具备的能力视图

本文根据2019年4月18日,驻云科技首席架构师苏炎在【MVP时间】的分享《企业IT架构云化转型挑战与应对》整理。
戳此免费听课

苏 炎 | 阿里云MVP、驻云科技首席架构师。

**云化过程中的挑战及需要具备的能力
**

1、传统企业IT架构云化演进的三个阶段

我们再来了解传统企业IT架构云化演进的三个阶段可能遇到的挑战。

1)传统业务的云化

云平台的选型

到底是公有云还是私有云,对于80%的企业,除了集团性的企业,考虑到整个投入或者后期的运维管理的费用或者投入等,大部分企业都会选择公有云。

多云还是单云?

多云其实是一个非常明显的趋势。很多企业希望能够摆脱像类似于云服务提供商的绑架,希望能够实现多云的场景。但其实在技术实现上,还是有一些问题的。第一个问题,多云的这种应用架构或者系统架构,必然会带来多云之间的数据交互或者业务互通的成本。这些直接依赖于网络状态,存在一定的风险和不确定性因素。第二个问题,管理是一个非常大的问题。对于不同的云平台有不同的账号。每次管理要进入不同的账号,虽然有一些CMP(Cloud Management Platform,云管理平台)能够实现多云的基本管理,但某种程度上,还是很难把多云的管理很完美的结合在一起。

混合云

混合云的规划和管理需要考虑哪些因素?企业IT规划种有一部分业务是在公有云上,还有一部分业务在线下,称之为混合云模式。在这个场景下,除了统一的管理,业务的互通,还涉及整个混合云场景下数据的流动。另外,跨平台兼容也是在应用迁移或者在云化过程中遇到的一个问题。比如说线下应用可能是部署在物理机上或者(vSphere/OpenStack)。这些应用从线下环境迁到公有云上,是需要有一个迁移和转化的过程。

例如,核心的业务系统云化,最典型的例子就是SAP上云。SAP能够上云,那基本上企业的大部分业务系统都能够向云上迁移了。还有一些制造业,跟生产制造直接挂钩的MES系统也在向公有云迁移。企业将业务系统云化以后,更多的就是业务系统的打通,包括集中的运维管理、统一的监控等等。当传统业务能够实现云化以后,下一部分就是数据的云化。

2)数据能力的云化

数据的云化,不同于传统的数仓的构建。首先要考虑结构化和非结构化数据进行统一的存储、采集和管理。企业要利用云计算的弹性和云计算的容量,甚至像大数据的PaaS和SaaS的服务,能够构建云上大数据的平台。通过数据的统一接入,通过算法的支持来挖掘数据本身的价值,这个就是数据的云化。

3)云上业务创新

创新就是企业要利用云计算平台的能力来构建一个类似于通用PaaS,整个应用的PaaS,甚至于整个行业生态的服务层,它能够实现能力的积累,配合整个业务部门真正实现业务的创新。利用云计算达到事半功倍的效果。

以上是我们总结在整个云化过程中的三个阶段,具体哪些问题是企业比较关注或者也是讨论最多的?

企业云化过程中的挑战

1)云治理

大家来想一个场景,在使用云上,企业一般都会将决策下放到各个部门,这样响应的速度会很快,而且互联网场景下,企业的产品为了适应相应的市场和用户需求的变化。它需要跳出传统的合规性和安全性的管理。

同时,有些企业会使用多云,或者混合云的模式。随着云使用的加大,企业很容易发现云环境已经逐步失控了。所以管理者需要有一个最佳的实践来管理云的平台,同时不会降低产品的研发速度。因此,我们需要用云治理得模型或者策略来追踪整个企业云使用的状况。

2)缺乏专业性

以阿里云为例,云产品差不多有200种,大家对于这些产品,是否知道各个产品的使用场景,了解各个产品是用来做什么的?其实每一个云服务产品,都有特定的使用场景。像AWS、Azure、腾讯云它们的云服务的产品的数量也不会少到哪里去。这样就带来一个问题,在什么样的场景下选择最适合企业的云服务,这就变成了一个非常关键的问题。在云上云资源的使用,我们会发现其实现在云资源使用的最多的还是最基本的产品,我们熟知的五大件或者十大件,类似于像云服务器、关系型数据库、对象存储、负载均衡、弹性IP等等,这一类的产品使用量还会更多。
对于企业而言,什么样的场景使用什么样的云产品,能够最大提升企业的业务能力和产品的效能,这其实是一个非常关键的问题。对于大部分的企业而言,这一方面专业性云计算的人才,其实仍然是缺失的。

3)费用管理

企业往往低估了云资源使用的浪费,举个例子,在IDC的场景下,要构建一个应用,为了满足这个应用服务的上限,往往会把整个物理机配置的很高。比如说对一个应用,上了一台32C128G的物理机。其实在大部分的时间下,这个云服务器资源的使用量只有不到20%,只有在极端的场景下,才会达到更高的使用量。这其实对于云资源而言是一个非常大的浪费。我们可以充分的利用云资源的弹性扩缩来达到这个资源合理的调整,最大地为企业降低云资源使用的浪费,就是费用的支出,这是一种情况。

第二种情况是因为管理和对于专业知识的缺乏,带来的资源浪费。上个月,我们的一个客户,突然发现自己的账单多了一笔将近一万块钱的消费。原因是在1月份,客户为了做一个POC测试,开了一个弹性IP,他们把线下的使用经验错误的带到了云上,导致对于这个产品有错误的使用。在使用网络的时候,为了避免性能的干扰或者流量过大影响其它应用,会对它做一个带宽的限制,所以他们对弹性IP做了带宽限制。但是他们在选择产品的时候,他不是后付费按量的方式来做购买的,再限制流量上线,而是选了一个固定带宽。在云上网络资源费用还是蛮高的,一个固定带宽的弹性公网IP,这个即使你不使用,它也会去收固定的费用。一直到3月底,我们才发现这个问题,这个时候弹性公网IP已经开通了3个月,造成了差不多一万块钱的费用损失。第一,资源管理出错,没有及时发现闲置的资源。第二,对于云服务产品知识的缺乏,导致了资源的浪费。这些需要通过有效的管理手段合理的来管理这个费用。

4)云安全

很多客户都认为云安全是云服务提供商的责任。云端安全是云服务商和用户共同的责任。对于云服务商而言,他需要确保自身的技术架构没有根本性的缺陷,不会造成服务的中断,出现故障后,能够提供一定的灾备恢复技术等。另一方面,企业也确保自己在使用公有云时,登录账号使用的资产、设备、网络、数据,甚至于员工的一些操作行为都是安全的。所以说云端安全,其实是云服务提供商和用户的共同责任。

5)云迁移

讲到云迁移的话,大家觉得随着云计算技术的成熟,还有云产品使用难度的降低,会觉得云迁移的场景会变得很简单。线下服务器的应用是怎么样的、数据库是怎么样的?我到云上重新部署一套就好了。但是这样的迁移,其实是完全没有充分考虑云计算能力的。而且很多场景下,我们是要考虑整个业务的不中断。迁移上云以后,还有考虑到线下和线上业务的交互、数据的互通。迁移失败以后,我们还要考虑回滚等等。

所以,整个云迁移是一个规划、建设和运营的过程。对于一些迁移,我们还需要一些额外的支持,因为云上的环境和线下的IDC环境是有差距的。它并不是简单的一个实施部署的过程。

举个例子,大家可能碰到过SAP迁移或Exchange的迁移等等,其实都会明白这些是需要一定的知识储备的。还有像一些制造行业,有些应用系统的ISV都找不到了。对于这些应用,我们需要有一些特定的工具来实现迁移的。还有的时候,为了充分发挥出云计算的能力,我们还会涉及到应用的改造。所以对于整个云迁移的过程,从调研,POC,到实施,它整个过程,短的至少需要一到两周的时间。长的时候,可能会需要几个月甚至于需要半年的时间来完成整个迁移的计划。

6)混合云的管理

混合云的管理,包括多云管理、数据、流动、协作以及资源的配置,这些让管理就会变得很困难。大家可能会认为现在有很多CMP的产品,能够实现混合云的管理。其实要真正做到多云和混合云的管理是很困难的。为什么呢?我举个例子,一般大家知道公有云的厂商,能够开放出来的管理接口是有限的,不是所有的产品都有。就算有些产品有了,它本身也会不断的发生变化和调整,再加上产品在不断的更新迭代,单靠CMP是很难管理整个公有云,更不要说多个公有云。
第二个,线下的环境比较复杂,像一些vSphere和OpenStack的虚拟化平台,小机,存储等等,基本上你是很难做到面面俱到,一个完美的结合。
第三,应用的统一管理。在整个混合云场景下,怎么能够实现应用的容灾?怎么实现业务的互通和交互?这是一个难题。最后就是数据的统一性问题,我要保证我的数据能够在云上和云下做无缝的流动,能够做到业务无感知。
第四,统一的监控和运维。在混合云的场景下,它的监控和运维管理因为云计算的引入,也大大增加了难度。这也是为什么很多CSP的服务商比较受欢迎的原因了。IDC机房与云的运营和运维之间,还是有一定的技术差异点。

7)合规性
IT的合规性,可以说是一个非常曲折而且复杂的环境了。特别是涉及云计算的时候,它其实有很多适用的接口框架。比如说我们熟知的像用于云服务的ISO27017,还有其它的一些法规,对于我们云计算的实施提出了要求,像欧洲的GDPR和国内的网安法。虽然企业可以实现合规,但是行业的变化率、业务增长、监管的变化,意味着维持合规云是长期的一个工作和挑战。
这七个挑战是我们在跟企业的交互和企业的沟通过程中或者在整个云计算的实施过程、云平台云化的实施过程中经常遇到的最主要的问题。

云治理

云治理对于很多企业而言,特别是资深和中级的用户而言是目前遇到的一个非常大的挑战。云治理其实是一个人、流程和技术,以及基础设施安全和操作直接相关的东西。它最终是为了控制费用、提高效率和消除安全隐患。然后,它创建监控和改进的一系列策略。那么我们在定这个策略的时候,我们要考虑到几个点呢?

1)定义公司策略

业务流程和技术平台的任何改动都会给企业带来风险。云管理者的任务就是要降低这种风险。同时,减少对使用或者重新工作的一些干扰。所以云计算的要求,它不仅仅是一个技术实现。公司策略方面的一些细微的变化也会造成巨大的影响。所以在实施之前,一定要定义公司的策略。还要考虑到IT之外的一些因素。无论使用什么样的云平台,定义公司的策略都应该注重于识别和降低整个业务的风险。有了一个正确的企业策略,我们还需要一个流畅来引导策略的实现。

2)策略的基本准则

我们再来看一下定义这些策略的基本准则,也是云治理的基本准则。每一个云服务提供商都有一些通用的云治理的准则,可以作为指导来帮助制定企业的策略和管理企业工具。

成本管理。我们需要评估和监控成本,限制整个IT的支出,对于整个IT的支出,我们应该是按需增长,避免一些资源的浪费、额外资源的支出,建立一个真正的成本责任制,把成本能够更好的管控分摊到各个部门或者各个团队。

安全基线。安全性一般都是IT的重要组成部分。但是云计算的引入它带入独有的一些安全问题。许多企业受制于法规的要求,这些要求保护敏感数据,在考虑应用云化的时候,就变成了一些非常重要的有限思想。确定云环境面临的一些潜在的安全威胁,并建立解决这些威胁的流程是所有的IT安全或者网络安全团队都优先考虑的内容。安全基线它可以确保随着技术的要求和安全约束的变化,这些要求和约束能够始终如一地运用到我们的云环境中。

资源的一致性。资源的一致性侧重于环境、应用、工作负载的操作和相关的策略。IT运维团队通常会提供对应用负载资产性能的统一监控。

身份认证。身份认证就是要提供支持在安全环境中访问控制和组织的核心机制,并且在云使用的过程中采用一致的身份验证和索权应求。

第五个,快速部署。快速部署包括部署、配置和脚本可重用性。我们可以通过一些手动或者完全自动化的DevOps行为,来实现快速部署的过程。

企业云平台应对挑战需要具备的能力视图

基于这些挑战,企业需要具构建自己的能力视图。

image

最下面是云服务提供商提供的IaaS和PaaS。在这个基础之上,企业需要实施基本操作,包括云的迁移、混合云的管理、容器的管控、配置的管控以及部署管控等等。在云实施的基础之上,需要引入一些云安全的服务。需要构建自己的DevOps体系,甚至于需要做一个云的API的管理,能够帮助我们更好的使用云。

然后,需要一整套的云管理服务。云管理服务它注重的云原生技术的实现,诊断、分析、报警、容灾、性能压测以及系统架构优化等等。

最上面就是云的治理能力,包括了资源管理、服务控制、财务管控、资源优化、编排、实施规范以及安全策略等等。

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
高可用应用架构
欢迎来到“高可用应用架构”课程,本课程是“弹性计算Clouder系列认证“中的阶段四课程。本课程重点向您阐述了云服务器ECS的高可用部署方案,包含了弹性公网IP和负载均衡的概念及操作,通过本课程的学习您将了解在平时工作中,如何利用负载均衡和多台云服务器组建高可用应用架构,并通过弹性公网IP的方式对外提供稳定的互联网接入,使得您的网站更加稳定的同时可以接受更多人访问,掌握在阿里云上构建企业级大流量网站场景的方法。 学习完本课程后,您将能够: 理解高可用架构的含义并掌握基本实现方法 理解弹性公网IP的概念、功能以及应用场景 理解负载均衡的概念、功能以及应用场景 掌握网站高并发时如何处理的基本思路 完成多台Web服务器的负载均衡,从而实现高可用、高并发流量架构
目录
相关文章
|
10天前
|
人工智能 云计算 网络架构
阿里云引领智算集群网络架构的新一轮变革
11月8日~10日在江苏张家港召开的CCF ChinaNet(即中国网络大会)上,众多院士、教授和业界技术领袖齐聚一堂,畅谈网络未来的发展方向,聚焦智算集群网络的创新变革。
阿里云引领智算集群网络架构的新一轮变革
|
22天前
|
Kubernetes Cloud Native 持续交付
云端新纪元:云原生技术重塑IT架构####
【10月更文挑战第20天】 本文深入探讨了云原生技术的兴起背景、核心理念、关键技术组件以及它如何引领现代IT架构迈向更高效、灵活与可扩展的新阶段。通过剖析Kubernetes、微服务、Docker等核心技术,本文揭示了云原生架构如何优化资源利用、加速应用开发与部署流程,并促进企业数字化转型的深度实践。 ####
|
23天前
|
运维 供应链 安全
SD-WAN分布式组网:构建高效、灵活的企业网络架构
本文介绍了SD-WAN(软件定义广域网)在企业分布式组网中的应用,强调其智能化流量管理、简化的网络部署、弹性扩展能力和增强的安全性等核心优势,以及在跨国企业、多云环境、零售连锁和制造业中的典型应用场景。通过合理设计网络架构、选择合适的网络连接类型、优化应用流量优先级和定期评估网络性能等最佳实践,SD-WAN助力企业实现高效、稳定的业务连接,加速数字化转型。
SD-WAN分布式组网:构建高效、灵活的企业网络架构
|
8天前
|
Kubernetes Cloud Native 云计算
云原生技术深度解析:重塑企业IT架构的未来####
本文深入探讨了云原生技术的核心理念、关键技术组件及其对企业IT架构转型的深远影响。通过剖析Kubernetes、微服务、容器化等核心技术,本文揭示了云原生如何提升应用的灵活性、可扩展性和可维护性,助力企业在数字化转型中保持领先地位。 ####
|
9天前
|
人工智能 运维 网络架构
阿里云引领智算集群网络架构的新一轮变革
11月8日至10日,CCF ChinaNet(中国网络大会)在江苏张家港召开,众多院士、教授和技术领袖共聚一堂,探讨网络未来发展方向。阿里云研发副总裁蔡德忠发表主题演讲,展望智算技术发展趋势,提出智算网络架构变革的新思路,发布高通量以太网协议和ENode+超节点系统规划,引起广泛关注。阿里云HPN7.0引领智算以太网生态蓬勃发展,成为业界标杆。未来,X10规模的智算集群将面临新的挑战,Ethernet将成为主流方案,推动Scale up与Scale out的融合架构,提升整体系统性能。
|
8天前
|
运维 Cloud Native Devops
云原生架构:重塑企业IT的未来####
随着数字化转型浪潮的汹涌,云原生架构凭借其高度灵活、可扩展和高效的特性,正逐步成为企业IT系统的核心。本文将深入探讨云原生架构的核心要素、技术优势以及如何引领企业实现业务创新与敏捷交付。 ####
|
8天前
|
机器学习/深度学习 运维 监控
智能运维在现代IT架构中的转型之路####
【10月更文挑战第29天】 本文旨在探讨智能运维(AIOps)如何成为现代IT架构不可或缺的一部分,通过分析其核心价值、关键技术及实践案例,揭示AIOps在提升系统稳定性、优化资源配置及加速故障响应中的关键作用。不同于传统运维模式的被动响应,智能运维强调预测性维护与自动化处理,为企业数字化转型提供强有力的技术支撑。 ####
34 0
|
13天前
|
前端开发 Java 测试技术
android MVP契约类架构模式与MVVM架构模式,哪种架构模式更好?
android MVP契约类架构模式与MVVM架构模式,哪种架构模式更好?
22 0
|
5天前
|
缓存 负载均衡 JavaScript
探索微服务架构下的API网关模式
【10月更文挑战第37天】在微服务架构的海洋中,API网关犹如一座灯塔,指引着服务的航向。它不仅是客户端请求的集散地,更是后端微服务的守门人。本文将深入探讨API网关的设计哲学、核心功能以及它在微服务生态中扮演的角色,同时通过实际代码示例,揭示如何实现一个高效、可靠的API网关。
|
3天前
|
Cloud Native 安全 数据安全/隐私保护
云原生架构下的微服务治理与挑战####
随着云计算技术的飞速发展,云原生架构以其高效、灵活、可扩展的特性成为现代企业IT架构的首选。本文聚焦于云原生环境下的微服务治理问题,探讨其在促进业务敏捷性的同时所面临的挑战及应对策略。通过分析微服务拆分、服务间通信、故障隔离与恢复等关键环节,本文旨在为读者提供一个关于如何在云原生环境中有效实施微服务治理的全面视角,助力企业在数字化转型的道路上稳健前行。 ####