自进入2010之后,云计算开始逐步取代传统基础架构,成为信息化系统的全新底座。2020年十月我曾撰写过一篇《云原生趋势下的迁移与容灾思考》(https://sunqi.site/posts/cloud-migration-dr-on-cloud-native/)详细分析了在全新基础架构下,对于用户至关重要的数据保护将发生那些改变。本文是在此基础上,结合最近两年在行业内的实践及近期国内热点事件进行更深入的分析和总结。
云平台——姓“国”还是姓“资”
就在本周(2022年7月12日),一记重磅消息在云计算圈炸翻了天。微信公众号——“国资小新”发布重磅消息《国资委召开中央企业深化专业化整合工作推进会》。
与云计算领域相关内容引人关注:
会议指出,近年来中央企业深入实施行业领域更广、参与层面更宽、精细程度更高的专业化整合,在服务国家战略、优化国有经济布局、促进实现高质量发展等方面取得显著成效。
......
中国电信引入多家中央企业战略投资者打造国家云公司,统筹开展科技创新、设施建设和安全防护体系部署,加快构建推动云原创技术生态。
其中中国电信的具体举措为
中国电信聚焦云改数转发展战略,以专业化整合为抓手,打造“一云两翼”业务集群。其中,围绕数字社会发展,引入中国电子、中国电科、中国诚通和中国国新等中央企业战略投资者,组建股权多元化的天翼云科技有限公司,积极推动中央企业云计算资源整合。通过强化与中国电子等中央企业、清华大学等知名高校联合研发,构建完整的、自主可控的云原创技术生态。整合内部资源,天翼云公司下设31省分公司,建立起健全云网一体化运营体系。目前,天翼云是全球最大的电信运营商云、国内最大的混合云,作为国家云的框架基本成型。
通过企业信息查询软件,天翼云科技有限公司仍由中国电信百分之百控股,尚未完成变更,但相信在大方向明确的情况下,一切将加速进行。
"国家云"的确定似乎也让去年沸沸扬扬的"国资云"传闻也有了某种定论。就在去年(2021年)8月12日,天津国资委《关于加快推进国企上云工作完善国资云体系建设的实施方案》第三部分重点任务第二点明确指出:
各企业已经部署在第三方公有云平台(如:”华为云“、”阿里云“、”腾讯云“、”沃云“、”天翼云“、”移动云“等)的信息系统,租约到期日起2个月内全部迁移至国资云,原则上最迟应于2022年9月30日前全部迁移至国资云。
即日起,各企业不得再与第三方公有云平台新签、续签云资源租用合同。
目前距离9月30日只有不到短短的2个月时间,不知道该政策的执行的具体情况到底如何?而国家云明确后,会不会对之前的执行有影响?会不会出现重复迁移呢?具体情况,对于外界来说都是未知数。
引发这一切变化的原因之一是在2021年初,某互联网公司悄然在海外违规强制上市,并提供大量重要民生数据。同年6月10日第十三届全国人民代表大会常务委员会第二十九次会议通过《中华人民共和国数据安全法》(http://www.npc.gov.cn/npc/c30834/202106/7c9af12f51334a73b56d7938f99a788a.shtml),其中明确:
第十四条 国家实施大数据战略,推进数据基础设施建设,鼓励和支持数据在各行业、各领域的创新应用。省级以上人民政府应当将数字经济发展纳入本级国民经济和社会发展规划,并根据需要制定数字经济发展规划。
众所周知,国有企业是关乎国计民生的重要支柱,也是各家”云商“必争之地。国家云的落地,似乎给姓”国“还是姓”资“的不确定性下了定论,中国的云计算势必会走出一条具有鲜明特色的发展道路。但是这会是中国云计算的终点吗?显然不是,政策的制定往往具有滞后性,随着技术的发展,最终形态一定还会随之变化,所以对于企业用户来说唯一不变的就是变化。为了应对这种变化,让对用户最重要的新”国有资产“——”数据“自由的流转起来,使用户更好的拥抱发展的不确定性。
混合云——保护既有投资,拥抱变化
面对变化,混合云显然是符合中国发展的一条道路。从发展的角度来看,由于过去10年间云计算的蓬勃发展,各种公有云、私有云厂商不断涌现,据不完全统计,目前正在运营的公有云至少在20朵以上,私有云的品牌数量更多。从保护企业既有投资的角度来看,企业历史对于云计算、基础架构的投资不可能随意放弃,所以混合云才是符合企业利益和国家战略的综合性基础架构。
从技术角度看,任何底座平台都无法在一夜之间被取代,要遵从系统建设规律,循序渐进。上文提到,数据流转能够让用户更加游刃有余的应对云底座的变化,那么数据在混合云之间的流动,更能有效防止新的云时代的”数据孤岛“的形成。
混合云管理的演进——从平台到工具集
2018年,Gartner曾在一篇文章中(https://blogs.gartner.com/marco-meinardi/2018/01/22/upcoming-research-cloud-management-platforms/)提及云管平台(Cloud Management Platforms)的十大模块。其中将Cloud Migration and DR作为独立的模块存在,这也是十大模块中与用户数据流转最紧密的模块之一。但是从实际项目建设中来看,由于用户早期云上数据量不大,数据流转需求不突出,所有很少能够有云管平台能够提供这样的专业服务模块。仅有少量具有前瞻性的用户看到了这一潜在的需求进行了相关实践,例如在上海证券交易所《交易技术前沿》总第四十期(2020年9月)一篇《海通证券混合金融云平台生态体系建设之云原生迁移服务》中提及了此类最佳实践,这也为其他券商在实践混合云数据流转时提供了参考。
为什么这么重要的服务,在云管平台中却不能直接提供呢?我认为有两点原因:数据量与技术门槛。先来说数据量问题,上文提到,早期的云平台由于数据量少,对于数据流转靠”人拉肩扛“的体力劳动就解决了,但是随着应用数量增多,数据量呈现爆发式增长,传统的”堆人“已经无法满足云上用户数据流转服务化的需求了。而技术门槛才是制约云管平台提供相关服务的最大障碍,众所周知,Cloud Migration和DR的技术底座一部分来源于传统的容灾技术,而另外一部分则是与云原生资源和编排技术组成。换言之,这是一个跨领域的技术结合和创新,其难度不亚于做一个云管平台,而项目交付的压力也让云管平台厂商很难有余力再进行创新。
这一点我们也从2022年4月Gartner的报告《Market Guide for Cloud Management Tooling》得到了印证(https://www.gartner.com/doc/reprints?id=1-29PBZLL4&ct=220413&st=sb&elqTrackId=adedc2cde73f4497b990cb119e448714&elqaid=7083&elqat=2)。首先一个非常显著的变化是对于云管的称谓,原来我们习惯性的将其成为Cloud Management Platform,但是在报告中将云管平台重新定义为Cloud Management Tooling,简单理解就是云管理工具集。Gartnar认为随着云管理服务的深入,一些专业的厂商致力于将服务抽象为自动化工具。在报告中我们发现,第三方专业云管理工具和原有云管平台成为平行模块,共同为MSP提供多云管理能力。同时Gartner在在Cloud Migration and DR模块中增加了Backup,也让我们所定义的“数据流转”的场景化应用得到了统一。
什么是数据流转?——广义云迁移与云容灾的底座
云迁移是一次性的业务吗?很多人都问过我这个问题,包括合作伙伴、投资机构等。我先抛出我的观点:“云迁移”按照应用目的不同分为狭义云迁移和广义云迁移。狭义的云迁移是指:上云、下云或换云等在项目中解决的问题;而广义的云迁移则是数据流转的应用模式之一,后续的衍生场景包括了云容灾、备份、东数西算等。所以从混合云发展趋势来看,云迁移绝不是一次性的需求,而是云的标准服务之一。
狭义的云迁移——基于项目需求的应用场景
先来看狭义的云迁移,在上云高峰期(2010年前),云迁移是解决“高速公路没有车跑”的最佳方式,能快速刺激底层基础架构扩容,从而弥补厂商在先期项目的损失。
但是随着时间的发展,逐步出现了各种换云的需求,这里列举一些常见的场景:
场景一,原有平台无人运维。早期云平台方案或厂商很不成熟,很多产品都是摸着石头过河,到了后期由于种种原因平台无人维护,业务裸奔,所以必须通过换云方式将业务转移。
场景二,厂商之间的竞争。这种操作,与技术无关,更多的是商业利益的考量,既然从传统客户“拉新”成本过高,那我就从其他友商拉云上的客户。当然还有一种情况,是用户本想体验“免费”的开源,但是试水后发现越来越把控不住或者性能满足不了需求,只好转为商业化方案,这种情况在云平台、云底层存储都有案例。
场景三,平台自身无法升级。这里最典型的就是OpenStack跨版本升级问题,虽然OpenStack在后期提供了升级能力,但奈何厂商版本的OpenStack大量无法提交到upstream的功能,导致根本没有办法实现升级。用户想使用新版本时,只能通过云迁移来进行原有平台替代,再将原有硬件加入资源池方式完成升级。这个问题并不是孤立的,一些商业化版本的云平台中也存在同样的问题。
下云是相对上云来说的,本质上也是换云的一种,但是通常指的是从公有云到私有云的场景,所以特别独立出来讲。公有云确实能帮助对时间属性有强烈要求的厂商加速创新,把握商机,但是随着企业发展,财报的压力势必让野蛮生长转向精细化管理,此时企业必须要考虑公有云和自建哪个便宜的问题。
在狭义的云迁移中,云迁移更像是一种被动行为,只是作为解决方案的一个环节,在这种情况下确实不具备可重复性。
广义的云迁移——基于数据流转的应用场景
广义的云迁移是以数据流转为核心,提供租户级别数据编排的云原生服务。正如Gartner定义的一样,在混合云环境中,通过数据流转能力让数据在不同平台流动,为上层提供各种应用场景,包括但不限于迁移、容灾、备份等服务。
在传统物理环境下,虽然数据也存在这样的流动的可能性,但是由于相对平台比较单一,且上层结合数据的应用较少,所以流动性意义不大。但是进入云原生时代,服务种类丰富,为用户基于数据的业务创新提供了条件。
数据流转能力要合理使用云原生存储资源,向上提供以算力或存储编排为主的应用场景。以算力编排层为例,可以在任意平台上将资源进行恢复,从而满足迁移、容灾、仿真等多种不同的应用场景。而存储编排层则为用户基于数据创新提供了通道,结合自身的各种存储接口,为上层的容器、大数据、AI平台提供数据源。
正如我在之前文章提到的,由于云原生架构的特点,数据被分散存储于各个云原生服务之中,所以数据流转平台要能够适配各种云原生服务,例如:主机、RDS、容器等。同时,合理的利用好云原生存储的特点,实现成本最优。
总结
“数据”作为重要的企业“新资产”,如何在云时代下挖掘创新甚至创造利润,是企业数字化转型中需要思考和探索的问题。数据流转能力让企业的数据在混合云中流动起来,为后续的创新提供了基础和保障。从产品开发角度看,我们身处技术飞速更迭的变革时代,云计算的发展为更多基础架构层的产品提供了新机遇,如何合理利用云原生资源的共性,并结合自身在传统领域内的技术特性,是产品成功的关键。本文主要从中国云计算发展的趋势,对数据在混合云中的应用方式进行预测和解读。结合Gartner对云管平台定义的变化,提出了广义云迁移的设想,得到了数据流转是混合云核心能力的观点。