某国内知名公有云厂商因为低层硬件问题,导致一个客户的数据永久性丢失,这两天在网上传沸沸扬扬,互联网再次掀起了关于企业把数据放在公有云上是否安全的问题讨论。
新闻热点总是很快成为“明日黄花”,虽然此次事件已经进入尾声,但是对事件中客户的影响却是致命而长远的,我们应该以此为戒,敲响警钟。
随着云计算对大数据能力的释放,以及AI理念对大数据未来方向的指引,越来越多的企业已经接受 “让数据产生价值” 的理念,重视数据对企业未来发展的战略意义。如果说数据是流淌在企业中的血液,那 “数据安全” 就是血液中的血小板,帮助企业抵御来自外部的各种威胁。数据安全包括完整性、可用性、隐私性三个维度,一般来说,数据可用性受损,是因为数据由于被攻击、物理故障等问题而最终导致数据不可使用的结果。企业日常运维工作中,为了避免重要数据因服务器病毒(如去年很火的勒索病毒)、机房故障(本次磁盘故障)等意外问题,导致数据永久性丢失,运维工程师常常会通过各类技术手段,来避免各类灾难的发生,从而保障云端保障数据的可用性,常用措施一般有冗余和备份两种形态。
今天袋鼠云 云服务团队,将结合本次事件中涉及到的数据可用性这个重要指标,来和大家分享基于阿里云架构,如何保护我们的数据不再受伤。
普及点1:让云端同城多机房成为架构标配。
在讲同城多机房架构之前,先要理解两个基础架构名词,Region和Zone。
-
Region是云服务商提供云计算服务的城市位置。一般一个Region会覆盖一片区域,比如阿里云的华北1、华南1区域。
-
Zone是一个Region下,电力和网络独立,软件故障隔离的物理数据中心,在阿里云上称为可用区。
阿里云同一个region下的不同zone之间内网是互通的,将资源创建到同一个可用区,可获得更低的通讯延时。所以在选择购买云资源的时候,可以多选择几个可用区,将一个业务模块部署在到多个可用区,建立高可用应用架构;这样可以避免在物理机极端故障下,数据无法找回的情况,这是云端区别于传统IDC的天然优势,一定要用起来。
普及点2:数据备份是数据可用性的底线。
数据备份是数据可用性的一个重要因素,但是很多企业认为“云计算提供商应该默认给我提供备份服务”,殊不知这是一种高度危险的思想误区。
阿里云的大多数常用产品都带有备份功能,比如ECS的快照功能、RDS的基础备份等,都能帮助客户最大程度避免数据丢失的问题。但是光有产品层的备份功能还不够,如果是核心的生产数据,必要情况下需要在异地或者本地进行一次备份,此外,工程师还必须定期对备份文件进行恢复演习,从而来验证备份的有效性。一但数据可用性的底线破了,技术再强的工程师也无回天之力。
针对这次云端故障事件,袋鼠云CTO江枫评论:“在没有惨痛的事故教训之前,很难下决心在看不见业绩的地方投入成本,这是很难改变的惯性思维”。
今天我们以旁观者的角色来看待这次互联网故障事件,我们很幸运“噩运”没有降临到我们身上,云厂商因为硬件故障,导致客户数据有损失,确实是有错在先,但是我们做为最终用户也应该以此为戒。云厂商通过提供各类便捷的架构搭建、备份功能,来体现自身服务专业性,但是我们不能依靠云厂商来解决所有的数据安全问题,数据安全最终还是需要用户来为自己负责——因为最终,数据丢失的后果还是用户自己承担。
袋鼠云 云服务团队建议通过架构冗余+日常备份+运维管理等多个维度,去保护我们自己来之不易的数据资产,也希望企业的管理者多关注这方面的经验积累。
袋鼠云 云服务简介:
袋鼠云服务团队在云端架构和业务连续性保障有深入的理解和十余年实践经验沉淀,希望通过专业、可靠、智能的方式,帮助客户提高研发效率、减少运维故障和风险,提高技术保障能力。