大数据时代下的备份与恢复革命

简介:

【51CTO.com快译】随着全球数据总量的爆炸式增长,我们必须改变对相关信息的保护方式。

过去五年以来,应用程序的规范已经迎来彻底转变。如今,我们需要在应用当中实现更多敏捷性、可扩展性与可用性要求。在如今这个时代,应用的主要趋势开始转向社交平台、移动设备与软件即服务(简称SaaS)。另外,其需要有能力从各种来源处获取批量数据,同时实时处理以提供背景信息或者业务洞穴能力,借此建立竞争优势。为了满足这些新型需求,企业无法再单纯依赖于传统关系型数据库。有鉴于此,一系列新型数据库系统应运而生,其本质上具备分布式与横向扩展特性,能够被部署在商用硬件之上,同时提供可协调的统一性与性能调整机制。更重要的是,为了满足敏捷性需求,云端数据库即服务模式亦得到广泛采用。

为了帮助大家理解这场分布式数据库变革的规模之大,我们整理出了以下图表,可以看到NoSQL类搜索数量正呈现出急剧上升之势。


这意味着数据保护要求已经彻底改变,且受到数据至上时代的大力推动(包括Web规模应用以及分布式数据库)。企业需要收集大量数据并从中获取有价值信息,用以带来更为可观的商业价值以及更为迅捷的决策制定能力。大部分分布式与云数据库已经提供复制功能,用于满足数据保护及可用性要求。然而,我们仍然需要解决可扩展时间点备份与恢复这一重大难题。如果没有时间点备份的支持,企业将时刻面临着因人为错误、逻辑损坏或者其它运营故障造成的数据丢失风险。

传统备份解决方案主要面向关系型数据库设计,即面向共享式存储并采用ACID事务模型。遗憾的是,这类设计无法满足分布式场景下的时间点备份要求(包括本地存储、最终一致性以及基础设施的弹性特质)。

考虑到数据库架构已经发生本质性转变,数据保护举措亦需要进行重新定义与重新设计。以下为数据保护在大数据时代下面临的新挑战:

·获取最终一致性数据库的一套持久性时间点备份副本,我们将其称为当前全新分布式时代下数据保护的“版本控制”新规范:备份到快照到复制到复制数据管理再到版本控制。

·最大程度降低故障恢复时间(即低RTO)。

·随应用程序的实际需求进行规模扩展。

·允许轻松更新测试/开发环境以实现持续开发。

·在发生故障时提供运营弹性。

·提供立足于公有云或者内部数据中心的部署灵活性。

大多数企业正在积极投资企业级时间点备份与恢复产品,从而确保自身能够安心在分布式数据库之上部署并扩展下一代应用程序。在未来五年内,各企业将重新定义数据保护技术,从而切实满足下一代应用的实际需要。

  
作者:核子可乐译
来源:51CTO
相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
10月前
|
存储 运维 监控
大数据数据存储的搜索引擎Elasticsearch的集群运维的集群备份
Elasticsearch是一个可扩展的搜索引擎,可以在同一个集群中部署多个Elasticsearch节点,以提高性能和可用性。
58 0
|
11月前
|
存储 SQL 运维
企业运维训练营之数据库原理与实践—数据库DAS简介和备份上云方案—数据上云(上)
企业运维训练营之数据库原理与实践—数据库DAS简介和备份上云方案—数据上云(上)
185 0
|
11月前
|
SQL 存储 运维
企业运维训练营之数据库原理与实践—数据库DAS简介和备份上云方案—数据上云(中)
企业运维训练营之数据库原理与实践—数据库DAS简介和备份上云方案—数据上云(中)
106 0
|
11月前
|
运维 关系型数据库 MySQL
企业运维训练营之数据库原理与实践—数据库DAS简介和备份上云方案—数据上云(下)
企业运维训练营之数据库原理与实践—数据库DAS简介和备份上云方案—数据上云(下)
|
存储 SQL 运维
大数据运维之MySQL备份及恢复
能够防止由于机械故障以及人为误操作带来的数据丢失,例如将数据库文件保存在了其它地方。 冗余: 数据有多份冗余,但不等备份,只能防止机械故障还来的数据丢失,例如主备模式、数据库集群。
280 0
大数据运维之MySQL备份及恢复
|
SQL 大数据
宝塔备份大数据sql导入本地失败 max_allowed_packet
从线上备份拉了一个备份sql压缩包,想导入到本地开发脚本测试 使用Navicat Premium(试用) 导入时,报错max_allowed_packet参数相关的错误, 原因是mysql.ini配置中,设置了相关的执行脚本的最大包,默认是2M,我导出的文件有190+M,故 执行失败
290 0
|
SQL 关系型数据库 MySQL
Linux下MySQL数据库的备份与还原,mysql快速导入导出数据库实例演示,解决mysql大数据量数据库导出慢的问题
Linux下MySQL数据库的备份与还原,mysql快速导入导出数据库实例演示,解决mysql大数据量数据库导出慢的问题
420 0
Linux下MySQL数据库的备份与还原,mysql快速导入导出数据库实例演示,解决mysql大数据量数据库导出慢的问题
|
分布式计算 监控 容灾
企业数据创新之旅-数据上云与备份容灾
高级技术专家张磊在2018云栖大会·上海峰会中做了题为《企业数据创新之旅 - 数据上云与备份容灾》的分享,就企业灾备的挑战、混合云备份与容灾最新发展、混合云存储数据保护全景等方面的内容做了深入的分析。
2824 0
|
存储 XML 数据库
Confluence 6 针对大数据量备份
XML 站点备份的方式只针对 Confluence 包含有几千页面的情况,XML 备份所需要的时间随着数据量的变化而增加。另外的一个问题是 XML 站点的备份将会包含上 G 的附件数据,随着数据量的增加,磁盘使用量也会显著增加。
1256 0