大数据时代下的备份与恢复革命

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

【51CTO.com快译】随着全球数据总量的爆炸式增长,我们必须改变对相关信息的保护方式。

过去五年以来,应用程序的规范已经迎来彻底转变。如今,我们需要在应用当中实现更多敏捷性、可扩展性与可用性要求。在如今这个时代,应用的主要趋势开始转向社交平台、移动设备与软件即服务(简称SaaS)。另外,其需要有能力从各种来源处获取批量数据,同时实时处理以提供背景信息或者业务洞穴能力,借此建立竞争优势。为了满足这些新型需求,企业无法再单纯依赖于传统关系型数据库。有鉴于此,一系列新型数据库系统应运而生,其本质上具备分布式与横向扩展特性,能够被部署在商用硬件之上,同时提供可协调的统一性与性能调整机制。更重要的是,为了满足敏捷性需求,云端数据库即服务模式亦得到广泛采用。

为了帮助大家理解这场分布式数据库变革的规模之大,我们整理出了以下图表,可以看到NoSQL类搜索数量正呈现出急剧上升之势。


这意味着数据保护要求已经彻底改变,且受到数据至上时代的大力推动(包括Web规模应用以及分布式数据库)。企业需要收集大量数据并从中获取有价值信息,用以带来更为可观的商业价值以及更为迅捷的决策制定能力。大部分分布式与云数据库已经提供复制功能,用于满足数据保护及可用性要求。然而,我们仍然需要解决可扩展时间点备份与恢复这一重大难题。如果没有时间点备份的支持,企业将时刻面临着因人为错误、逻辑损坏或者其它运营故障造成的数据丢失风险。

传统备份解决方案主要面向关系型数据库设计,即面向共享式存储并采用ACID事务模型。遗憾的是,这类设计无法满足分布式场景下的时间点备份要求(包括本地存储、最终一致性以及基础设施的弹性特质)。

考虑到数据库架构已经发生本质性转变,数据保护举措亦需要进行重新定义与重新设计。以下为数据保护在大数据时代下面临的新挑战:

·获取最终一致性数据库的一套持久性时间点备份副本,我们将其称为当前全新分布式时代下数据保护的“版本控制”新规范:备份到快照到复制到复制数据管理再到版本控制。

·最大程度降低故障恢复时间(即低RTO)。

·随应用程序的实际需求进行规模扩展。

·允许轻松更新测试/开发环境以实现持续开发。

·在发生故障时提供运营弹性。

·提供立足于公有云或者内部数据中心的部署灵活性。

大多数企业正在积极投资企业级时间点备份与恢复产品,从而确保自身能够安心在分布式数据库之上部署并扩展下一代应用程序。在未来五年内,各企业将重新定义数据保护技术,从而切实满足下一代应用的实际需要。

  
作者:核子可乐译
来源:51CTO
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
3月前
|
安全 关系型数据库 MySQL
揭秘MySQL海量数据迁移终极秘籍:从逻辑备份到物理复制,解锁大数据迁移的高效与安全之道
【8月更文挑战第2天】MySQL数据量很大的数据库迁移最优方案
636 17
|
5月前
|
SQL 分布式计算 大数据
MaxCompute产品使用合集之备份的数据是否分区数或记录数限制
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
存储 运维 监控
大数据数据存储的搜索引擎Elasticsearch的集群运维的集群备份
Elasticsearch是一个可扩展的搜索引擎,可以在同一个集群中部署多个Elasticsearch节点,以提高性能和可用性。
86 0
|
存储 SQL 运维
企业运维训练营之数据库原理与实践—数据库DAS简介和备份上云方案—数据上云(上)
企业运维训练营之数据库原理与实践—数据库DAS简介和备份上云方案—数据上云(上)
277 0
|
SQL 存储 运维
企业运维训练营之数据库原理与实践—数据库DAS简介和备份上云方案—数据上云(中)
企业运维训练营之数据库原理与实践—数据库DAS简介和备份上云方案—数据上云(中)
144 0
|
运维 关系型数据库 MySQL
企业运维训练营之数据库原理与实践—数据库DAS简介和备份上云方案—数据上云(下)
企业运维训练营之数据库原理与实践—数据库DAS简介和备份上云方案—数据上云(下)
118 0
|
存储 SQL 运维
大数据运维之MySQL备份及恢复
能够防止由于机械故障以及人为误操作带来的数据丢失,例如将数据库文件保存在了其它地方。 冗余: 数据有多份冗余,但不等备份,只能防止机械故障还来的数据丢失,例如主备模式、数据库集群。
324 0
大数据运维之MySQL备份及恢复
|
SQL 大数据
宝塔备份大数据sql导入本地失败 max_allowed_packet
从线上备份拉了一个备份sql压缩包,想导入到本地开发脚本测试 使用Navicat Premium(试用) 导入时,报错max_allowed_packet参数相关的错误, 原因是mysql.ini配置中,设置了相关的执行脚本的最大包,默认是2M,我导出的文件有190+M,故 执行失败
351 0
|
SQL 关系型数据库 MySQL
Linux下MySQL数据库的备份与还原,mysql快速导入导出数据库实例演示,解决mysql大数据量数据库导出慢的问题
Linux下MySQL数据库的备份与还原,mysql快速导入导出数据库实例演示,解决mysql大数据量数据库导出慢的问题
476 0
Linux下MySQL数据库的备份与还原,mysql快速导入导出数据库实例演示,解决mysql大数据量数据库导出慢的问题