阿里云发布国内首个混合云大数据双活容灾服务

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
对象存储 OSS,内容安全 1000次 1年
简介: 阿里云发布了国内首个混合云大数据集群双活容灾产品-混合云容灾服务下的大数据容灾服务(HDR for Big Data),采用业界领先的数据双向实时复制技术,HDR for Big Data可以实现Hadoop集群双活和准0 RPO容灾,为大数据灾备制定了全新的标准。

在6月上旬举行的云栖大会上海峰会上,阿里云发布了国内首个混合云大数据集群双活容灾产品-混合云容灾服务下的大数据容灾服务(HDR for Big Data,简称 HDR-BD),并已经在7月份开始邀测。采用业界领先的数据双向实时复制技术,HDR-BD可以实现Hadoop集群双活和准0 RPO容灾,为大数据灾备制定了全新的标准。

常见Hadoop灾备技术的挑战

当前比较常见的Hadoop集群灾备方式是用distcp将数据定期复制到一个备用集群做容灾用途,或者将数据复制到只读集群、二级存储作为备份。这些方案都有明显弱点:

  1. RPO大:distcp 的原理决定了期数据复制不能是实时的,用户必须承受小时到天级的RPO
  2. RTO长:主站宕机后,将只读集群或二级存储中的数据恢复出来会占用大量时间,而拉起standby集群重新启动业务依然是一个耗时的操作
  3. 资源浪费:灾备集群平时处于备用状态,不能用于运行业务
    以上这些问题长期困扰着Hadoop集群的用户和管理员们,大数据集群的灾备领域亟需一种全新的技术来彻底解决目前的困境。HDR- BD此次带来的双向实时复制技术可以在两个Hadoop集群之间建立双活架构,RPO接近0;RTO因为数据随时可读写而极大压缩;双活架构可以让两个集群运行不同的应用,避免资源浪费。这些特性将Hadoop灾备标准提高到了一个全新的高度,为Hadoop用户带来了极高的价值。

HDR-BD的使用场景

image

在自建数据中心和阿里云之间部署HDR-BD服务器配对,用户就可以将自建Hadoop集群与阿里云无缝集成,充分利用阿里云EMR和OSS建立极为高效的Hadoop灾备、迁移系统。HDR-BD可以满足的核心场景包括:

  1. 近0 RPO Hadoop云容灾
    将自建Hadoop集群的数据实时复制到阿里云EMR集群,实现接近0 RPO的Hadoop集群容灾。
  2. Hadoop集群与阿里云EMR集群双活
    在自建Hadoop集群和阿里云EMR集群之间建立数据双向复制。两个集群共享一份数据,但是运行不同的应用,实现集群双活,达到资源的最大化利用。
  3. Hadoop数据实时备份,迁移上云
    云上HDR-BD服务器可以直连至阿里云对象存储OSS。在无需EMR集群的情况下,HDR for Big Data可以将Hadoop数据实时复制到阿里云OSS,实现接近0 RPO的云备份;同时这个机制也可以作为Hadoop数据迁移上云的理想方案。利用这个机制做Hadoop集群迁移上云,在迁移过程中无需启动EMR集群;同时迁移过程无需复杂定制化脚本开发或者复杂的业务停机规划。

HDR-BD的优势

  1. 极低RPO:数据的实时复制决定了每一个写操作都会实时复制到配对集群,RPO几乎为0
  2. 极高资源利用率:数据双向复制确保两个集群共享一份数据但运行不同应用,不会出现一个集群必须处于只读或备用状态的问题,计算资源可以充分利用
  3. 运维复杂度极低: HDR-BD实现了数据的全自动实时双向复制,无需特定复制时间窗口,也无需担心对业务的影响

阿里云此次推出的Hadoop双活容灾方案HDR-BD引入了业界领先的大数据双向复制技术,结合强大的公共云基础设施,可以满足极高要求的大数据灾备场景,为企业Hadoop集群数据保护提供了全新的选择。该服务现已开始邀测,您可以发邮件至hdr-service@alibabacloud.com , 列明您的姓名,公司名称,联系方式,大数据灾备要求,Hadoop集群版本和数据量,阿里云将在审核后联系您安排方案评估和测试。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
3天前
|
存储 人工智能 数据管理
【云故事探索】基于阿里云助力地理产业2.0落地,实现遥感数据智能化管理
中国某遥感数据服务中心借助阿里云ECS、GPU和OSS服务,成功实现了地理信息产业升级。此前,中心面临数据管理混乱、服务响应慢等问题。通过阿里云的解决方案,构建了全生命周期管理的遥感数据平台,强化了自动化、智能化的数据生产能力,提升了数据服务的准确性和及时性。此外,平台还增强了数据共享,扩大了应用范围。未来,中心计划结合AI技术,探索地理信息3.0时代,利用阿里云的人工智能平台进一步提升数据管理和应用能力。
47 1
|
1天前
|
弹性计算 人工智能 安全
蚂蚁数科MAPPIC密态计算云平台入驻阿里云计算巢,打造云上密态计算服务
阿里云计算巢新添成员——蚂蚁数科的MAPPIC密态计算云平台,旨在为企业提供安全的大数据和模型密态计算服务,促进数据资产和模型资产的挖掘。MAPPIC是融合AI和BI的隐私保护平台,支持N+接入方式和弹性计算。通过阿里云计算巢,企业能快速创建密态计算集群,降低使用门槛,同时提升业务可靠性和审计追溯能力。双方合作将加速密态计算在云上的应用,应对数据隐私和安全挑战。
蚂蚁数科MAPPIC密态计算云平台入驻阿里云计算巢,打造云上密态计算服务
|
2天前
|
弹性计算 关系型数据库 MySQL
【阿里云弹性计算】从零搭建:基于阿里云ECS的高性能Web服务部署实践
【5月更文挑战第21天】本文介绍了如何使用阿里云ECS搭建高性能Web服务。首先,注册阿里云账号购买ECS实例,选择合适配置。接着,通过SSH连接实例,更新系统并安装Apache、PHP和MySQL。创建网站目录,上传代码,配置数据库和PHP。然后,启用Gzip压缩和KeepAlive,调整Apache并发连接数以优化性能。此教程为在阿里云上构建高效Web服务提供了基础指南。
71 5
|
2天前
|
Cloud Native Java 关系型数据库
【阿里云云原生专栏】构建云原生应用:基于Spring Boot与阿里云服务的全栈指南
【5月更文挑战第21天】构建云原生应用是企业数字化转型的关键,本文提供了一份基于Spring Boot和阿里云的全栈指南。涵盖从阿里云账号注册、ECS与Docker搭建,到Spring Boot项目创建、业务代码编写和部署。此外,还介绍了如何集成阿里云OSS存储、RDS数据库服务以及ACK容器服务,助力打造高效、可扩展和易管理的云原生应用。
109 3
|
2天前
|
Cloud Native 数据管理 关系型数据库
【阿里云云原生专栏】云原生数据管理:阿里云数据库服务的分布式实践
【5月更文挑战第21天】阿里云数据库服务在云原生时代展现优势,应对分布式数据管理挑战。PolarDB等服务保证高可用和弹性,通过多副本机制和分布式事务确保数据一致性和可靠性。示例代码展示了在阿里云数据库上进行分布式事务操作。此外,丰富的监控工具协助用户管理数据库性能,支持企业的数字化转型和业务增长。
154 1
|
3天前
|
存储 弹性计算 数据库
阿里云oss备份网站数据的详细步骤
该教程指导如何使用阿里云OSS备份网站数据。首先,注册阿里云账号并购买40GB的OSS存储空间。创建Bucket,选择与服务器相同的区域和私有权限。安装阿里云OSS插件,获取AccessKey信息。在宝塔面板中设置计划任务进行网站或数据库备份,选择内网域名以节省流量。备份完成后,通过文件管理器检查OSS中是否有备份文件。下载备份文件需点击文件名,然后打开文件URL。
|
3天前
|
网络协议
阿里云服务器搭建DNS解析服务步骤
在阿里云搭建DNS解析服务,首先注册阿里云账号并购买适合的云服务器。获取服务器公网IP后,配置服务器并安装DNS软件如Bind9。接着设置DNS解析,包括定义顶级和子域名的指向。最后,通过ping测试或浏览器访问验证DNS解析功能是否正常。
|
3天前
|
存储 弹性计算 监控
【阿里云弹性计算】阿里云ECS全面解析:弹性计算服务的核心优势与应用场景
【5月更文挑战第20天】阿里云ECS是提供可伸缩计算能力的云服务,支持多种规格实例,满足不同需求。其核心优势包括灵活性、高性能、高可用性、安全性和易用性。适用场景包括网站托管、大数据处理、游戏多媒体应用及测试开发环境。通过Python示例代码展示了如何创建ECS实例,助力企业专注业务发展,简化基础设施管理。
34 5
|
3天前
|
存储 弹性计算 Kubernetes
【阿里云云原生专栏】深入解析阿里云Kubernetes服务ACK:企业级容器编排实战
【5月更文挑战第20天】阿里云ACK是高性能的Kubernetes服务,基于开源Kubernetes并融合VPC、SLB等云资源。它提供强大的集群管理、无缝兼容Kubernetes API、弹性伸缩、安全隔离及监控日志功能。用户可通过控制台或kubectl轻松创建和部署应用,如Nginx。此外,ACK支持自动扩缩容、服务发现、负载均衡和持久化存储。多重安全保障和集成监控使其成为企业云原生环境的理想选择。
137 3
|
3天前
|
SQL 分布式计算 数据挖掘
阿里云MaxCompute携手华大基因打造精准医疗应用云平台,十万基因组计算成本降低至1000美金以内
华大基因是中国最领先的基因科技公司,华大基因为消除人类病痛、经济危机、国家灾难、濒危动物保护、缩小贫富差距等方面提供分子遗传层面的技术支持。让我们结合maxcompute的技术特点,看看如何助力华大基因。
710 9