Salesforce数据库故障丢失5小时数据,仅仅是个案?

简介:

先来看看Salesforce是个什么公司,云计算企业中的大佬,中国区的网页是这样介绍的:

 

 

您的所有销售、服务和营销数据尽在指尖,但是有将近5小时的数据蒸发了,不好意思哈!

 

Salesforce从1999年到现在,目前Salesforce的数据中心在美国东西海岸,日本,新加坡,都柏林。Salesforce 连续多年在IDC GATNER的评比上成为最具创新企业的第一名。据Celnet雨花石(Salesforce中国区合作伙伴)创始人裘思博(Fledman)介绍,“多租户架构是Salesforce的基础。Cloud database用的是Oracle的数据库以及相关技术。在往上分为3个部分,force.com 平台、heroku、wave。”

 

整个云数据库用的是Oracle,这个Oracle云数据库是怎么丢的数据呢?

 

我们来看看国外媒体对salesforce的报道。Eweek.com 5月11日的文章说:

A Salesforce.com database is back up butnot at full capacity. The more than day-long issue left customers frustratedand 5 hours of data permanently lost.

 

面对众多客户的大量抱怨,CEO Benioff在twitter上道歉:

I am sorry for our service disruption onNA14; please email me ceo@salesforce.com so we can call you. 

Salesforce丢失近5个小时客户数据之后并没有更明确的赔偿或补偿,只是留了一个邮箱而已。

 

据说这次Salesforce发生客户数据丢失主要因数据中心停电造成,在一个大型数据中心的一次大停电之后,Salesforce客户有近5个小时的数据再也找不回来了:

"We have determined that data writtento the NA14 instance between 9:53 UTC and 14:53 UTC on May 10, 2016 could notbe restored."

 

对于2015年全财年收入53.7亿美元、日事务过13亿的Salesforce来说,数据丢失的影响无疑是巨大的,客户的数据啊。

 

据了解,造成数据丢失的原因是,宕机后工作人员希望将数据库恢复到5小时以前的状态,但不幸的是,这一操作导致了故障的发生,进而导致了数据丢失。但是,Salesforce.com的用户们没有签署SLA,这也就意味着这样的故障发生,salesforce将不会给予赔偿。当然,这个不是要讨论的重点。

 

对于使用Oracle数据库的云服务提供商来说,居然没有容灾,而是考虑用备份来恢复,而且还失败,把数据都丢了,这是令我最为惊讶的地方。咱不用谈Oracle公司提供的先进的Exadata、Oracle cloud machine、Zero data loss machine…..(如果你想了解这些先进的东西,可以文章后面留下邮箱),就是传统的解决方案也很多。

 

 

方案一:用Oracle GoldenGate(或者同类产品)

 

 

我们在全国许多银行、交通、电信运营商已经成功实施、稳定运行5年以上了,最大的库每日单库日志增量1T左右。做好的秘诀是做好变更管控,每个月做切换演练。我知道很多企业做了之后,维护不好,然后数据不一致,最终成为摆设的。

 

方案二:用Oracle Active Data Guard(11g以后的版本适用)

 

 

适用ADG的好处是,不太需要关心源端的变更,而且是物理级别的复制,而且可以适用延迟恢复。事实上,如果条件允许,我们建议最好的容灾方案是ADG+OGG。

 

这些技术,对于现在的DBA或者说服务公司来说,都是小儿科了。重点的重点是流程,要投入资源保证灾备的可用、可靠:

 


 

Salesforce的遭遇显然不是个案,只因为她是云服务商中亭亭玉立(17岁)的一位,知名度大,所以为众人所知。君不见,微信群里经常会出现某某公司又在做非常规恢复了的消息。

 

如果你的数据库还没有做容灾或者没有做好,马上关注公众号:dbaplus,免费学习、咨询切磋~

 

作者介绍  杨志洪

  • 【DBAplus社群】联合发起人,新炬网络首席布道师;

  • 数据管理专家,拥有十余年电信、银行、保险等大型行业核心系统Oracle数据库运维支持经验,掌握ITIL运维体系,擅长端到端性能优化、复杂问题处理。现主要从事数据架构、高可用及容灾咨询服务;

  • Oracle ACE、OCM、《Oracle核心技术》译者。


本文来自云栖社区合作伙伴"DBAplus",原文发布时间:2016-05-14

目录
相关文章
|
1月前
|
存储 人工智能 Cloud Native
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
在9月20日2024云栖大会上,阿里云智能集团副总裁,数据库产品事业部负责人,ACM、CCF、IEEE会士(Fellow)李飞飞发表《从数据到智能:Data+AI驱动的云原生数据库》主题演讲。他表示,数据是生成式AI的核心资产,大模型时代的数据管理系统需具备多模处理和实时分析能力。阿里云瑶池将数据+AI全面融合,构建一站式多模数据管理平台,以数据驱动决策与创新,为用户提供像“搭积木”一样易用、好用、高可用的使用体验。
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
|
23天前
|
存储 监控 数据处理
flink 向doris 数据库写入数据时出现背压如何排查?
本文介绍了如何确定和解决Flink任务向Doris数据库写入数据时遇到的背压问题。首先通过Flink Web UI和性能指标监控识别背压,然后从Doris数据库性能、网络连接稳定性、Flink任务数据处理逻辑及资源配置等方面排查原因,并通过分析相关日志进一步定位问题。
153 61
|
8天前
|
存储 Oracle 关系型数据库
数据库数据恢复—ORACLE常见故障的数据恢复方案
Oracle数据库常见故障表现: 1、ORACLE数据库无法启动或无法正常工作。 2、ORACLE ASM存储破坏。 3、ORACLE数据文件丢失。 4、ORACLE数据文件部分损坏。 5、ORACLE DUMP文件损坏。
41 11
|
1月前
|
SQL 关系型数据库 数据库
国产数据实战之docker部署MyWebSQL数据库管理工具
【10月更文挑战第23天】国产数据实战之docker部署MyWebSQL数据库管理工具
127 4
国产数据实战之docker部署MyWebSQL数据库管理工具
|
21天前
|
关系型数据库 MySQL 数据库
GBase 数据库如何像MYSQL一样存放多行数据
GBase 数据库如何像MYSQL一样存放多行数据
|
1月前
|
关系型数据库 分布式数据库 数据库
云栖大会|从数据到决策:AI时代数据库如何实现高效数据管理?
在2024云栖大会「海量数据的高效存储与管理」专场,阿里云瑶池讲师团携手AMD、FunPlus、太美医疗科技、中石化、平安科技以及小赢科技、迅雷集团的资深技术专家深入分享了阿里云在OLTP方向的最新技术进展和行业最佳实践。
|
2月前
|
人工智能 Cloud Native 容灾
云数据库“再进化”,OB Cloud如何打造云时代的数据底座?
云数据库“再进化”,OB Cloud如何打造云时代的数据底座?
|
2月前
|
存储 Oracle 关系型数据库
数据库数据恢复—Oracle ASM磁盘组故障数据恢复案例
Oracle数据库数据恢复环境&故障: Oracle ASM磁盘组由4块磁盘组成。Oracle ASM磁盘组掉线 ,ASM实例不能mount。 Oracle数据库故障分析&恢复方案: 数据库数据恢复工程师对组成ASM磁盘组的磁盘进行分析。对ASM元数据进行分析发现ASM存储元数据损坏,导致磁盘组无法挂载。
|
2月前
|
SQL 存储 关系型数据库
数据储存数据库管理系统(DBMS)
【10月更文挑战第11天】
132 3
|
3月前
|
JavaScript Java 关系型数据库
毕设项目&课程设计&毕设项目:基于springboot+vue实现的在线考试系统(含教程&源码&数据库数据)
本文介绍了一个基于Spring Boot和Vue.js实现的在线考试系统。随着在线教育的发展,在线考试系统的重要性日益凸显。该系统不仅能提高教学效率,减轻教师负担,还为学生提供了灵活便捷的考试方式。技术栈包括Spring Boot、Vue.js、Element-UI等,支持多种角色登录,具备考试管理、题库管理、成绩查询等功能。系统采用前后端分离架构,具备高性能和扩展性,未来可进一步优化并引入AI技术提升智能化水平。
毕设项目&课程设计&毕设项目:基于springboot+vue实现的在线考试系统(含教程&源码&数据库数据)