为什么Twitter不使用Cassandra存储Tweets(译),互联网营销

简介: 原文地址:http://highscalability.com/blog/2010/7/11/so-why-is-twitter-really-not-using-cassandra-to-store-tweets.html 当前讨论的中心是Cassandra作为NoSQL的主要产品已经被剥去了华丽的衣裳。

原文地址:http://highscalability.com/blog/2010/7/11/so-why-is-twitter-really-not-using-cassandra-to-store-tweets.html

 

当前讨论的中心是Cassandra作为NoSQL的主要产品已经被剥去了华丽的衣裳。首先是Twitter已经放弃了Cassandra,并且据说作为Cassandra诞生的地方,Facebook也已经放弃了Cassandra。NoSQL已经失败了这种论调已经充斥在了各大社区上,Cassandra已经失败了么?发展遇到阻碍是有的,但是没有失败。

(注:本文包含一个NSFW的流程图,有些人对坏话非常敏感,如果你是这样的人,请不要继续读下去了危险!这里没有裸体图,也没有其他任何东西,只有一些言辞激烈的言语。但是这些都是我一直以来最感兴趣的流程图,所以他值得!)

Twitter真的放弃Cassandra了么?根据Twitter流出的这个帖子:Cassandra at Twitter Today解释,他们使用Cassandra用于存储地理信息和分析。但是,Twitter将不会使用Cassandra存储Tweets。为什么?Twitter解释说:“这是一次战略上的变化。我们将继续维护我们原本基于Mysql的存储。我们相信,现在还没有到大规模迁移数据到一个新技术的时候。”

Twitter现在忙于各种其他的紧急事件,而没有时间去把他们原本存储在Mysql的数据迁移到Cassandra。

现在是最佳的时机向大家分享一个流程图的时候,这个流程图是我若干年前得到的。这也许很像Twitter做出决定之前的思考过程。

Flow Chart for Project Decision Making 

我每次读这个都会笑。这是事实,每个公司都会遇到如何放置资源的决定。你需要构建,购买,重新构建,扩展,挂起你的应用。一个工程师可能会觉得重新开始是正确的。但是最好的商业决定可能完全不同。

Joel Spolsky曾经发表过声明说,你永远都不要从头开始重写你的代码。还记得Netscape么?还有那么多曾经在互联网上,但是已经消失了的公司。因为他们做了这个最关键的抉择性错误,他们从头开始重写代码。

Twitter不想重蹈覆辙。这就意味着Cassandra和NoSQL的失败么?不!我认为这只是一个高明的项目计划。这实际上已经为不同的情况提供了多种平台。

Twitter已经运行的足够好了么?Brad McCarty在Twitter implements more features; ignores its broken platform中举出了很好的例子:Twitter在迁移之前应该首先架设好自己的基础设备。但是现在的问题是,Twitter有设备,但是没有核心的Tweets的引擎。直到现在,Twitter的运行状况还非常良好。因此,根据这种情况,保持Tweets的引擎继续工作,尽管他非常丑陋,然后开始把一些新的琐碎的功能迁移上去,是不是更合理呢?

这些都是无法避免的。Cassandra曾经一直都活在Facebook和早期尝试者的呵护之下。直到最近Cassandra离开家进入到这个复杂的世界,这里的用户有着各种各样非常广泛的需求。这将促使Cassandra的成熟,Cassandra需要设计需要增加的新功能,需要为已经存在的功能重新建立架构,需要告诉人们Cassandra究竟擅长做什么。这些直到现在才成为了问题。并且,对于开发者来说,选择切换到一个新的技术平台上来则意味着,他们需要学习,再学习,然后克服种种障碍。这个过程是困难的。所以我们需要考虑到关于Cassandra的问题和周围的一些产品。这就是切换到新技术上的问题,我们就像是这个空间里的一个小白鼠。

Facebook真的放弃Cassandra了么?没有!Facebook仍然有150台Cassandra云节点用于搜索,这个支撑着5亿的用户,150TB的数据,而且这些数字每天都在增长。现在,看一看Cassandra普及在其他项目或者小组的速度会是非常有趣的。什么时候会出现一门实现了Cassandra的技术?他是否会继续发展?我们都不知道,但是我们可以知道的是Facebook在未来仍然将继续使用Cassandra。

目录
相关文章
|
6月前
自适应IT互联网营销企业网站pbootcms模板
一款蓝色自适应IT互联网营销企业网站pbootcms模板,该模板采用响应式设计,可自适应手机端,适合一切网络技术公司、互联网IT行业,源码下载,为您提供了便捷哦。
60 2
|
SQL 数据采集 运维
《实时数仓助力互联网实时决策和精准营销》|学习笔记
快速学习《实时数仓助力互联网实时决策和精准营销》
252 0
|
Web App开发 监控
从AIPL到GROW,谈互联网大厂的营销分析模型
上一篇《一文看懂:搭建活动分析体系》分享以后,有小伙伴问:那做活动分析,是不是也有模型呢?答:不但有,而且很多。而且互联网大厂尤其热衷于创造新模型,以至于每年都有新词冒出来,诸如:AIPL、FAST、GROW、RISE、5A……等等,看得人头晕目眩。今天就跟大家简单聊聊这些营销模型背后的底层逻辑。
508 0
从AIPL到GROW,谈互联网大厂的营销分析模型
|
存储 缓存 搜索推荐
聊聊互联网营销的第4门功课(详细)
本文面向对互联网营销技术领域感兴趣的人群,介绍广告投放系统的背景,设计和实现
1482 0
聊聊互联网营销的第4门功课(详细)
|
数据采集 弹性计算 运维
实时数仓助力互联网实时决策和精准营销|学习笔记
快速学习 实时数仓助力互联网实时决策和精准营销
235 0
|
SQL 数据采集 运维
实时数仓入门训练营:实时数仓助力互联网实时决策和精准营销
《实时数仓入门训练营》由阿里云研究员王峰、阿里云高级产品专家刘一鸣等实时计算Flink版和 Hologres 的多名技术/产品一线专家齐上阵,合力搭建此次训练营的课程体系,精心打磨课程内容,直击当下同学们所遇到的痛点问题。由浅入深全方位解析实时数仓的架构、场景、以及实操应用,7 门精品课程帮助你 5 天时间从小白成长为大牛!
实时数仓入门训练营:实时数仓助力互联网实时决策和精准营销
|
NoSQL 搜索推荐 关系型数据库
【云栖号案例 | 互联网】客如云上云 实现精准营销服务
客如云调配有滞后性、希望提供精准的用户画像、点餐高峰时段付账缓慢或经常失败。上云后报表服务新增盈利、新增用户画像业务、顺畅支持业务峰值。
|
数据库 数据安全/隐私保护 Python
菜鸟玩GAE(Google App Engine)完全指南,互联网营销
GAE是什么?   从实用的角度说是GAE可以提供我们稳定的免费网站空间,空间支持语言是python、java,数据库是google专有的数据库,数据库和空间可以免费使用1G,超过了1G就要买了,还提供Google的带宽,这个带宽约可以支撑一月500万次访问请求,超过500万次就要买了……对于一般网站这免费的资源就足够了,另外GAE还支持域名绑定,就相当于个人买的虚拟空间一样。
3956 0
|
消息中间件 存储 弹性计算
【云栖号案例 | 互联网】品推宝营销内容与流程管理平台上云 减少开发周期
品推宝对上线时间和研发效率要求高,希望有自动备份的机制和容量和处理能力弹性扩展。上云后实现了业务高可用,最大程度保障了数据的安全。
下一篇
DataWorks