为什么Twitter不使用Cassandra存储Tweets(译),互联网营销

简介: 原文地址:http://highscalability.com/blog/2010/7/11/so-why-is-twitter-really-not-using-cassandra-to-store-tweets.html 当前讨论的中心是Cassandra作为NoSQL的主要产品已经被剥去了华丽的衣裳。

原文地址:http://highscalability.com/blog/2010/7/11/so-why-is-twitter-really-not-using-cassandra-to-store-tweets.html

 

当前讨论的中心是Cassandra作为NoSQL的主要产品已经被剥去了华丽的衣裳。首先是Twitter已经放弃了Cassandra,并且据说作为Cassandra诞生的地方,Facebook也已经放弃了Cassandra。NoSQL已经失败了这种论调已经充斥在了各大社区上,Cassandra已经失败了么?发展遇到阻碍是有的,但是没有失败。

(注:本文包含一个NSFW的流程图,有些人对坏话非常敏感,如果你是这样的人,请不要继续读下去了危险!这里没有裸体图,也没有其他任何东西,只有一些言辞激烈的言语。但是这些都是我一直以来最感兴趣的流程图,所以他值得!)

Twitter真的放弃Cassandra了么?根据Twitter流出的这个帖子:Cassandra at Twitter Today解释,他们使用Cassandra用于存储地理信息和分析。但是,Twitter将不会使用Cassandra存储Tweets。为什么?Twitter解释说:“这是一次战略上的变化。我们将继续维护我们原本基于Mysql的存储。我们相信,现在还没有到大规模迁移数据到一个新技术的时候。”

Twitter现在忙于各种其他的紧急事件,而没有时间去把他们原本存储在Mysql的数据迁移到Cassandra。

现在是最佳的时机向大家分享一个流程图的时候,这个流程图是我若干年前得到的。这也许很像Twitter做出决定之前的思考过程。

Flow Chart for Project Decision Making 

我每次读这个都会笑。这是事实,每个公司都会遇到如何放置资源的决定。你需要构建,购买,重新构建,扩展,挂起你的应用。一个工程师可能会觉得重新开始是正确的。但是最好的商业决定可能完全不同。

Joel Spolsky曾经发表过声明说,你永远都不要从头开始重写你的代码。还记得Netscape么?还有那么多曾经在互联网上,但是已经消失了的公司。因为他们做了这个最关键的抉择性错误,他们从头开始重写代码。

Twitter不想重蹈覆辙。这就意味着Cassandra和NoSQL的失败么?不!我认为这只是一个高明的项目计划。这实际上已经为不同的情况提供了多种平台。

Twitter已经运行的足够好了么?Brad McCarty在Twitter implements more features; ignores its broken platform中举出了很好的例子:Twitter在迁移之前应该首先架设好自己的基础设备。但是现在的问题是,Twitter有设备,但是没有核心的Tweets的引擎。直到现在,Twitter的运行状况还非常良好。因此,根据这种情况,保持Tweets的引擎继续工作,尽管他非常丑陋,然后开始把一些新的琐碎的功能迁移上去,是不是更合理呢?

这些都是无法避免的。Cassandra曾经一直都活在Facebook和早期尝试者的呵护之下。直到最近Cassandra离开家进入到这个复杂的世界,这里的用户有着各种各样非常广泛的需求。这将促使Cassandra的成熟,Cassandra需要设计需要增加的新功能,需要为已经存在的功能重新建立架构,需要告诉人们Cassandra究竟擅长做什么。这些直到现在才成为了问题。并且,对于开发者来说,选择切换到一个新的技术平台上来则意味着,他们需要学习,再学习,然后克服种种障碍。这个过程是困难的。所以我们需要考虑到关于Cassandra的问题和周围的一些产品。这就是切换到新技术上的问题,我们就像是这个空间里的一个小白鼠。

Facebook真的放弃Cassandra了么?没有!Facebook仍然有150台Cassandra云节点用于搜索,这个支撑着5亿的用户,150TB的数据,而且这些数字每天都在增长。现在,看一看Cassandra普及在其他项目或者小组的速度会是非常有趣的。什么时候会出现一门实现了Cassandra的技术?他是否会继续发展?我们都不知道,但是我们可以知道的是Facebook在未来仍然将继续使用Cassandra。

目录
相关文章
|
3月前
自适应IT互联网营销企业网站pbootcms模板
一款蓝色自适应IT互联网营销企业网站pbootcms模板,该模板采用响应式设计,可自适应手机端,适合一切网络技术公司、互联网IT行业,源码下载,为您提供了便捷哦。
36 2
|
SQL 数据采集 运维
《实时数仓助力互联网实时决策和精准营销》|学习笔记
快速学习《实时数仓助力互联网实时决策和精准营销》
231 0
|
Web App开发 监控
从AIPL到GROW,谈互联网大厂的营销分析模型
上一篇《一文看懂:搭建活动分析体系》分享以后,有小伙伴问:那做活动分析,是不是也有模型呢?答:不但有,而且很多。而且互联网大厂尤其热衷于创造新模型,以至于每年都有新词冒出来,诸如:AIPL、FAST、GROW、RISE、5A……等等,看得人头晕目眩。今天就跟大家简单聊聊这些营销模型背后的底层逻辑。
478 0
从AIPL到GROW,谈互联网大厂的营销分析模型
|
数据采集 弹性计算 运维
实时数仓助力互联网实时决策和精准营销|学习笔记
快速学习 实时数仓助力互联网实时决策和精准营销
213 0
|
存储 缓存 搜索推荐
聊聊互联网营销的第4门功课(详细)
本文面向对互联网营销技术领域感兴趣的人群,介绍广告投放系统的背景,设计和实现
1347 0
聊聊互联网营销的第4门功课(详细)
|
SQL 数据采集 运维
实时数仓入门训练营:实时数仓助力互联网实时决策和精准营销
《实时数仓入门训练营》由阿里云研究员王峰、阿里云高级产品专家刘一鸣等实时计算Flink版和 Hologres 的多名技术/产品一线专家齐上阵,合力搭建此次训练营的课程体系,精心打磨课程内容,直击当下同学们所遇到的痛点问题。由浅入深全方位解析实时数仓的架构、场景、以及实操应用,7 门精品课程帮助你 5 天时间从小白成长为大牛!
实时数仓入门训练营:实时数仓助力互联网实时决策和精准营销
|
NoSQL 搜索推荐 关系型数据库
【云栖号案例 | 互联网】客如云上云 实现精准营销服务
客如云调配有滞后性、希望提供精准的用户画像、点餐高峰时段付账缓慢或经常失败。上云后报表服务新增盈利、新增用户画像业务、顺畅支持业务峰值。
|
消息中间件 存储 弹性计算
【云栖号案例 | 互联网】品推宝营销内容与流程管理平台上云 减少开发周期
品推宝对上线时间和研发效率要求高,希望有自动备份的机制和容量和处理能力弹性扩展。上云后实现了业务高可用,最大程度保障了数据的安全。
|
搜索推荐 索引 SEO
网站分析与SEO效果的评估,互联网营销
  让我在能动笔的岁月中继续动笔吧!我一直想要写关于网站分析如何帮助评估SEO的效果,但是,因为自己并不是SEO的专家,而且目前仍在学习的过程中,因此提笔写这篇文章,觉得忐忑不安。我希望能有擅长SEO的朋友(例如南奇)能帮我指正。
1586 0