MongoDB结盟Cloudera 欲征服大数据市场

本文涉及的产品
云数据库 MongoDB,独享型 2核8GB
推荐场景:
构建全方位客户视图
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

MongoDB和Cloudera,分别是NoSQL市场和Hadoop市场的重量级大公司。近日,两家公司提出要共享营销和销售渠道,声称目的只有一个:为客户提供大数据整体解决方案,消除客户的疑虑。

MongoDB是NoSQL市场上成功的数据库供应商,而Cloudera在Hadoop市场上也是领袖级的大公司,两家公司都认识到,目前客户对大数据还很困惑,如果能为客户解除这些疑虑,为客户提供整体的解决方案,对两家公司未来的发展都是极为有利的。

这两家公司在周二宣布了结盟的消息,它们致力于建立更深的合作伙伴关系,作为合作伙伴关系的一部分,MongoDB和Cloudera将把它们的产品整合营销和出售,在大数据技术上形成互补效应,简单地说,MongoDB将被定位成面向高扩展性应用的操作型数据库,而Cloudera基于Hadoop的企业数据中心将被用作分析平台。

Matt,MongoDB副总裁,负责MongoDB的市场、业务发展和企业战略。在一次电话采访中,他告诉我们:“在去年Strata会议上,我讲过MongoDB数据库和Hadoop平台应该结合在一起,那时我就认识到MongoDB需要在战略上做出一些改变。当时,好多人不理解,他们认为MongoDB和Hadoop是竞争对手的关系。”

Yuri Bukhan,Cloudera的ISV联盟项目负责人,他告诉我们:“你或许会觉得区分NoSQL和Hadoop并不难,那些不知道怎样合理使用NoSQL和Hadoop的人应该去做更多的研究,但事实上,在这两个平台之间确实有许多灰色地带,比如:HBase,其实HBase就是Hadoop中的NoSQL数据库,但是HBase更适合于超大规模却相对简单的用例,而MongoDB支持更加复杂的数据建模。”

Bukhan引用了在线行为分析,以比较HBase和MongoDB所担当的不同角色,以及发挥的不同作用。“比如,当你研究简单的用户点击或者会话的时候,HBase可以提供非常快速的随机读取和写入,你可以基于特定的关键值对用户进行查找等操作,而MongoDB可以为你提供更丰富的模型,使你可以通过线上应用全程追踪用户的行为。”

目前,MongoDB和Cloudera已经有了双向的数据连接,但从Asay和Bukhan那里了解到,两家公司还在准备将MongoDB和Hadoop更好地整合到一起,借此实时操作性数据利用MongoDB可以在Couldera数据中心中建立快照,用于并行分析。这样的分析接近实时,通过Shark框架或者Impala传递回MongoDB,接着触发个性化内容的展示或者产生一个基于Hadoop分析的最合适产品。

集成之后的产品,据估计会在六月纽约的MongoDB World中展出,该产品将运行在YARN上,新的资源管理层中引入了Hadoop 2.0。过去很难想象MongoDB和Cloudera会运行在同一个服务器集群上,当时很多人担心MongoDB和Cloudera和产生冲突。

如今,MongoDB和Cloudera建立了合作伙伴关系,很多问题都会得以解决,两个成功的公司将描绘出一幅“NoSQL应用于操作型数据库,Hadoop应用于分析”这样的大数据市场规划图。有人一定会问:为什么选择Cloudera而不是整个Hadoop社区?

Asay指出:“这就是开源的好处之一,开源社区内,技术在不断更新和发展,我们的很多技术都有很强的适用性,而且是公开的,所以其他的Hadoop供应商也能够使用这些技术。”

其他的NoSQL供应商,像DataStax这样的公司,没能在NoSQL和Hadoop之间划出一条清晰的界限。比如DataStax的软件发行版,其中既包括Cassandra的NoSQL数据库又包括了Hadoop,它们共同运行在同一个集群上,而且,DataStax和其他高扩展性数据库供应商一直忙于加强和兜售它们数据库的分析和查询性能。

据Asay所说,MongoDB和Cloudera联合销售软件的同时,它们将各自的销售能力结合到一起为它们的产品提供最好的、持续的支持。一段时间以后,大数据市场的局势可能会变得比现在更加复杂,但是由于已经拥有了大额风险资本的注入,MongoDB和Cloudera对未来征服大数据市场很有信心。

原文发布时间为:2014年04月30日
本文作者:Doug Henschen
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。
相关实践学习
lindorm多模间数据无缝流转
展现了Lindorm多模融合能力——用kafka API写入,无缝流转在各引擎内进行数据存储和计算的实验。
云数据库HBase版使用教程
  相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情: https://cn.aliyun.com/product/hbase   ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
目录
相关文章
|
8月前
|
监控 NoSQL 大数据
【MongoDB】Replica 频繁插入大数据的问题
【4月更文挑战第2天】【MongoDB】Replica 频繁插入大数据的问题
|
5月前
|
C# UED 开发者
WPF与性能优化:掌握这些核心技巧,让你的应用从卡顿到丝滑,彻底告别延迟,实现响应速度质的飞跃——从布局到动画全面剖析与实例演示
【8月更文挑战第31天】本文通过对比优化前后的方法,详细探讨了提升WPF应用响应速度的策略。文章首先分析了常见的性能瓶颈,如复杂的XAML布局、耗时的事件处理、不当的数据绑定及繁重的动画效果。接着,通过具体示例展示了如何简化XAML结构、使用后台线程处理事件、调整数据绑定设置以及利用DirectX优化动画,从而有效提升应用性能。通过这些优化措施,WPF应用将更加流畅,用户体验也将得到显著改善。
355 1
|
5月前
|
监控 NoSQL 大数据
【MongoDB复制集瓶颈】高频大数据写入引发的灾难,如何破局?
【8月更文挑战第24天】在MongoDB复制集中,主节点处理所有写请求,从节点通过复制保持数据一致性。但在大量高频数据插入场景中,会出现数据延迟增加、系统资源过度消耗、复制队列积压及从节点性能不足等问题,影响集群性能与稳定性。本文分析这些问题,并提出包括优化写入操作、调整写入关注级别、采用分片技术、提升从节点性能以及持续监控调优在内的解决方案,以确保MongoDB复制集高效稳定运行。
123 2
|
5月前
|
存储 SQL 分布式计算
揭秘Hadoop:如何用这个超级工具征服大数据的海洋
【8月更文挑战第7天】Hadoop是一个强大的分布式系统基础架构
72 1
|
5月前
|
消息中间件 大数据 Kafka
Apache Flink 大揭秘:征服大数据实时流处理的神奇魔法,等你来解锁!
【8月更文挑战第5天】Apache Flink 是一款强大的开源大数据处理框架,专长于实时流处理。本教程通过两个示例引导你入门:一是计算数据流中元素的平均值;二是从 Kafka 中读取数据并实时处理。首先确保已安装配置好 Flink 和 Kafka 环境。第一个 Java 示例展示了如何创建流执行环境,生成数据流,利用 `flatMap` 转换数据,并使用 `keyBy` 和 `sum` 计算平均值。第二个示例则演示了如何设置 Kafka 消费者属性,并从 Kafka 主题读取数据。这两个示例为你提供了使用 Flink 进行实时流处理的基础。随着进一步学习,你将能应对更复杂的实时数据挑战。
95 0
|
8月前
|
存储 NoSQL 大数据
【MongoDB 专栏】MongoDB 在大数据场景下的应用
【5月更文挑战第11天】MongoDB,适用于大数据时代,以其灵活数据模型、高可扩展性和快速性能在大数据场景中脱颖而出。它处理海量、多类型数据,支持高并发,并在数据分析、日志处理、内容管理和物联网应用中广泛应用。电商和互联网公司的案例展示了其在扩展性和业务适应性上的优势,但同时也面临数据一致性、资源管理、数据安全和性能优化的挑战。
743 1
【MongoDB 专栏】MongoDB 在大数据场景下的应用
|
7月前
|
分布式计算 DataWorks NoSQL
DataWorks操作报错合集之从MongoDB同步数据到MaxCompute(ODPS)时,出现报错,该怎么解决
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
DataWorks操作报错合集之从MongoDB同步数据到MaxCompute(ODPS)时,出现报错,该怎么解决
|
7月前
|
存储 数据采集 NoSQL
DTS在迁移大数据量的MongoDB数据库时如何保证数据的准确性和完整性?
【6月更文挑战第4天】DTS在迁移大数据量的MongoDB数据库时如何保证数据的准确性和完整性?
156 1
|
7月前
|
JSON 分布式计算 DataWorks
MaxCompute产品使用合集之如何将JSON格式数据同步到MongoDB
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
7月前
|
存储 监控 NoSQL
MongoDB分片:打造高性能大数据与高并发处理的完美解决方案
MongoDB分片:打造高性能大数据与高并发处理的完美解决方案
317 0