文档备案控制台

开发者社区华章出版社文章正文

《大数据系统构建：可扩展实时数据系统构建原理与最佳实践》一 1.3　NoSQL不是万能的

2017-05-02 1461

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

本节书摘来自华章出版社《大数据系统构建：可扩展实时数据系统构建原理与最佳实践》一书中的第1章，第1.1节，南森·马茨（Nathan Marz） [美]　詹姆斯·沃伦（JamesWarren）　著马延辉　向　磊　魏东琦　译，更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.3　NoSQL不是万能的

过去的十年，可扩展数据系统已经取得了大量的创新，其中包括如Hadoop这样的大规模计算系统，如Cassandra和Riak这样的数据库。这些系统可以处理大量的数据，但是需要认真的权衡。
比如Hadoop可以在非常大量的数据上并行化大规模批量计算，但计算具有较高的延迟。对于任何需要低延迟结果的计算，Hadoop是不适用的。
又如Cassandra这样的NoSQL数据库，通过提供一个比SQL中使用得更有限的数据模型，来实现可扩展性。压缩应用程序到这些有限的数据模型中是非常复杂的，且因为数据库是可变的，所以它们不能容忍人为错误。
这些工具单独使用时并不是万能的。但如果智能地结合使用，那么就可以生成能处理容忍人为错误和最低复杂性的任意数据问题的可扩展系统。这就是本书中将介绍的Lambda 架构。

文章标签：

云原生大数据计算服务 MaxCompute

大数据

数据库

NoSQL

分布式计算

Hadoop

关键词：

云原生大数据计算服务 MaxCompute原理

云原生大数据计算服务 MaxCompute构建

云原生大数据计算服务 MaxCompute最佳实践

云原生大数据计算服务 MaxCompute nosql

云原生大数据计算服务 MaxCompute数据系统

相关实践学习

基于MaxCompute的热门话题分析

Apsara Clouder大数据专项技能认证配套课程：基于MaxCompute的热门话题分析

华章计算机

目录

相关文章

游客7wkr3y7oxyt7a

|

5月前

|

机器学习/深度学习算法大数据

构建数据中台，为什么“湖仓一体”成了大厂标配？

在大数据时代，数据湖与数据仓库各具优势，但单一架构难以应对复杂业务需求。湖仓一体通过融合数据湖的灵活性与数据仓的规范性，实现数据分层治理、统一调度，既能承载海量多源数据，又能支撑高效分析决策，成为企业构建数据中台、推动智能化转型的关键路径。

游客7wkr3y7oxyt7a

439 0 0

Wenzhuang

|

4月前

|

存储 SQL 分布式计算

MaxCompute 聚簇优化推荐原理

基于历史查询智能推荐Clustered表，显著降低计算成本，提升数仓性能。

Wenzhuang

327 4 4

MaxCompute 聚簇优化推荐原理

青云交（Java大数据AI云原生Python）

|

8月前

|

SQL 分布式计算大数据

大数据新视界 --大数据大厂之Hive与大数据融合：构建强大数据仓库实战指南

本文深入介绍 Hive 与大数据融合构建强大数据仓库的实战指南。涵盖 Hive 简介、优势、安装配置、数据处理、性能优化及安全管理等内容，并通过互联网广告和物流行业案例分析，展示其实际应用。具有专业性、可操作性和参考价值。

青云交（Java大数据AI云原生Python）

664 78 78

大数据新视界 --大数据大厂之Hive与大数据融合：构建强大数据仓库实战指南

探索云世界

|

6月前

|

存储 SQL 分布式计算

MaxCompute x 聚水潭：基于近实时数仓解决方案构建统一增全量一体化数据链路

聚水潭作为中国领先的电商SaaS ERP服务商，致力于为88,400+客户提供全链路数字化解决方案。其核心ERP产品助力企业实现数据驱动的智能决策。为应对业务扩展带来的数据处理挑战，聚水潭采用MaxCompute近实时数仓Delta Table方案，有效提升数据新鲜度和计算效率，提效比例超200%，资源消耗显著降低。未来，聚水潭将进一步优化数据链路，结合MaxQA实现实时分析，赋能商家快速响应市场变化。

探索云世界

322 0 0

武子康

|

消息中间件分布式计算大数据

大数据-166 Apache Kylin Cube 流式构建整体流程详细记录

大数据-166 Apache Kylin Cube 流式构建整体流程详细记录

武子康

264 5 5

青云交（Java大数据AI云原生Python）

|

8月前

|

Cloud Native 大数据 Java

大数据新视界--大数据大厂之大数据时代的璀璨导航星：Eureka 原理与实践深度探秘

本文深入剖析 Eureka 在大数据时代分布式系统中的关键作用。涵盖其原理，包括服务注册、续约、发现及自我保护机制；详述搭建步骤、两面性；展示在大数据等多领域的应用场景、实战案例及代码演示。Eureka 如璀璨导航星，为分布式系统高效协作指引方向。

青云交（Java大数据AI云原生Python）

251 9 9

武子康

|

存储 SQL 分布式计算

大数据-162 Apache Kylin 全量增量Cube的构建 Segment 超详细记录多图

大数据-162 Apache Kylin 全量增量Cube的构建 Segment 超详细记录多图

武子康

239 3 3

游客jpyzg2kj5q46s

|

传感器人工智能大数据

高科技生命体征探测器、情绪感受器以及传感器背后的大数据平台在健康监测、生命体征检测领域的设想与系统构建

本系统由健康传感器、大数据云平台和脑机接口设备组成。传感器内置生命体征感应器、全球无线定位、人脸识别摄像头等，搜集超出现有科学认知的生命体征信息。云平台整合大数据、云计算与AI，处理并传输数据至接收者大脑芯片，实现实时健康监测。脑机接口设备通过先进通讯技术，实现对健康信息的实时感知与反馈，确保身份验证与数据安全。

游客jpyzg2kj5q46s

372 85 87

阿里云大数据

|

11月前

|

存储分布式计算物联网

美的楼宇科技基于阿里云 EMR Serverless Spark 构建 LakeHouse 湖仓数据平台

美的楼宇科技基于阿里云 EMR Serverless Spark 建设 IoT 数据平台，实现了数据与 AI 技术的有效融合，解决了美的楼宇科技设备数据量庞大且持续增长、数据半结构化、数据价值缺乏深度挖掘的痛点问题。并结合 EMR Serverless StarRocks 搭建了 Lakehouse 平台，最终实现不同场景下整体性能提升50%以上，同时综合成本下降30%。

阿里云大数据

875 58 58

华章出版社

热门文章

最新文章

深入阿里云大数据IDE–MaxCompute Studio

MaxCompute优化系列-如何使用`MAPJOIN` ？

开源大数据技术专场（上午）:Spark、HBase、JStorm应用与实践

2016大数据创新大赛——机场客流量的时空分布预测模型解析

阿里云大数据利器之-RDS迁移到Maxcompute实现动态分区

蚂蚁金服高级技术专家徐红星：蚂蚁金服大数据开放式创新实践

阿里云大数据利器Maxcompute-使用mapjoin优化查询

SQL Server数据上云恢复报错

贵州发布大数据产业发展引导目录

招聘：搜索推荐事业部-机器学习大数据工程专家-杭州

大数据处理：挖掘价值之道

大数据技术人员的打怪升级之路

利用SparkSQL Logical Plan Parse 打造大数据平台SQL诊断利器

大数据平台治理资源成本化

闲侃数仓优化-大数据治理和优化

探索云原生技术在大数据分析领域的应用

探索大数据技术：Hadoop与Spark的奥秘之旅

AI与大数据：智慧城市安全的护航者与变革引擎

大数据用户画像之基本概念

大数据之 Solr 集群搭建

相关课程

更多

大数据Spark2020最新课程（知识精讲与实战演练）第二阶段

大数据Spark2020版（知识精讲与实战演练）第三阶段

大数据Spark2020版（知识精讲与实战演练）第四阶段

2020版大数据实战项目之DMP广告系统（第四阶段）

2020版大数据实战项目之DMP广告系统（第五阶段）

2020版大数据实战项目之DMP广告系统（第六阶段）

相关电子书

更多

MaxCompute Serverless 架构演进

Data+AI时代大数据平台应该如何建设

大数据AI一体化的解读

下一篇

附部署代码｜云数据库RDS 全托管 Supabase服务：小白轻松搞定开发AI应用