《深入理解Hadoop(原书第2版)》—1.7 本章小结

简介:

本节书摘来自华章计算机《深入理解Hadoop(原书第2版)》一书中的第1章,第1.7节,作者 [美]萨米尔·瓦德卡(Sameer Wadkar),马杜·西德林埃(Madhu Siddalingaiah),杰森·文纳(Jason Venner),译 于博,冯傲风,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.7本章小结

大数据渐成主流,其背后的两大推动力就是开源的Hadoop系统和云计算时代的到来。两者的发展使得以较低成本引入大规模大数据处理方法来解决业务问题成为可能。Hadoop系统是所有大数据解决方案的核心。尽管其他如MPP 或者 BSP 这样的编程模型,可处理一些特殊的问题,但是它们都还是要以某种形式依赖于Hadoop系统,尤其在数据量达到数T之巨时。掌握Hadoop系统,会让开发者更加高效地使用其他编程模型。本书的目的也正在于此。

下面的章节会讲解Hadoop系统的使用,以及使用Hadoop系统来解决问题的方法与技巧。

相关文章
|
3月前
|
存储 分布式计算 Hadoop
深入理解Hadoop中的SequenceFileInputFormat
【8月更文挑战第31天】
76 0
|
分布式计算 资源调度 Java
Hadoop3.2.0使用详解
Hadoop3.2.0使用详解1.概述Hadoop3已经发布很久了,迭代集成的一些新特性也是很有用的。截止本篇博客书写为止,Hadoop发布了3.2.0。接下来,笔者就为大家分享一下在使用Hadoop3中遇到到一些问题,以及解决方法。
3597 0
|
存储 分布式计算 大数据
hadoop介绍
以下内容是我的学习笔记,网络课程的笔记。出处 Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。
2750 0
|
分布式计算 Java Hadoop
|
存储 SQL 分布式计算
|
存储 分布式计算 大数据
|
SQL 分布式计算 大数据
|
存储 分布式计算 Java
|
存储 分布式计算 Hadoop
|
存储 数据采集 分布式计算