《深入理解Hadoop(原书第2版)》—1.7 本章小结

简介:

本节书摘来自华章计算机《深入理解Hadoop(原书第2版)》一书中的第1章,第1.7节,作者 [美]萨米尔·瓦德卡(Sameer Wadkar),马杜·西德林埃(Madhu Siddalingaiah),杰森·文纳(Jason Venner),译 于博,冯傲风,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.7本章小结

大数据渐成主流,其背后的两大推动力就是开源的Hadoop系统和云计算时代的到来。两者的发展使得以较低成本引入大规模大数据处理方法来解决业务问题成为可能。Hadoop系统是所有大数据解决方案的核心。尽管其他如MPP 或者 BSP 这样的编程模型,可处理一些特殊的问题,但是它们都还是要以某种形式依赖于Hadoop系统,尤其在数据量达到数T之巨时。掌握Hadoop系统,会让开发者更加高效地使用其他编程模型。本书的目的也正在于此。

下面的章节会讲解Hadoop系统的使用,以及使用Hadoop系统来解决问题的方法与技巧。

相关文章
|
12月前
|
SQL 存储 分布式计算
hadoop的特点
hadoop的特点
|
2月前
|
存储 分布式计算 Hadoop
深入理解Hadoop中的SequenceFileInputFormat
【8月更文挑战第31天】
40 0
|
10月前
|
XML 分布式计算 Hadoop
hadoop
hadoop
978 0
|
机器学习/深度学习 存储 SQL
Hadoop
Hadoop组成
200 0
|
存储 分布式计算 大数据
|
分布式计算 Hadoop
Hadoop DistributedCache详解(转载)
转自:http://dongxicheng.org/mapreduce-nextgen/hadoop-distributedcache-details/
783 0
|
分布式计算 资源调度 Hadoop
|
分布式计算 监控 Hadoop
|
SQL 分布式计算 大数据