本节书摘来自华章计算机《深入理解Hadoop(原书第2版)》一书中的第1章,第1.7节,作者 [美]萨米尔·瓦德卡(Sameer Wadkar),马杜·西德林埃(Madhu Siddalingaiah),杰森·文纳(Jason Venner),译 于博,冯傲风,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.7本章小结
大数据渐成主流,其背后的两大推动力就是开源的Hadoop系统和云计算时代的到来。两者的发展使得以较低成本引入大规模大数据处理方法来解决业务问题成为可能。Hadoop系统是所有大数据解决方案的核心。尽管其他如MPP 或者 BSP 这样的编程模型,可处理一些特殊的问题,但是它们都还是要以某种形式依赖于Hadoop系统,尤其在数据量达到数T之巨时。掌握Hadoop系统,会让开发者更加高效地使用其他编程模型。本书的目的也正在于此。
下面的章节会讲解Hadoop系统的使用,以及使用Hadoop系统来解决问题的方法与技巧。