本节书摘来自华章出版社《大数据系统构建:可扩展实时数据系统构建原理与最佳实践》一书中的第3章,第3.4节,南森·马茨(Nathan Marz) [美] 詹姆斯·沃伦(JamesWarren) 著 马延辉 向 磊 魏东琦 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
3.4 总结
在大多数情况下,实现SuperWebAnalytics.com的可实施图模式是简单的。你看到了为此使用序列化框架而出现的冲突,即无法执行你所关注的每一个属性。很少有工具能完美地符合你的要求,但重要的是要知道可能的理想工具是什么样的,这样你可以对所做出的权衡有个认识,并可以留意更好的工具(或自己做)—随着理论和示例章节的学习,这将是一个共同的主题。
第4章将介绍如何在批处理层中物理地存储主数据集,这一问题就可以被轻松、高效地处理了