本节书摘来自华章计算机《Scala机器学习》一书中的第2章,第2.7节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov),更多章节内容可以访问云栖社区“华章计算机”公众号查看。
2.7 总结
本章介绍了一种用于设计数据驱动企业的高级架构方法。同时还向读者介绍了影响图,它是一个用来了解传统企业和数据驱动企业是如何做决策的工具。接着介绍了几个重要的模型,如Kelly准则和多臂老虎机,并从数学的角度来说明这些问题是至关重要的。在这些内容的基础上还介绍了马尔可夫决策过程,该过程通过已有的决定和观察的结果来得到决策策略。本章深入研究了构建决策数据管道较为实用的方法,以及可用于构建它们的主要组件和框架。最后讨论了不同阶段和节点之间传递数据和建模结果的问题,以及将结果如何呈现给用户、反馈回路和系统监控等问题。
下一章将介绍MLlib,它是一个用Scala编写,基于分布式集群的机器学习的库。