《Scala机器学习》一一1.7 总结

简介: 本节书摘来自华章出版社《Scala机器学习》一 书中的第1章,第1.7节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov)著 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.7 总结
本章试图为后面更复杂的数据科学建立一个通用平台。不要认为这里介绍了一套完整的探索性技术,因为探索性技术可扩展到非常复杂的模式上。但是,本章已经涉及了简单的汇总、抽样、文件操作(如读和写),并使用notebook和Spark DataFrame等工具来工作,Spark的DataFrame也为使用Spark/Scala的数据分析师引入了他们所熟悉的SQL结构。
下一章开始介绍数据管道,可将其看作基于数据驱动企业的一部分,并从商业角度给出数据发现的过程:做数据分析试图要完成的最终目标是什么。在介绍更复杂的数据表示之前,会先介绍一点传统的机器学习内容,如监督学习和无监督学习,从中也能看出Scala相对于SQL的优势。

相关文章
|
2月前
|
机器学习/深度学习 存储 监控
使用Scala编写控制局域网上网软件的机器学习算法
在当今数字化世界中,对于使用控制局域网上网软件控制上网活动的需求越来越迫切。无论是家庭、学校还是企业,都需要有效的方法来监控和管理用户在局域网上的上网行为。本文将介绍如何使用Scala编写机器学习算法来实现这一目标,同时提供一些代码示例来说明具体的实现方式。
129 0
|
机器学习/深度学习 分布式计算 Hadoop
|
机器学习/深度学习 人工智能 分布式计算
|
机器学习/深度学习 分布式计算 算法
《Scala机器学习》一一3.7 总结
本节书摘来自华章出版社《Scala机器学习》一 书中的第3章,第3.7节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov)著 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
995 0
|
存储 机器学习/深度学习 分布式计算
《Scala机器学习》一一3.6 运行Hadoop的HDFS
本节书摘来自华章出版社《Scala机器学习》一 书中的第3章,第3.6节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov)著 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1604 0
|
机器学习/深度学习 分布式计算 资源调度
《Scala机器学习》一一3.5 Spark的性能调整
本节书摘来自华章出版社《Scala机器学习》一 书中的第3章,第3.5节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov)著 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1345 0
|
机器学习/深度学习 分布式计算 算法
《Scala机器学习》一一3.4 机器学习库
本节书摘来自华章出版社《Scala机器学习》一 书中的第3章,第3.4节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov)著 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
2297 0
|
存储 分布式计算 Shell
《Scala机器学习》一一3.3 应用
本节书摘来自华章出版社《Scala机器学习》一 书中的第3章,第3.3节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov)著 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1353 0
|
存储 分布式计算 资源调度
《Scala机器学习》一一3.2 理解Spark的架构
本节书摘来自华章出版社《Scala机器学习》一 书中的第3章,第3.2节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov)著 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1744 0
|
Web App开发 分布式计算 Apache
《Scala机器学习》一一3.1 安装Spark
本节书摘来自华章出版社《Scala机器学习》一 书中的第3章,第3.1节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov)著 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1161 0