Spark内置图像数据源初探
              在Apache Spark 2.4中引入了一个新的内置数据源, 图像数据源.用户可以通过DataFrame API加载指定目录的中图像文件,生成一个DataFrame对象.通过该DataFrame对象,用户可以对图像数据进行简单的处理,然后使用MLlib进行特定的训练和分类计算.
              
             
            
              
              《Scala机器学习》一一3.4 机器学习库
              本节书摘来自华章出版社《Scala机器学习》一 书中的第3章,第3.4节,作者:[美] 亚历克斯·科兹洛夫(Alex Kozlov)著  ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
              
             
            
            
              
              Spark内核设计的艺术:架构设计与实现——前言
              
								
					版权声明:本文为博主原创文章,未经博主允许不得转载。					https://blog.csdn.net/beliefer/article/details/79001468				
								            
                
前言
为什么写这本书
         给这本书写前言,让我想起了两年前给《深入理解Spark:核心思想与源码分析》一书写前言的经历。
              
             
            
            
            
            
              
              基于 Spark 和 TensorFlow 的机器学习实践
              大数据以及计算能力的提升,使得AI技术有了突飞猛进的发展。在大数据和AI技术的热潮下,在2019杭州云栖大会机器学习技术专场,阿里云高级技术专家吴威和阿里云技术专家江宇向大家分享了EMR E-Learning平台和平台上新开发的核心特性TensorFlow on Spark。
              
             
            
              
              Spark GraphX
              
                    
                1. Spark GraphX应用背景
  Spark GraphX是一个分布式图处理框架,它是基于Spark平台提供对图计算和图挖掘简洁易用的而丰富的接口,极大的方便了对分布式图处理的需求。