Hadoop笔试题一
              
                    
                Hadoop笔试题一
一、选择题(2分每题,共20分)
1.下面哪个程序负责 HDFS 数据存储。 
A NameNode 
B Jobtracker 
C Datanode 
D tasktracker 
2.
              
             
            
            
              
              【Spark Summit East 2017】使用Spark进行带有高维度标签的机器学习
              本讲义出自Stefan Panayotov与Michael Zargham 在Spark Summit East 2017上的演讲,主要介绍了在Stefan Panayotov和团队使用Spark进行带有高维度标签的机器学习的过程中使用到的工具,遇到的障碍以及围绕使用Databricks尝试构建用于预测不同电视节目的收视率以及人口统计数据的客户机器学习模型所做的工作。
              
             
            
            
            
              
              用机器学习流程去建模我们的平台架构
              Spark 提供了一个新的体系,spark.ml。 相对于spark.mllib,这是一个更高层的对机器学习流程的一个抽象。你会神奇的发现这套抽象也适合服务平台的设计与建模。更让我印象深刻的是,一个合适的抽象,简直就像真理一样。本文将介绍spark.ml 的五个该概念。