开发者社区> 问答> 正文

Spark程序中使用SQL语句设置数据的首行为字段名称的方法是什么?

Spark程序中使用SQL语句设置数据的首行为字段名称的方法是什么?

展开
收起
游客qzzytmszf3zhq 2021-12-09 20:11:58 692 0
1 条回答
写回答
取消 提交回答
  • scala> val header = yahoo_stocks.first
    
    header: String = Date,Open,High,Low,Close,Volume,Adj Close
    
     
    
    下面我们创建一个新的RDD,不包括首行字段名称:
    
    scala> val data = yahoo_stocks.mapPartitionsWithIndex { (idx, iter)=> if (idx == 0) iter.drop(1) else iter }
    
    data: org.apache.spark.rdd.RDD[String] =MapPartitionsRDD[3] at mapPartitionsWithIndex at <console>:32
    
    
    2021-12-09 20:12:15
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
SQL Server在电子商务中的应用与实践 立即下载
GeoMesa on Spark SQL 立即下载
原生SQL on Hadoop引擎- Apache HAWQ 2.x最新技术解密malili 立即下载