文档备案控制台

开发者社区问答正文

Spark程序中使用SQL语句设置数据的首行为字段名称的方法是什么？

Spark程序中使用SQL语句设置数据的首行为字段名称的方法是什么？

展开

收起

游客qzzytmszf3zhq 2021-12-09 20:11:58 861 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客yzrzs5mf6j7yy

scala> val header = yahoo_stocks.first

header: String = Date,Open,High,Low,Close,Volume,Adj Close

 

下面我们创建一个新的RDD，不包括首行字段名称：

scala> val data = yahoo_stocks.mapPartitionsWithIndex { (idx, iter)=> if (idx == 0) iter.drop(1) else iter }

data: org.apache.spark.rdd.RDD[String] =MapPartitionsRDD[3] at mapPartitionsWithIndex at <console>:32

2021-12-09 20:12:15

赞同展开评论

问答分类：

SQL 分布式计算 Spark

问答标签：

apache spark程序 SQL数据 SQL设置 apache spark SQL SQL方法

问答地址：

开发者社区 > 大数据 > 问答

相关问答

在Flink CDC中，flinsql读spark表的timestamp类型字段报这个错，这个咋解决

196

0

0

调整Spark读取ODPS离线表分区大小的方法是什么？

249

1

0

DMS里面 sql查询出来的字段可以复制仅字段名，但是字段的顺序是乱的这个能设置吗?

232

3

0

DataWorks常量不行，后面生成的sql会把常量值作为字段名处理？

292

4

0

flink sql的这个函数怎么用啊？compositeType这个取什么值啊？我用字段名不行!

210

1

0

DataWorks中spark_sql支持对表增加字段操作吗？

698

1

0

es adapter 解析sql时，两个表有相同的字段名称，更新时，会有bug

209

1

0

Seata中是在同一个事务里面就上下方法，好像sql异常了是为什么呀？

652

0

0

任务编排里的跨库spark sql 数据加工用不了

838

0

0

storm&spark2中spark SQL语句查询的对象是谁呀？

1897

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

动态变量话术引擎对直播有什么作用？

新手如何进行OSS 图片处理 CDN 加速？

什么年代了，qoder cn还不支持多agent协同一起完成任务

qoder 资源包买完找不到记录也不知道再用，究竟是谁设计的，没见过这样的设计，

需要支持自定义Kimi k3 API

相关文章

代码提速10倍，交付只快18%：AI编程的效率悖论到底卡在哪

团队里没人敢动的那段 100 行 SQL，我用 7 步拆透了

多模数据库是什么？支持哪些数据模型、能不能用 SQL 查询？阿里云 Lindorm 解析

当 PostgreSQL 坐稳数据底座，Agent 还差什么才能真正跑起来？

DCMM 2.0 L4 级 AI 能力技术架构：从数据治理底座到智能体闭环的演进路径

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

高效存储和处理多媒体数据

还有其他疑问?