备案控制台

开发者社区> 问答> 正文

我想使用三列计算并生成单列，并显示所有三个值

我在spark databrick中加载数据框中的文件

spark.sql("""select A,X,Y,Z from fruits""")

A X Y Z
1E5 1.000 0.000 0.000
1U2 2.000 5.000 0.000
5G6 3.000 0.000 10.000
我需要输出为

A      D

1E5 X 1
1U2 X 2, Y 5
5G6 X 3, Z 10

展开

收起

社区小助手 2018-12-12 11:07:47 1330 0

1 条回答

写回答

取消提交回答

社区小助手

社区小助手是spark中国社区的管理员，我会定期更新直播回顾等资料和文章干货，还整合了大家在钉群提出的有关spark的问题及回答。
每个列名都可以与值连接，然后所有值都可以在一列中连接，用逗号分隔：

// data
val df = Seq(
("1E5", 1.000, 0.000, 0.000),
("1U2", 2.000, 5.000, 0.000),
("5G6", 3.000, 0.000, 10.000))
.toDF("A", "X", "Y", "Z")

// action
val columnsToConcat = List("X", "Y", "Z")
val columnNameValueList = columnsToConcat.map(c =>
when(col(c) =!= 0, concat(lit(c), lit(" "), col(c).cast(IntegerType)))
```
.otherwise("")
```
)
val valuesJoinedByComaColumn = columnNameValueList.reduce((a, b) =>
when(org.apache.spark.sql.functions.length(a) =!= 0 && org.apache.spark.sql.functions.length(b) =!= 0, concat(a, lit(", "), b))
```
.otherwise(concat(a, b))
```
)
val result = df.withColumn("D", valuesJoinedByComaColumn)
.drop(columnsToConcat: _*)
输出：

A D

1E5 X 1

1U2 X 2, Y 5

5G6 X 3, Z 10

解决方案类似于stack0114106提出的，但看起来更明确。
2019-07-17 23:20:01

赞同展开评论打赏

问答分类：

分布式计算 Spark

问答地址：

开发者社区 > 大数据 > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

在列方向如何读取两列呢？

1035

1

0

选择列有什么方法呀？

588

1

0

列处理有什么举例吗？

321

1

0

表格储存中范围查询，最后一个主键起始值填了个自选值，但没生效，和最小值结果是一样的，是什么原因啊？

603

1

0

如何改变dataframe中的列顺序？

465

1

0

dataframe中如何创建包含每行最小值与最大值比例的列?

363

1

0

dataframe中如何创建包含每行第二大值的列?

411

1

0

从另一列计算得出的列？

395

1

0

首先按特定字段值排序

452

1

0

查询列中的多个值

484

1

0

问答排行榜

最热

最新

1 【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥 1818887

2 据说在家办公的程序员是这样写代码的？ 1793008

3 阿里云开放端口权限 690204

4 如何升级配置 536251

5 【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？ 522776

6 【精品问答】python技术1000问(1) 514109

7 Flink Forward Asia 2021 有奖问答 512890

8 OceanBase 使用动画（持续更新） 359360

9 阿里云LNAMP(Linux + Nginx + Apache + MySQL + PHP)环境一键安装脚本 329787

10 OSS存储服务-客户端工具 321529

11 为体验实验室取一个新名字。 307452

12 企业邮箱发送邮件时，若出现投递失败产生退信，内容提示包含如下： the mta server of * reply:550 failed to meet SPF requirements 或者 the mta server of 163.com — 163mx01.mxmail.netease.com(220.181.14.141) reply:550 MI:SPF mx14,QMCowECpA0qTiftVaeB3Cg—.872S2 1442548128 http://mail.163.com/help 304052

13 Win Server 2003-2016 加密勒索事件必打补丁合集 295314

14 FLASH播放器，在IE浏览器下显示请确定您的域名已完成备案和CNAME绑定 284141

15 安全组详解，新手必看教程 277332

16 写code还是做管理，开发者如何进行职业规划？ 269066

17 惊喜翻倍：免费ECS+免费环境配置~！(ECS免费体验6个月活动3月31日结束) 255871

18 阿里云手机和阿云浏览器连接问题专帖 235684

19 请问阿里云邮箱如何开启SMTP服务啊！ 225819

20 支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】 223675

1 1024程序员节，开发者们都在参与社区的哪些活动？ 1334

2 百问求答第四期-回答问题即有机会拿冬季取暖器 591

3 获取Access Token报code: 400, body is mandatory 129

4 小白求助，跟着大模型微调教程做不太明白 341

5 P人出游，你是否需要一个懂你更懂规划的AI导游呢？来搭建专属文旅问答机器人吧 1272

6 请问2024年云栖大会的分享ppt资料怎么下载？或者有大佬分享一下吗？ 616

7 大模型的token是怎么计算的？ 370

8 产品库存表中如何锁定出库数量？ 715

9 执行docker pull polardbx/polardb-x报错 377

10 我在云栖做动手，一起参与吗？ 2289

11 宜搭子表单中，如何用onchange设置，将两个级联组件的最后一级值相乘，赋值给一个文本组件？ 448

12 宜搭组件唯一标识怎么修改 234

13 宜搭报表图片显示问题 377

14 [PXC-4700][ERR_SERVER] server error by filterDrive 386

15 阿里云服务器多少钱一年？贵吗 440

16 微信小程序构建npm之后在app.js使用直接报错 307

17 99元云服务器，你最pick哪种新玩法？ 4855

18 Grafana中关于K线图时间轴问题 316

19 在nacos中，有密码长度、复杂度、有效期等密码复杂度策略吗？怎么设置？ 220

20 钉钉自定义机器人，发送markdown , 图片缓存问题。 282

推荐问答

乘风问答官招募中！机械键盘免费拿

相关电子书

更多

低代码开发师（初级）实战教程 立即下载

冬季实战营第三期：MySQL数据库进阶实战 立即下载

阿里巴巴DevOps 最佳实践手册 立即下载