文档备案控制台

开发者社区问答正文

withclomn in pyspark错误：TypeError：'Column'对象不可调用

我正在使用spark 2.0.1，

df.show()
Survived	Pclass	Sex	SibSp	Parch	Fare
0.0	3.0	1.0	1.0	0.0	7.3
1.0	1.0	0.0	1.0	0.0	71.3
1.0	3.0	0.0	0.0	0.0	7.9
1.0	1.0	0.0	1.0	0.0	53.1
0.0	3.0	1.0	0.0	0.0	8.1
0.0	3.0	1.0	0.0	0.0	8.5
0.0	1.0	1.0	0.0	0.0	51.9

我有一个数据框，我想使用withColumn向df添加一个新列，新列的值基于其他列值。我用过这样的东西：

dfnew = df.withColumn('AddCol' , when(df.Pclass.contains('3.0'),'three').otherwise('notthree'))
这是一个错误

TypeError: 'Column' object is not callable

展开

收起

社区小助手 2018-12-21 11:10:30 9683 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

社区小助手

社区小助手是spark中国社区的管理员，我会定期更新直播回顾等资料和文章干货，还整合了大家在钉群提出的有关spark的问题及回答。

这是因为您正在尝试将该函数contains应用于该列。该功能contains在pyspark中不存在。你应该试试like。试试这个：
import pyspark.sql.functions as F
df = df.withColumn("AddCol",F.when(F.col("Pclass").like("3"),"three").otherwise("notthree"))
或者，如果您只是想让它成为数字3，应该做：
import pyspark.sql.functions as F
If the column Pclass is numeric
df = df.withColumn("AddCol",F.when(F.col("Pclass") == F.lit(3),"three").otherwise("notthree"))
If the column Pclass is string
df = df.withColumn("AddCol",F.when(F.col("Pclass") == F.lit("3"),"three").otherwise("notthree"))

2019-07-17 23:23:18

赞同展开评论

问答分类：

分布式计算 Spark

问答地址：

开发者社区 > 大数据 > 问答

相关问答

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

136593

16

0

#支付宝身份验证失败（人气大爆发，一会再试试）？

11159

2

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

268347

11

0

#支付宝授权提示请在支付宝客户端打开链接

18837

19

0

购买阿里国外的云服务器是否可以访问谷歌？

87362

49

0

this xml file does not appear to have any style in

54983

11

0

今天刚刚买的阿里云香港服务器，国内无法访问，坑啊

35647

17

0

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

3096

18

0

轻量级应用服务器端口问题（打不开）

32315

21

0

阿里云香港服务器在哪购买？香港云服务器购买流程有吗？

8283

5

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

copaw安装后，出现这个情况，在设置模型的过程中出现这个问题，如何解决

Qwen OpenAI-Responses 兼容模式有问题

copaw安装后选择ollma为啥报错不能安装相关模型？

建议通义灵码参考字节的trae ，可以自主选择一些开源的模型

相关文章

别再把大数据平台当“巨石”了：聊聊云原生时代的大数据平台怎么活得更久

Spark / Flink 跑在 Kubernetes 上真的更香吗？聊聊那些没人提前告诉你的性能坑

AI 会写稿了，人还要不要写？——聊聊生成式 AI 在数据增强与自动写稿里的伦理和质量问题

Dataphin功能Tips系列（92）如何方便快速地通过SQL取数实现定制化数据同步

阿里云第九代ECS云服务器（c9i、g9i、r9i）CPU采用Intel® Xeon® Granite Rapids处理器，主频3.2 GHz

还有其他疑问?