文档备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

我想一次性求出结果,不想多一个中间变量,但是我应该怎么指定新聚合出来的字段呢?

different_df =aa.groupby(
aa.status,
aa.paid,
aa.order_sn
).agg(
cn=aa["order_sn"].count()
,nc=aa["order_sn"].unique().count())

different_df.filter(
different_df.cn!=different_df.nc
).head(5)

展开

收起

离原 2023-03-11 09:04:42 781 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

3 条回答

写回答

取消提交回答

wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com

你好，需要先分组，再聚合的。

2023-03-11 18:57:32

赞同展开评论

凌云Cloud

发表文章、提出问题、分享经验、结交志同道合的朋友

可以使用 assign() 函数来指定新的聚合字段，例如：

different_df = aa.groupby(
    aa.status,
    aa.paid,
    aa.order_sn
).agg(
    cn=("order_sn", "count"),
    nc=("order_sn", lambda x: x.nunique())
).assign(
    diff=lambda x: x["cn"] - x["nc"]
).query("diff != 0")

2023-03-11 17:05:20

赞同展开评论

co63oc_

GitHub https://github.com/co63oc/cloud

groupby().agg().filter()

2023-03-11 09:44:25

赞同展开评论

问答分类：

云原生大数据计算服务 MaxCompute

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

136700

16

0

#支付宝身份验证失败（人气大爆发，一会再试试）？

11245

2

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

268636

11

0

#支付宝授权提示请在支付宝客户端打开链接

18917

19

0

购买阿里国外的云服务器是否可以访问谷歌？

87448

49

0

this xml file does not appear to have any style in

55071

11

0

今天刚刚买的阿里云香港服务器，国内无法访问，坑啊

35746

17

0

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

3249

18

0

轻量级应用服务器端口问题（打不开）

32394

21

0

LoRa的网络覆盖能力范围是怎么样的？

4302

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关文章

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

网站代码网站源代码网页源代码网页代码网站

MaxCompute SQL AI 实操：业务员外呼备注有效性判断

寻找 AI 全能王——阿里云 Data+AI 工程师全球大奖赛正式开启

金融行情系统中，API 接入常见的 5 个工程问题

热门讨论

热门文章

请问下大数据计算MaxCompute dataworks是否有全局变量？

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

DataWorks 智能数据建模-业务痛点有哪些？

请教个大数据计算MaxCompute问题，有什么方法可以解决这个问题呢?

今天用实时同步同步了 RDS 数据到 MaxCompute，任务运维上显示成功，看日志也没有问

MaxCompute有没有参数突破呢？

如何查询MaxCompute某个表的分区数有多少呢？

我看MaxCompute能where查单个分区，不加where查分区表所有分区条数不行，有啥办法查询

请问MaxCompute和DataWorks有啥区别？

阿里云和腾讯云服务器哪个好！

展开全部

odps是什么?

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

2017杭州云栖大会FAQ（持续更新中）

Python+大数据计算平台，PyODPS架构手把手教你搭建

【大数据干货】轻松处理每天2TB的日志数据，支撑运营团队进行大数据分析挖掘，随时洞察用户个性化需求。

【转载】时隔一年多，我又用起了 Superset

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

品《阿里巴巴大数据实践-大数据之路》一书（上）

阿里云MaxCompute 2019-5月刊

展开全部

还有其他疑问?