文档备案控制台

开发者社区问答正文

在python3中使用pandas汇总A列中每个元素的B列值

在座的任何人都可以帮助我使用pandas处理xlsx文档吗？

问题是：我有两列文件。我想从“ A”列中获取值（这些是重复的），并从“ B”列获取足够的值并将其汇总。

例：

123abc  100
zxc345  500
123abc 120
zxc345 800
123abc 100

我想拥有：

123abc 320
zxc345 1300

现在，我的代码仅对该文件进行排序：

123abc  100
        120
zxc345  500
        800

另外，请注意，该条目仅显示一次：“ 123abc 100”，尽管事实是重复的。

先感谢您！

这是代码：

from sys import argv
import pandas as pd
from pandas import ExcelWriter
from pandas import ExcelFile
import sys

# print("ilosc argumentow",len(sys.argv))

if len(sys.argv) < 2:
        print("Give me Excel file: " +  sys.argv[0] + ' niezrealizowane.xlsx')
        quit()
else:
        print("*" * 50)
        print("""Pracuje na: """, sys.argv[1])
        print("*" * 50)



skrypt, ticket = argv

# ZGODNOSCI and NuMERKI are first row in each of affected columns.

data = pd.read_excel(ticket, index_col=None, na_values=['NA'], usecols = "F, H")
data2 = data.groupby(['ZGODNOSCI', 'NuMERKI'])['NuMERKI'].sum()

data2.to_excel('Edzia-test.xlsx')

问题来源：stackoverflow

展开

收起

is大龙 2020-03-21 11:00:08 452 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

is大龙

使用groupby

df.groupby('A')['B'].sum()

例

>>> df
        A    B
0  123abc  100
1  zxc345  500
2  123abc  120
3  zxc345  800
4  123abc  100
>>> df.groupby('A')['B'].sum()
A
123abc     320
zxc345    1300
Name: B, dtype: int64

回答来源：stackoverflow

2020-03-21 11:00:23

赞同展开评论

问答分类：

Python

问答标签：

Python元素 Pandas元素 Python Pandas python3 Pandas Pandas python3

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

使用MaxCompute Python SDK（PyODPS）时to_pandas 就不是集群模式?

241

1

0

大数据计算MaxCompute如何在datawork上弄python3的pandas 库？

255

4

0

如何在datawork上弄python3的pandas 库？

211

2

0

那位大侠知道python3.6 下安装pandas依赖包的问题？

432

1

0

请问Python写的函数可以在中台调用吗? 数据中台为什么不支持pandas包?

1167

1

0

请问dataworks中的脚本如何安装依赖的包，如python能否安装pandas

630

1

0

对于pandas和python的list和tuple当中使用整数索引进行记录的查找或切片有什么不同吗

620

1

0

pandas数据分组中使用python的函数是更通用的方法是什么呢？

497

1

0

pandas中从SQL表/库导入数据的方法是什么？

584

1

0

如何导入pandas库和查询相应版本的信息？

673

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

copaw安装后，出现这个情况，在设置模型的过程中出现这个问题，如何解决

copaw安装后选择ollma为啥报错不能安装相关模型？

建议通义灵码参考字节的trae ，可以自主选择一些开源的模型

云端部署coclaw报错

相关文章

投研效率飙升10倍！阿里云部署OpenClaw(Clawdbot)集成20款顶级金融Skill：24小时盯盘/智能研判，不做“金融牛马”！

Pycharm 断点调试 Scrapy：两种实现方式总结

不想再被 API 账单吓一跳？教你用 Python 搭一个本地大模型推理 API

利用1688开放平台API获取商品券后价详情

MEaSUREs 南极冰盖接地带 V001

还有其他疑问?