pandas库的数据类型运算

2017-10-08 998

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： pandas库的数据类型运算算数运算法则根据行列索引,补齐运算(不同索引不运算,行列索引相同才运算),默认产生浮点数补齐时默认填充NaN空值二维和一维,一维和0维之间采用广播运算(低维元素与每一个高维元素运算)...

pandas库的数据类型运算

算数运算法则

import pandas as pd
import numpy as np

a = pd.DataFrame(np.arange(12).reshape(3, 4))
a

b = pd.DataFrame(np.arange(20).reshape(4, 5))
b

# 维度相同, 行列内元素个数不同的运算, 自动补齐, 缺项NaN
a + b

a * b

除了使用+-*/,也可使用方法形式,好处是可以增加可选参数

b.add(a,fill_value = 100) # 将a和b之间的缺失元素用100补齐并参加与运算

a.mul(b,fill_value = 0)

b = pd.DataFrame(np.arange(20).reshape(4, 5))
b

c = pd.Series(np.arange(4))
c

0    0
1    1
2    2
3    3
dtype: int32

c - 10

0   -10
1    -9
2    -8
3    -7
dtype: int32

b - c # b的每一行都与c运算一遍, 二维和一维运算默认在轴1（行）发生

b.sub(c,axis=0) # 指定用 列 参与运算

a = pd.DataFrame(np.arange(12).reshape(3, 4))
a

d = pd.DataFrame(np.arange(12, 0, -1).reshape(3, 4))
d

a > d # bool值表

a == d

b = pd.DataFrame(np.arange(12).reshape(3, 4))
c = pd.Series(np.arange(4))

a > c

c > 0

0    False
1     True
2     True
3     True
dtype: bool