python数据运算

简介: 笔记

一、算术运算


import pandas as pd
data = {'c1':[1,4],'c2':[2,5],'c3':[3,6]}
df = pd.DataFrame(data,index=['s1','s2'])
print(df)
# 两数相加
print(df['c1']+ df['c2'])
# 两数相减
print(df['c1']-df['c2'])
# 两数相乘
print(df["c1" ] * df['c2'])
# 两数相除
print(df["c1" ] / df['c2'])
# 任意一列加减一个常数
print(df["c1" ]+2)
print(df["c1" ]-2)
# 任意一列乘除一个数
print(df["c1" ]*2)
print(df["c1" ]/2)


二、比较运算


import pandas as pd
data = {'c1':[1,4],'c2':[2,5],'c3':[3,6]}
df = pd.DataFrame(data,index=['s1','s2'])
print(df)
# 比较大小
print(df['c1']>df['c2'])
print(df['c1']!=df['c2'])
print(df['c1']<df['c2'])


三、汇总运算


import pandas as pd
data = {'c1':[1,4],'c2':[2,5],'c3':[3,6]}
df = pd.DataFrame(data,index=['s1','s2'])
print(df)
'''
汇总运算:就是将数据进行汇总返回一个汇总以后的结果值
'''
# 1。count非空值计算
# count函数:返回结果为该数据表中每列的非空值的个数
print(df.count())
# axis = 1表示来求取每一行非空值的个数
print(df.count(axis=1))
# 也可以对每一列求个数
print(df['c1'].count())
# 2.sum求和函数
# sum函数:返回的是每一列的求和结果
print(df.sum())
# axis = 1表示每一行求和结果
print(df.sum(axis=1))
# 也可以对每一列求和
print(df['c1'].sum())
# 3.mean求均值
# mean函数:返回每一列的均值
print(df.mean())
# axis = 1表示每一行求均值
print(df.mean(axis=1))
# 也可以对每一列求均值
print(df['c1'].mean())
# 4。max求最大值
# max函数:可对每一行或每一列求最大值
print(df.max())
# axis = 1表示求每一行最大值
print(df.max(axis=1))
# 也可以对每一列求最大值
print(df['c1'].max())
# 5。min求最小值
# max函数:可对每一行或每一列求最小值
print(df.min())
# axis = 1表示求每一行最大值
print(df.min(axis=1))
# 也可以对每一列求最大值
print(df['c1'].min())
print('...........换数据............')
data1 = {'c1':[1,4,7],'c2':[2,5,8],'c3':[3,6,9]}
df1 = pd.DataFrame(data1,index=['s1','s2','s3'])
print(df1)
# 6。median求中位数
#median函数:可对每一行或每一列求中位数
print(df1.median())
# axis = 1表示求每一行的中位数
print(df1.median(axis=1))
# 也可以对每一列求最大值
print(df1['c1'].median())
print('...........换数据............')
data2 = {'c1':[1,4,1],'c2':[1,4,1],'c3':[3,6,3]}
df2 = pd.DataFrame(data2,index=['s1','s2','s3'])
print(df2)
# 7.mode求众数;众数:每一组数据中出现次数最多的数
# mode函数:可对每一行或每一列求众数
print(df2.mode())
# axis = 1表示求每一行的众数
print(df2.mode(axis=1))
# 也可以对每一列求众数
print(df2['c1'].mode())
#8。var求方差:方差是用来衡量一组数据的离散程度
#var函数:可对每一行或每一列求方差
print(df1.var())
# axis = 1表示求每一行的方差
print(df1.var(axis=1))
# 也可以对每一列求方差
print(df1['c1'].var())
# 9。std求标准差:标准差是方差的平方根,二者都是用来表示数据的离散程度的
#std函数:可对每一行或每一列求标准差
print(df1.std())
# axis = 1表示求每一行的标准差
print(df1.std(axis=1))
# 也可以对每一列求标准差
print(df1['c1'].std())
print('...........换数据............')
data3 = {'c1':[1,4,7,10,13],'c2':[2,5,8,11,14],'c3':[3,6,9,12,15]}
df3 = pd.DataFrame(data3,index=['s1','s2','s3','s4','s5'])
print(df3)
# 10。quantile求分位数:分位数是比中位数更加详细的基于位置的指标,分位数主要有四分之一分位数,四分之二分位数,四分之三分位数,而四分之二分位数就是中位数
#std函数:可对每一行或每一列求分位数
# 求列的四分之一分位数
print(df3.quantile(0.25))
# 求列的四分之三分位数
print(df3.quantile(0.75))
# axis = 1表示求每一行的分位数
print(df3.quantile(0.25,axis=1))
# 也可以对每一列求分位数
print(df3['c1'].quantile(0.25))


四、相关性运算


'''
相关性:用来衡量两个事物之间的相关程度
我们一般用相关系数来衡量两者的相关程度,所以相关性计算就是计算相关系数,比较常用的是皮尔逊系数
'''
import pandas as pd
data = {'col1':[1,3,5,7,9],'col2':[2,4,6,8,10],'col3':[3,6,9,12,15]}
df = pd.DataFrame(data)
print(df)
#用corr函数计算相关性
print(df['col1'].corr(df['col2']))
# 还可以对整个表中各个两两字段求相关性
print(df.corr())



相关文章
|
4天前
|
XML 前端开发 数据格式
BeautifulSoup 是一个 Python 库,用于从 HTML 和 XML 文件中提取数据
【5月更文挑战第10天】BeautifulSoup 是 Python 的一个库,用于解析 HTML 和 XML 文件,即使在格式不规范的情况下也能有效工作。通过创建 BeautifulSoup 对象并使用方法如 find_all 和 get,可以方便地提取和查找文档中的信息。以下是一段示例代码,展示如何安装库、解析 HTML 数据以及打印段落、链接和特定类名的元素。BeautifulSoup 还支持更复杂的查询和文档修改功能。
14 1
|
6天前
|
存储 JSON 数据挖掘
python序列化和结构化数据详解
python序列化和结构化数据详解
13 0
|
6天前
|
数据采集 数据可视化 数据挖掘
Python 与 PySpark数据分析实战指南:解锁数据洞见
Python 与 PySpark数据分析实战指南:解锁数据洞见
|
6天前
|
数据采集 数据处理 开发者
Python 中的数据处理技巧:高效数据操作的艺术
Python 在数据处理方面表现卓越,为开发者提供了丰富的工具和库以简化数据操作。在本文中,我们将探讨 Python 中数据处理的一些技巧,包括数据清洗、数据转换以及优化数据操作的最佳实践。通过掌握这些技巧,您可以在 Python 中更加高效地处理和分析数据。
|
8天前
|
机器学习/深度学习 自然语言处理 算法
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
|
8天前
|
开发者 索引 Python
Python中调整两列数据顺序的多种方式
Python中调整两列数据顺序的多种方式
27 0
|
8天前
|
SQL API 数据库
在Python中获取筛选后的SQL数据行数
在Python中获取筛选后的SQL数据行数
19 1
|
8天前
|
数据可视化 Python
python中Copula在多元联合分布建模可视化2实例合集|附数据代码
python中Copula在多元联合分布建模可视化2实例合集|附数据代码
|
8天前
|
数据处理 Python
Python中每个字段增加多条数据的高效方法
Python中每个字段增加多条数据的高效方法
14 1
|
8天前
|
数据挖掘 测试技术 数据处理
在python读取相邻两行的数据进行运算
在python读取相邻两行的数据进行运算
9 1