python数据运算

简介: 笔记

一、算术运算


import pandas as pd
data = {'c1':[1,4],'c2':[2,5],'c3':[3,6]}
df = pd.DataFrame(data,index=['s1','s2'])
print(df)
# 两数相加
print(df['c1']+ df['c2'])
# 两数相减
print(df['c1']-df['c2'])
# 两数相乘
print(df["c1" ] * df['c2'])
# 两数相除
print(df["c1" ] / df['c2'])
# 任意一列加减一个常数
print(df["c1" ]+2)
print(df["c1" ]-2)
# 任意一列乘除一个数
print(df["c1" ]*2)
print(df["c1" ]/2)


二、比较运算


import pandas as pd
data = {'c1':[1,4],'c2':[2,5],'c3':[3,6]}
df = pd.DataFrame(data,index=['s1','s2'])
print(df)
# 比较大小
print(df['c1']>df['c2'])
print(df['c1']!=df['c2'])
print(df['c1']<df['c2'])


三、汇总运算


import pandas as pd
data = {'c1':[1,4],'c2':[2,5],'c3':[3,6]}
df = pd.DataFrame(data,index=['s1','s2'])
print(df)
'''
汇总运算:就是将数据进行汇总返回一个汇总以后的结果值
'''
# 1。count非空值计算
# count函数:返回结果为该数据表中每列的非空值的个数
print(df.count())
# axis = 1表示来求取每一行非空值的个数
print(df.count(axis=1))
# 也可以对每一列求个数
print(df['c1'].count())
# 2.sum求和函数
# sum函数:返回的是每一列的求和结果
print(df.sum())
# axis = 1表示每一行求和结果
print(df.sum(axis=1))
# 也可以对每一列求和
print(df['c1'].sum())
# 3.mean求均值
# mean函数:返回每一列的均值
print(df.mean())
# axis = 1表示每一行求均值
print(df.mean(axis=1))
# 也可以对每一列求均值
print(df['c1'].mean())
# 4。max求最大值
# max函数:可对每一行或每一列求最大值
print(df.max())
# axis = 1表示求每一行最大值
print(df.max(axis=1))
# 也可以对每一列求最大值
print(df['c1'].max())
# 5。min求最小值
# max函数:可对每一行或每一列求最小值
print(df.min())
# axis = 1表示求每一行最大值
print(df.min(axis=1))
# 也可以对每一列求最大值
print(df['c1'].min())
print('...........换数据............')
data1 = {'c1':[1,4,7],'c2':[2,5,8],'c3':[3,6,9]}
df1 = pd.DataFrame(data1,index=['s1','s2','s3'])
print(df1)
# 6。median求中位数
#median函数:可对每一行或每一列求中位数
print(df1.median())
# axis = 1表示求每一行的中位数
print(df1.median(axis=1))
# 也可以对每一列求最大值
print(df1['c1'].median())
print('...........换数据............')
data2 = {'c1':[1,4,1],'c2':[1,4,1],'c3':[3,6,3]}
df2 = pd.DataFrame(data2,index=['s1','s2','s3'])
print(df2)
# 7.mode求众数;众数:每一组数据中出现次数最多的数
# mode函数:可对每一行或每一列求众数
print(df2.mode())
# axis = 1表示求每一行的众数
print(df2.mode(axis=1))
# 也可以对每一列求众数
print(df2['c1'].mode())
#8。var求方差:方差是用来衡量一组数据的离散程度
#var函数:可对每一行或每一列求方差
print(df1.var())
# axis = 1表示求每一行的方差
print(df1.var(axis=1))
# 也可以对每一列求方差
print(df1['c1'].var())
# 9。std求标准差:标准差是方差的平方根,二者都是用来表示数据的离散程度的
#std函数:可对每一行或每一列求标准差
print(df1.std())
# axis = 1表示求每一行的标准差
print(df1.std(axis=1))
# 也可以对每一列求标准差
print(df1['c1'].std())
print('...........换数据............')
data3 = {'c1':[1,4,7,10,13],'c2':[2,5,8,11,14],'c3':[3,6,9,12,15]}
df3 = pd.DataFrame(data3,index=['s1','s2','s3','s4','s5'])
print(df3)
# 10。quantile求分位数:分位数是比中位数更加详细的基于位置的指标,分位数主要有四分之一分位数,四分之二分位数,四分之三分位数,而四分之二分位数就是中位数
#std函数:可对每一行或每一列求分位数
# 求列的四分之一分位数
print(df3.quantile(0.25))
# 求列的四分之三分位数
print(df3.quantile(0.75))
# axis = 1表示求每一行的分位数
print(df3.quantile(0.25,axis=1))
# 也可以对每一列求分位数
print(df3['c1'].quantile(0.25))


四、相关性运算


'''
相关性:用来衡量两个事物之间的相关程度
我们一般用相关系数来衡量两者的相关程度,所以相关性计算就是计算相关系数,比较常用的是皮尔逊系数
'''
import pandas as pd
data = {'col1':[1,3,5,7,9],'col2':[2,4,6,8,10],'col3':[3,6,9,12,15]}
df = pd.DataFrame(data)
print(df)
#用corr函数计算相关性
print(df['col1'].corr(df['col2']))
# 还可以对整个表中各个两两字段求相关性
print(df.corr())



相关文章
|
25天前
|
缓存 API 网络架构
淘宝item_search_similar - 搜索相似的商品API接口,用python返回数据
淘宝联盟开放平台中,可通过“物料优选接口”(taobao.tbk.dg.optimus.material)实现“搜索相似商品”功能。该接口支持根据商品 ID 获取相似推荐商品,并返回商品信息、价格、优惠等数据,适用于商品推荐、比价等场景。本文提供基于 Python 的实现示例,包含接口调用、数据解析及结果展示。使用时需配置淘宝联盟的 appkey、appsecret 和 adzone_id,并注意接口调用频率限制和使用规范。
|
2月前
|
存储 Web App开发 前端开发
Python + Requests库爬取动态Ajax分页数据
Python + Requests库爬取动态Ajax分页数据
|
2月前
|
JSON API 数据格式
Python采集京东商品评论API接口示例,json数据返回
下面是一个使用Python采集京东商品评论的完整示例,包括API请求、JSON数据解析
|
4月前
|
JSON 算法 API
1688商品详情API实战:Python调用全流程与数据解析技巧
本文介绍了1688电商平台的商品详情API接口,助力电商从业者高效获取商品信息。接口可返回商品基础属性、价格体系、库存状态、图片描述及商家详情等多维度数据,支持全球化语言设置。通过Python示例代码展示了如何调用该接口,帮助用户快速上手,适用于选品分析、市场研究等场景。
|
5月前
|
数据采集 NoSQL 关系型数据库
Python爬虫去重策略:增量爬取与历史数据比对
Python爬虫去重策略:增量爬取与历史数据比对
|
27天前
|
JSON 安全 API
Python处理JSON数据的最佳实践:从基础到进阶的实用指南
JSON作为数据交换通用格式,广泛应用于Web开发与API交互。本文详解Python处理JSON的10个关键实践,涵盖序列化、复杂结构处理、性能优化与安全编程,助开发者高效应对各类JSON数据挑战。
114 1
|
2月前
|
API 数据安全/隐私保护 Python
Python如何快速接入聚合数据行情API
聚合数据行情API,指的是一个接口即可提供多个不同交易品种的行情数据查询,这种接口,可以让你同时查询A股、美股、外汇等多种资产的行情数据。
|
2月前
|
XML Linux 区块链
Python提取Word表格数据教程(含.doc/.docx)
本文介绍了使用LibreOffice和python-docx库处理DOC文档表格的方法。首先需安装LibreOffice进行DOC到DOCX的格式转换,然后通过python-docx读取和修改表格数据。文中提供了详细的代码示例,包括格式转换函数、表格读取函数以及修改保存功能。该方法适用于Windows和Linux系统,解决了老旧DOC格式文档的处理难题,为需要处理历史文档的用户提供了实用解决方案。
138 1
|
2月前
|
缓存 监控 API
1688平台开放接口实战:如何通过API获取店铺所有商品数据(Python示列)
本文介绍如何通过1688开放平台API接口获取店铺所有商品,涵盖准备工作、接口调用及Python代码实现,适用于商品同步与数据监控场景。
|
4月前
|
Web App开发 数据采集 JavaScript
动态网页爬取:Python如何获取JS加载的数据?
动态网页爬取:Python如何获取JS加载的数据?
819 58

推荐镜像

更多