Python 是一种用于进行数据分析的出色语言,主要是因为以数据为中心的 Python 包的奇妙生态系统。Pandas就是其中之一,它使导入和分析数据变得更加容易。
可以在 pandas 系列上执行一些重要的数学运算,以简化使用 Python 进行数据分析并节省大量时间。
要获取使用的数据集,请单击此处。
s=read_csv("stock.csv", squeeze=True) #reading csv file and making series
代码#1:
# 导入 pandas 以读取 csv 文件 import pandas as pd # 读取 csv 文件 s = pd.read_csv("stock.csv", squeeze = True) #使用 count 功能 print(s.count()) #使用 sum 功能 print(s.sum()) #使用 mean 功能 print(s.mean()) #计算平均值 print(s.sum()/s.count()) #使用 std 功能 print(s.std()) #使用 min 功能 print(s.min()) #使用 max 功能 print(s.max()) #使用 count 功能 print(s.median()) #使用 mode 功能 print(s.mode())
输出:
3012 1006942.0 334.3100929614874 334.3100929614874 173.18720477113115 49.95 782.22 283.315 0 291.21
代码#2:
# 导入 pandas 以读取 csv 文件 import pandas as pd #读取 csv 文件 s = pd.read_csv("stock.csv", squeeze = True) #使用 describe 功能 print(s.describe()) #使用 count 功能 print(s.idxmax()) #使用 idxmin 功能 print(s.idxmin()) #值为 3 的元素的计数 print(s.value_counts().head(3))
输出:
dtype : float64 count 3012.000000 mean 334.310093 std 173.187205 min 49.950000 25% 218.045000 50% 283.315000 75% 443.000000 max 782.220000 Name: Stock Price, dtype: float64 3011 11 291.21 5 288.47 3 194.80 3 Name: Stock Price, dtype: int64
意外输出和限制:
- .sum()、.mean()、.mode()、.median() 和其他此类数学运算不适用于字符串或除数值以外的任何其他数据类型。
- 字符串系列上的 .sum() 会给出意外的输出,并通过连接每个字符串返回一个字符串。
感谢大家的阅读,有什么问题的话可以在评论中告诉我。希望大家能够给我来个点赞+收藏+评论 ,你的支持是海海更新的动力!后面我会持续分享前端 & 后端相关的专业知识。