机器学习Pandas 库

简介: Pandas 是基于 BSD 许可的开源支持库,为 Python 提供了高性能、易使用的数据结构与数据分析工具。

💥个人简介

💖 作者简介:⭐️heart_6662,还在学习(卷)当中,欢迎交流指正~😜

📧如果文章知识点有错误的地方,请指正留言📝!和大家一起学习,一起进步

📣 系列专栏:机器学习🍁

💬格言:人生舞台的大幕随时都可能拉开,关键是你愿意表演,还是选择躲避🔥

🧡如果感觉博主的文章还不错的话,请👍三连支持一下博主💌哦

一、Pandas库

importnumpyasnpimportpandasaspd


二、Pandas库数据结构——Series, DataFrame

a=pd.Series([1, 2, 3, 4, 5])

data=np.array([[95, 96, 97], [80, 85, 86], [56, 65, 70]])
frame=pd.DataFrame(data)
frame

我们不难看出来Series, DataFrame的区别:DataFrame更加好看哈哈,接受矩阵数据


详细见:

https://blog.csdn.net/u012474716/article/details/78550391

pandas中的两种数据类型Series和DataFrame区别_jolingcome的博客-CSDN博客_series和dataframe区别

1.Series——索引 index,值 values

a=pd.Series([1, 2, 3, 4, 5], index= ['a', 'b', 'c', 'd', 'e'])
a

2.DataFrame——索引index, columns,值 values

frame=pd.DataFrame(data, index=['xiaoming', 'xiaohong', 'xiaohei'],
columns=['yuwen', 'yingyu', 'shuxue'])
frame

指定或修改索引方法

创建时:

index, columns 指定索引,已经有索引可以按索引重新排序

创建后:

reindex方法,重新建立索引或指定索引排序

rename 修改索引

frame_.rename(index={"xiaohong":"damao","xiaoming":"ermao","xiaohei":"Nicolas Cage"},
columns={"yingyu":"English", "yuwen":"Literature", "shuxue":"Maths"})
Series.index= []
DataFrame.columns= []

三、Series, DataFrame运算

1.基本运算

按照索引位置进行计算

data= {"English":[80,70,60], 
"Literature":[70,70,85],
"Maths":[80,90,50],
"Music":["A","B","C"]}
df=pd.DataFrame(data,index= ["alpha", "beta","theta"])
df*2

DataFrame、Series “相加”时,按照DF的columns(列)进行匹配

data1= {"English":[80,70,60], 
"Literature":[70,70,85],
"Maths":[80,90,50],}
df1=pd.DataFrame(data1,index= ["alpha", "beta","theta"])
add_= {'Maths':10,'English':10,'Literature':20,'Gym':"A"}
add_=pd.Series(add_)
df1+add_

2.矩阵运算、通用函数

df.T

3.基本统计方法

查看数据的一些

df.describe()

四、Series, DataFrame 索引与切片

1.Series 索引与切片 Index索引/数字索引/布尔值索引

add_= {'Maths':10,'English':10,'Literature':20,'Gym':"A"}
add_=pd.Series(add_)
add_['Maths']

2.DataFrame 索引与切片

Index索引 列:df['Maths'] 行:df.loc[‘alpha’]

数字索引 df.iloc[] 特别的行可以直接用数字切片索引


布尔值索引

五、Series, DataFrame 删除操作

1.Series删除操作 pop/drop/del

① del方式:就地删除

x=pd.Series([10,23,31,16],index=list("abcd"))
display(x)

image.png

删除了某个索引后,对应的值也就删除了

delx["b"]
display(x)

image.png

② drop方式:当指定了inplace=True后,才属于就地删除

x=pd.Series([10,23,31,16],index=list("abcd"))
display(x)
y=x.drop("a")
display(y)
dispaly(x)
# 当指定了inplace=True后,属于就地删除x.drop("a",inplace=True)
display(x)

image.png

2.DataFrame删除操作 pop/drop/del

和 Series删除操作 pop/drop/del  类同的,聪明的你可以想想

六、Series, DataFrame 合并操作

一般我们用到什么方法就去查看该方法的参数

1.Series合并操作

pd.concat() combine_first()

2.DataFrame合并操作

pd.concat() combine_first()

pd.merge() join()

七、Pandas库其他常用函数或方法

head() info() describe()

sort_index() sort_values()

is_unique value_counts()

rank()

详细可见https://blog.csdn.net/xiaodongxiexie/article/details/71774594

相关文章
|
23天前
|
数据采集 存储 数据挖掘
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第27天】在数据分析领域,Python的Pandas库因其强大的数据处理能力而备受青睐。本文介绍了Pandas在数据导入、清洗、转换、聚合、时间序列分析和数据合并等方面的高效技巧,帮助数据分析师快速处理复杂数据集,提高工作效率。
55 0
|
1月前
|
数据采集 数据处理 Python
探索数据科学前沿:Pandas与NumPy库的高级特性与应用实例
探索数据科学前沿:Pandas与NumPy库的高级特性与应用实例
33 0
|
2月前
|
机器学习/深度学习 数据处理 Python
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
80 0
|
10天前
|
机器学习/深度学习 数据挖掘 数据处理
Pandas库
Pandas库是Python中进行数据分析和处理的强大工具,通过其丰富的功能和简洁的API,可以高效地完成各种数据处理任务,为后续的数据分析和机器学习提供了有力的支持。
|
23天前
|
机器学习/深度学习 数据采集 算法
Python机器学习:Scikit-learn库的高效使用技巧
【10月更文挑战第28天】Scikit-learn 是 Python 中最受欢迎的机器学习库之一,以其简洁的 API、丰富的算法和良好的文档支持而受到开发者喜爱。本文介绍了 Scikit-learn 的高效使用技巧,包括数据预处理(如使用 Pipeline 和 ColumnTransformer)、模型选择与评估(如交叉验证和 GridSearchCV)以及模型持久化(如使用 joblib)。通过这些技巧,你可以在机器学习项目中事半功倍。
33 3
|
23天前
|
Python
通过Pandas库处理股票收盘价数据,识别最近一次死叉后未出现金叉的具体位置的方法
在金融分析领域,"死叉"指的是短期移动平均线(如MA5)下穿长期移动平均线(如MA10),而"金叉"则相反。本文介绍了一种利用Python编程语言,通过Pandas库处理股票收盘价数据,识别最近一次死叉后未出现金叉的具体位置的方法。该方法首先计算两种移动平均线,接着确定它们的交叉点,最后检查并输出最近一次死叉及其后是否形成了金叉。此技术广泛应用于股市趋势分析。
39 2
|
26天前
|
数据采集 数据可视化 数据处理
如何使用Python实现一个交易策略。主要步骤包括:导入所需库(如`pandas`、`numpy`、`matplotlib`)
本文介绍了如何使用Python实现一个交易策略。主要步骤包括:导入所需库(如`pandas`、`numpy`、`matplotlib`),加载历史数据,计算均线和其他技术指标,实现交易逻辑,记录和可视化交易结果。示例代码展示了如何根据均线交叉和价格条件进行开仓、止损和止盈操作。实际应用时需注意数据质量、交易成本和风险管理。
49 5
|
23天前
|
Python
如何利用Pandas库找到最近一次死叉后未出现金叉的具体位置
在金融分析领域,"死叉"指短期移动平均线跌破长期移动平均线,而"金叉"则相反。本文介绍了一个Python示例,演示如何利用Pandas库找到最近一次死叉后未出现金叉的具体位置,包括计算移动平均线、确定交叉点、识别死叉和金叉,以及输出相关分析结果。此方法适用于各类包含收盘价数据的金融分析场景。
27 1
|
24天前
|
存储 数据挖掘 数据处理
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第26天】Python 是数据分析领域的热门语言,Pandas 库以其高效的数据处理功能成为数据科学家的利器。本文介绍 Pandas 在数据读取、筛选、分组、转换和合并等方面的高效技巧,并通过示例代码展示其实际应用。
31 2
|
15天前
|
数据采集 数据可视化 数据挖掘
利用Python进行数据分析:Pandas库实战指南
利用Python进行数据分析:Pandas库实战指南
下一篇
无影云桌面