机器学习Pandas 库

简介: Pandas 是基于 BSD 许可的开源支持库,为 Python 提供了高性能、易使用的数据结构与数据分析工具。

💥个人简介

💖 作者简介:⭐️heart_6662,还在学习(卷)当中,欢迎交流指正~😜

📧如果文章知识点有错误的地方,请指正留言📝!和大家一起学习,一起进步

📣 系列专栏:机器学习🍁

💬格言:人生舞台的大幕随时都可能拉开,关键是你愿意表演,还是选择躲避🔥

🧡如果感觉博主的文章还不错的话,请👍三连支持一下博主💌哦

一、Pandas库

importnumpyasnpimportpandasaspd


二、Pandas库数据结构——Series, DataFrame

a=pd.Series([1, 2, 3, 4, 5])

data=np.array([[95, 96, 97], [80, 85, 86], [56, 65, 70]])
frame=pd.DataFrame(data)
frame

我们不难看出来Series, DataFrame的区别:DataFrame更加好看哈哈,接受矩阵数据


详细见:

https://blog.csdn.net/u012474716/article/details/78550391

pandas中的两种数据类型Series和DataFrame区别_jolingcome的博客-CSDN博客_series和dataframe区别

1.Series——索引 index,值 values

a=pd.Series([1, 2, 3, 4, 5], index= ['a', 'b', 'c', 'd', 'e'])
a

2.DataFrame——索引index, columns,值 values

frame=pd.DataFrame(data, index=['xiaoming', 'xiaohong', 'xiaohei'],
columns=['yuwen', 'yingyu', 'shuxue'])
frame

指定或修改索引方法

创建时:

index, columns 指定索引,已经有索引可以按索引重新排序

创建后:

reindex方法,重新建立索引或指定索引排序

rename 修改索引

frame_.rename(index={"xiaohong":"damao","xiaoming":"ermao","xiaohei":"Nicolas Cage"},
columns={"yingyu":"English", "yuwen":"Literature", "shuxue":"Maths"})
Series.index= []
DataFrame.columns= []

三、Series, DataFrame运算

1.基本运算

按照索引位置进行计算

data= {"English":[80,70,60], 
"Literature":[70,70,85],
"Maths":[80,90,50],
"Music":["A","B","C"]}
df=pd.DataFrame(data,index= ["alpha", "beta","theta"])
df*2

DataFrame、Series “相加”时,按照DF的columns(列)进行匹配

data1= {"English":[80,70,60], 
"Literature":[70,70,85],
"Maths":[80,90,50],}
df1=pd.DataFrame(data1,index= ["alpha", "beta","theta"])
add_= {'Maths':10,'English':10,'Literature':20,'Gym':"A"}
add_=pd.Series(add_)
df1+add_

2.矩阵运算、通用函数

df.T

3.基本统计方法

查看数据的一些

df.describe()

四、Series, DataFrame 索引与切片

1.Series 索引与切片 Index索引/数字索引/布尔值索引

add_= {'Maths':10,'English':10,'Literature':20,'Gym':"A"}
add_=pd.Series(add_)
add_['Maths']

2.DataFrame 索引与切片

Index索引 列:df['Maths'] 行:df.loc[‘alpha’]

数字索引 df.iloc[] 特别的行可以直接用数字切片索引


布尔值索引

五、Series, DataFrame 删除操作

1.Series删除操作 pop/drop/del

① del方式:就地删除

x=pd.Series([10,23,31,16],index=list("abcd"))
display(x)

image.png

删除了某个索引后,对应的值也就删除了

delx["b"]
display(x)

image.png

② drop方式:当指定了inplace=True后,才属于就地删除

x=pd.Series([10,23,31,16],index=list("abcd"))
display(x)
y=x.drop("a")
display(y)
dispaly(x)
# 当指定了inplace=True后,属于就地删除x.drop("a",inplace=True)
display(x)

image.png

2.DataFrame删除操作 pop/drop/del

和 Series删除操作 pop/drop/del  类同的,聪明的你可以想想

六、Series, DataFrame 合并操作

一般我们用到什么方法就去查看该方法的参数

1.Series合并操作

pd.concat() combine_first()

2.DataFrame合并操作

pd.concat() combine_first()

pd.merge() join()

七、Pandas库其他常用函数或方法

head() info() describe()

sort_index() sort_values()

is_unique value_counts()

rank()

详细可见https://blog.csdn.net/xiaodongxiexie/article/details/71774594

相关文章
|
5天前
|
数据采集 机器学习/深度学习 数据可视化
利用Python和Pandas库构建高效的数据分析流程
在数据驱动的时代,数据分析已成为企业决策的关键环节。本文介绍如何利用Python编程语言及其强大的数据分析库Pandas,构建一套高效且可扩展的数据分析流程。与常规的数据分析流程不同,本文不仅涵盖数据加载、清洗、转换等基础步骤,还强调数据可视化、模型探索与评估等高级分析技巧,并通过实际案例展示如何在Python中实现这些步骤,为数据分析师提供一套完整的数据分析解决方案。
|
8天前
|
机器学习/深度学习 数据挖掘 Python
机器学习之pandas基础——pandas与概率论的简短碰面
机器学习之pandas基础——pandas与概率论的简短碰面
15 4
|
15天前
|
机器学习/深度学习 边缘计算 TensorFlow
Python机器学习工具与库的现状,并展望其未来的发展趋势
【6月更文挑战第13天】本文探讨了Python在机器学习中的核心地位,重点介绍了Scikit-learn、TensorFlow、PyTorch等主流库的现状。未来发展趋势包括自动化、智能化的工具,增强可解释性和可信赖性的模型,跨领域融合创新,以及云端与边缘计算的结合。这些进展将降低机器学习门槛,推动技术在各领域的广泛应用。
22 3
|
16天前
|
机器学习/深度学习 数据采集 算法
机器学习入门:scikit-learn库详解与实战
本文是面向初学者的scikit-learn机器学习指南,介绍了机器学习基础知识,包括监督和无监督学习,并详细讲解了如何使用scikit-learn进行数据预处理、线性回归、逻辑回归、K-means聚类等实战操作。文章还涵盖了模型评估与选择,强调实践对于掌握机器学习的重要性。通过本文,读者将学会使用scikit-learn进行基本的机器学习任务。【6月更文挑战第10天】
46 3
|
1天前
|
机器学习/深度学习 C++ Python
心得经验总结:机器学习常用库
心得经验总结:机器学习常用库
|
30天前
|
数据采集 数据可视化 数据处理
Python中的高效数据处理:Pandas库详解
Python中的高效数据处理:Pandas库详解
46 2
|
1月前
|
数据采集 数据挖掘 Serverless
利用Python和Pandas库优化数据清洗流程
在数据分析项目中,数据清洗是至关重要的一步。传统的数据清洗方法往往繁琐且易出错。本文将介绍如何利用Python编程语言中的Pandas库,通过其强大的数据处理能力,实现高效、自动化的数据清洗流程。我们将探讨Pandas库在数据清洗中的应用,包括缺失值处理、重复值识别、数据类型转换等,并通过一个实际案例展示如何利用Pandas优化数据清洗流程,提升数据质量。
|
1月前
|
数据采集 数据可视化 数据处理
利用Python和Pandas库实现高效的数据处理与分析
在大数据和人工智能时代,数据处理与分析已成为不可或缺的一环。Python作为一门强大的编程语言,结合Pandas库,为数据科学家和开发者提供了高效、灵活的数据处理工具。本文将介绍Pandas库的基本功能、优势,并通过实际案例展示如何使用Pandas进行数据清洗、转换、聚合等操作,以及如何利用Pandas进行数据可视化,旨在帮助读者深入理解并掌握Pandas在数据处理与分析中的应用。
|
1月前
|
架构师 数据挖掘 Python
最全pandas库(Python),2024年最新阿里云架构师面试
最全pandas库(Python),2024年最新阿里云架构师面试
最全pandas库(Python),2024年最新阿里云架构师面试
|
30天前
|
数据采集 SQL 数据处理
Python中的Pandas库:数据处理与分析的利器
Python中的Pandas库:数据处理与分析的利器
33 0

热门文章

最新文章