【机器学习5】数据处理(二)Pandas:表格处理 1

简介: 【机器学习5】数据处理(二)Pandas:表格处理

🌟🌟Pandas三种数据类型

Pandas提供了三种数据类型,分别是SeriesDataFramePanel。Series用于保存一维数据,DataFrame用于保存二维数据,Panel用于保存三维数据或者可变维数据。平时的表格处理数据分析最常用的数据类型是SeriesDataFrame,Panel较少用到。

✨✨Series数据结构

Series本质上是一个含有索引的一维数组,其包含一个左侧自动生成的index和右侧的values值,分别使用s.indexs.values进行查看。

下面举个例子:

下面我们导入数据:

import pandas  as pd
s=pd.read_excel("D:\A_data\Data_Series.xlsx")
s

运行结果如下:

其中,左侧这一列就是索引列,下面我们分别打印s.index和s.values

index返回一个index对象,而values返回一个array。

✨✨ DataFrame数据结构

DataFrame(数据框)类似于Excel电子表格,也与R语言中DataFrame的数据结构类似。

🌙🌙DataFrame数据的选取

🌕🌕DataFrame的构建

import pandas as pd
df=pd.DataFrame({'x':['a','b','c'],'y':[1,2,3],'z':[4,5,6]})
df

🌕🌕选取多行

方法一:

df.iloc[[0,1],:]

df.iloc[[0,2],:]

方法二:

df.loc[['0','2'],:]

🌕🌕选取某一列

df.y
df['y']
df.loc[:,['y']]
df.iloc[:,[1]]

🌕🌕选取多列

方法一:

df.iloc[:,[1,2]]

方法二:

df.loc[:,['x','y']]

方法三:

df[['x','y']]


相关文章
|
2天前
|
数据采集 存储 数据挖掘
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第27天】在数据分析领域,Python的Pandas库因其强大的数据处理能力而备受青睐。本文介绍了Pandas在数据导入、清洗、转换、聚合、时间序列分析和数据合并等方面的高效技巧,帮助数据分析师快速处理复杂数据集,提高工作效率。
12 0
|
2月前
|
数据采集 数据可视化 数据挖掘
Pandas函数大合集:数据处理神器一网打尽!
Pandas函数大合集:数据处理神器一网打尽!
34 0
|
2月前
|
机器学习/深度学习 数据处理 Python
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
60 0
|
3天前
|
存储 数据挖掘 数据处理
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第26天】Python 是数据分析领域的热门语言,Pandas 库以其高效的数据处理功能成为数据科学家的利器。本文介绍 Pandas 在数据读取、筛选、分组、转换和合并等方面的高效技巧,并通过示例代码展示其实际应用。
14 1
|
23天前
|
并行计算 大数据 数据处理
亿级数据处理,Pandas的高效策略
在大数据时代,数据量的爆炸性增长对处理技术提出更高要求。本文介绍如何利用Python的Pandas库及其配套工具高效处理亿级数据集,包括:采用Dask进行并行计算,分块读取以减少内存占用,利用数据库进行复杂查询,使用内存映射优化Pandas性能,以及借助PySpark实现分布式数据处理。通过这些方法,亿级数据处理变得简单高效,助力我们更好地挖掘数据价值。
36 1
|
1月前
|
机器学习/深度学习 并行计算 大数据
【Python篇】深入挖掘 Pandas:机器学习数据处理的高级技巧
【Python篇】深入挖掘 Pandas:机器学习数据处理的高级技巧
53 3
|
2月前
|
数据采集 数据挖掘 数据处理
Pandas实践:南京地铁数据处理分析
Pandas实践:南京地铁数据处理分析
32 2
|
2月前
|
数据挖掘 数据处理 Python
Pandas表格样式美化指南:应用条形图
Pandas表格样式美化指南:应用条形图
33 0
|
3月前
|
数据采集 数据挖掘 数据处理
解锁Python数据分析新技能!Pandas实战学习,让你的数据处理能力瞬间飙升!
【8月更文挑战第22天】Python中的Pandas库简化了数据分析工作。本文通过分析一个金融公司的投资数据文件“investment_data.csv”,介绍了Pandas的基础及高级功能。首先读取并检查数据,包括显示前几行、列名、形状和数据类型。随后进行数据清洗,移除缺失值与重复项。接着转换日期格式,并计算投资收益。最后通过分组计算平均投资回报率,展示了Pandas在数据处理与分析中的强大能力。
42 0
|
1月前
|
数据采集 数据挖掘 API
Python数据分析加速器:深度挖掘Pandas与NumPy的高级功能
在Python数据分析的世界里,Pandas和NumPy无疑是两颗璀璨的明星,它们为数据科学家和工程师提供了强大而灵活的工具集,用于处理、分析和探索数据。今天,我们将一起深入探索这两个库的高级功能,看看它们如何成为数据分析的加速器。
35 1