一个参数一个xlsx表,让你玩转Pandas中read_excel()表格读取!(一)

简介: 一个参数一个xlsx表,让你玩转Pandas中read_excel()表格读取!(一)

本文大纲

其实我觉得很有必要讲述这个文章,用Python进行数据处理的第一步,就是数据的读取。其实在进行数据读取的时候,我们可以做很多事儿。鉴于read_excel()函数和read_csv()函数,在参数上面有很多相通点,因此我就以read_excel()函数为例,进行详细的说明。

image.png


参数详解

1)sheet_name参数

含义:选择要读取的sheet表;

sheet_name=0表示默认读取第一个sheet表,等同于sheet_name=“sheet名称”;

sheet_name=[“sheet名”,0]会返回一个字典,然后可以利用键获取每一个sheet表中的数据;

sheet_name=None也会返回一个字典,但是会返回全部的sheet表;

① sheet_name=0等同于sheet_name=“Sheet1”

# 下面这两个读取方式等同。
#df2 = pd.read_excel("readexcel.xlsx",sheet_name=0)
df2 = pd.read_excel("readexcel.xlsx",sheet_name="Sheet1")
df2


结果如下:

image.png


② sheet_name=[“sheet名”,0]

df2 = pd.read_excel("readexcel.xlsx",sheet_name=[0,1])
df2


结果如下:

image.png

接着,我们可以使用键值对的方式,获取每个sheet表中的数据。

image.png

注:关于sheet_name=None效果同上,只不过会返回所有的sheet表中的数据。


2)header参数

含义:指定某一行作为表头;

header=None准们针对没有表头的表,这也是默认值;

header=1指定第一行作为表头;

header=[]主要针对复合表头的情况;

① header=None

df3 = pd.read_excel("header.xlsx",header=None)
df3


结果如下:

image.png


② header=1

df3 = pd.read_excel("header.xlsx",sheet_name=2,header=1) 
df3


结果如下:

image.png


③ header=[]

df3 = pd.read_excel("header.xlsx",sheet_name=3,header=[0,1],index_col=0) 
df3


结果如下:

image.png

注意:上述用到了一个index_col参数,这个参数用于指定作为行索引的列,我就不详细举例了,看看下图。



3)usecols参数

含义:选择读取一张表中的指定列;

usecols=None也是默认情况,表示读取所有列;

usecols=[A,C]表示只选取A列和C列。usecols=[A,C:E]表示选择A列,C列、D列和E列;

usecols=[0,2]表示只选择第一列和第三列;

usecols=[“列名1”,“列名2”…]这也是推荐使用的一种写法;

① usecols=None

df4 = pd.read_excel("usecols.xlsx",usecols=None) # 默认
df4


结果如下:

image.png


② usecols=[A,C]

df4 = pd.read_excel("usecols.xlsx",usecols="A,C") 
df4


结果如下:


image.png

③ usecols=[A,C:D]

df4 = pd.read_excel("usecols.xlsx",usecols="A,C:D") 
df4


结果如下:

image.png


④ usecols=[0,2]

df4 = pd.read_excel("usecols.xlsx",usecols=[0,2]) 
df4


结果如下:

image.png

相关文章
|
3月前
|
Java API Apache
Java编程如何读取Word文档里的Excel表格,并在保存文本内容时保留表格的样式?
【10月更文挑战第29天】Java编程如何读取Word文档里的Excel表格,并在保存文本内容时保留表格的样式?
207 5
|
7天前
|
文字识别 BI
【图片型PDF】批量识别扫描件PDF指定区域局部位置内容,将识别内容导出Excel表格或批量改名文件,基于阿里云OCR对图片型PDF识别改名案例实现
在医疗和政务等领域,图片型PDF文件(如病历、报告、公文扫描件)的处理需求广泛。通过OCR技术识别这些文件中的文字信息,提取关键内容并保存为表格,极大提高了信息管理和利用效率。本文介绍一款工具——咕嘎批量OCR系统,帮助用户快速处理图片型PDF文件,支持区域识别、内容提取、导出表格及批量改名等功能。下载工具后,按步骤选择处理模式、进行区域采样、批量处理文件,几分钟内即可高效完成数百个文件的处理。
49 8
|
2月前
|
数据可视化 数据处理 Python
使用Pandas实现Excel中的数据透视表功能
本文介绍了如何使用Python的Pandas库实现Excel中的数据透视表功能,包括环境准备、创建模拟销售数据、代码实现及输出等步骤。通过具体示例展示了按地区和销售员汇总销售额的不同方法,如求和、平均值、最大值等,帮助读者掌握Pandas在数据处理上的强大能力。
71 12
|
3月前
|
SQL 数据可视化 数据挖掘
想让Excel表格设计更美观?试试这几款好用工具!
Excel表格设计在项目管理和数据分析中至关重要。本文推荐四款辅助工具:板栗看板、Excel自动图表助手、Think-Cell Chart 和 Power BI,分别在任务管理、图表生成、数据可视化等方面表现突出,帮助你设计出更专业、美观的表格。
148 2
|
4月前
|
数据处理 Python
Python实用记录(十):获取excel数据并通过列表的形式保存为txt文档、xlsx文档、csv文档
这篇文章介绍了如何使用Python读取Excel文件中的数据,处理后将其保存为txt、xlsx和csv格式的文件。
268 3
Python实用记录(十):获取excel数据并通过列表的形式保存为txt文档、xlsx文档、csv文档
|
4月前
|
JavaScript 前端开发 数据处理
Vue导出el-table表格为Excel文件的两种方式
Vue导出el-table表格为Excel文件的两种方式
225 6
|
4月前
|
前端开发 JavaScript API
前端基于XLSX实现数据导出到Excel表格,以及提示“文件已经被损坏,无法打开”的解决方法
前端基于XLSX实现数据导出到Excel表格,以及提示“文件已经被损坏,无法打开”的解决方法
335 0
|
4月前
|
前端开发 JavaScript Java
导出excel的两个方式:前端vue+XLSX 导出excel,vue+后端POI 导出excel,并进行分析、比较
这篇文章介绍了使用前端Vue框架结合XLSX库和后端结合Apache POI库导出Excel文件的两种方法,并对比分析了它们的优缺点。
1558 0
|
4月前
|
Java Apache
Apache POI java对excel表格进行操作(读、写) 有代码!!!
文章提供了使用Apache POI库在Java中创建和读取Excel文件的详细代码示例,包括写入数据到Excel和从Excel读取数据的方法。
259 0
|
2月前
|
数据采集 数据可视化 数据挖掘
利用Python自动化处理Excel数据:从基础到进阶####
本文旨在为读者提供一个全面的指南,通过Python编程语言实现Excel数据的自动化处理。无论你是初学者还是有经验的开发者,本文都将帮助你掌握Pandas和openpyxl这两个强大的库,从而提升数据处理的效率和准确性。我们将从环境设置开始,逐步深入到数据读取、清洗、分析和可视化等各个环节,最终实现一个实际的自动化项目案例。 ####
305 10