一个参数一个xlsx表,让你玩转Pandas中read_excel()表格读取!(二)

本文涉及的产品
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: 一个参数一个xlsx表,让你玩转Pandas中read_excel()表格读取!(二)

⑤ usecols=[“列名1”,“列名2”…]

这种方式照说是没有任何问题的,但是在我这边运行总是无结果,我很纳闷,大家可以下去试试。


4)names参数

含义:如果表中没有表头,可以用这个参数添加一个标题。如果表中有表头,可以用这个参数修改标题。

names = ["月份","语文","英语"]
df6 = pd.read_excel("names.xlsx",header=None,names=names) 
df6


结果如下:


image.png

5)dtype参数

含义:读取数据时,设置每一列的数据类型(重要);

dtype={}传入一个字典,类似于{“列名”:“类型”};

df7 = pd.read_excel("dtype.xlsx")
df7.dtypes
------------------------------------------------------
df7 = pd.read_excel("dtype.xlsx",dtype={"年龄":"str"})
df7.dtypes


结果如下:


image.png

6)parse_dates参数

含义:指定将哪些列,解析为日期格式;

parse_dates=True是专门用于将行索引,解析为日期格式;

parse_dates=[0,1,2,3,4]和parse_dates=[“列名1”,“列名2”,“列名3”,“列名4”],都是将指定列一起解析为日期格式;

parse_dates=[[1,2,3]]和parse_dates=[[“年”,“月”,“日”]],都是将多个列,解析为单个日期列;

parse_dates={“日期”:[1,2,3]}不仅将多个日期列解析为单个日期列,同时还为这一列命名;

① parse_dates=True

df8 = pd.read_excel("parse_dates",index_col=2,parse_dates=True)
df8.index


结果如下:

image.png


② parse_dates=[0,1,2,3,4]和parse_dates=[“列名1”,“列名2”,“列名3”,“列名4”]

df8 = pd.read_excel("parse_dates",parse_dates=[0,1,2,3,4])
df8.dtypes
# 这个代码效果同上
df8 = pd.read_excel("parse_dates.xlsx",
                    parse_dates=["数值日期1","文本日期2","文本日期3","文本日期4","文本日期5"])


结果如下:

image.png

③ parse_dates=[[1,2,3]]和parse_dates=[[“年”,“月”,“日”]]

#df8 = pd.read_excel("parse_dates.xlsx",sheet_name="Sheet2",parse_dates=[["年","月","日"]])
df8 = pd.read_excel("parse_dates.xlsx",sheet_name="Sheet2",parse_dates=[[1,2,3]])
df8


结果如下:

image.png


④ parse_dates={“日期”:[1,2,3]}

df8 = pd.read_excel("parse_dates.xlsx",sheet_name="Sheet2",parse_dates={"日期":[1,2,3]})
df8


结果如下:

image.png


7)date_parser参数

含义:利用lambda函数,将某个字符串列,解析为日期格式;

一般是配合parse_dates参数,一起使用;

df9 = pd.read_excel("date_parser.xlsx",parse_dates=[1],
                    date_parser=lambda x: pd.to_datetime(x,format="%Y年%m月%d"))
print(df9.dtypes)
df9


结果如下:

image.png


8)na_values参数

含义:用于将某些特定的值,解析为NaN值,然后便于我们后面做缺失值的处理;

na_values=”值1“表示将所有数据中值1全部替换为NaN;

na_values=[”值1“,“值2”]表示将所有数据中值1、值2全部替换为NaN;

na_values={“列1”:[”值1“,“值2”]}表示将第一列中所有的值1、值2全部替换为NaN;

① na_values=”值1“

df10 = pd.read_excel("na_values.xlsx",na_values=" ")
df10


结果如下:

image.png


② na_values=[”值1“,“值2”]

df10 = pd.read_excel("na_values.xlsx",na_values=["a","0"])
df10


结果如下:

image.png


③ na_values={“列1”:[”值1“,“值2”]}

#  只替换某一列中的某些值为NaN
df10 = pd.read_excel("na_values.xlsx",na_values={"列2":["0"," "]})
df10


结果如下:

image.png


9)converters参数

含义:对某一列使用Lambda函数,进行某种运算;

例如:converters={“工资”:lambda x: x + 1000};

df11 = pd.read_excel("converters.xlsx",
                     converters={"地址":lambda x: "中国"+x,"工资":lambda x: x + 1000})
df11


结果如下:

image.png

相关文章
|
6天前
|
Java Apache
Apache POI java对excel表格进行操作(读、写) 有代码!!!
文章提供了使用Apache POI库在Java中创建和读取Excel文件的详细代码示例,包括写入数据到Excel和从Excel读取数据的方法。
16 0
|
2月前
|
前端开发 JavaScript
使用Vue+xlsx+xlsx-style实现导出自定义样式的Excel文件
本文介绍了在Vue项目中使用`xlsx`和`xlsx-style`(或`xlsx-style-vite`)库实现导出具有自定义样式的Excel文件的方法,并提供了详细的示例代码和操作效果截图。
433 1
使用Vue+xlsx+xlsx-style实现导出自定义样式的Excel文件
|
17天前
|
数据挖掘 数据处理 Python
Pandas表格样式美化指南:应用条形图
Pandas表格样式美化指南:应用条形图
24 0
|
2月前
|
Python
pandas参数设置小技巧
pandas参数设置小技巧
|
2月前
|
人工智能 BI
用ChatGPT做excel表格真香!只需动嘴提要求和复制粘贴
用ChatGPT做excel表格真香!只需动嘴提要求和复制粘贴
|
3月前
|
数据可视化 数据管理 定位技术
如何将QGIS中的属性表与Excel表格关联?
作为UE开发人员,经常会使用到QGIS进行数据管理编辑。QGIS与Excel之间数据并不完全兼容,而UE开发过程中大部分的前期数据都储存在Eecel里。为了将Excel数据写入QGIS属性表实现数据可视化,我们内部总结了一个最快捷的方法
|
2月前
Map——全国省市区EXCEL表格(包含code)
Map——全国省市区EXCEL表格(包含code)
43 0
|
3月前
|
数据格式 Python
Python代码示例,读取excel表格,将行数据转为列数据。(10)
【7月更文挑战第10天】Python代码示例,读取excel表格,将行数据转为列数据。
103 2
|
3月前
|
存储 对象存储 Python
`openpyxl`是一个用于读写Excel 2010 xlsx/xlsm/xltx/xltm文件的Python库。它不需要Microsoft Excel,也不需要.NET或COM组件。
`openpyxl`是一个用于读写Excel 2010 xlsx/xlsm/xltx/xltm文件的Python库。它不需要Microsoft Excel,也不需要.NET或COM组件。
|
17天前
|
机器学习/深度学习 数据处理 Python
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
36 0