前言
系列文章目录
视频及资料和课件
链接:https://pan.baidu.com/s/1LCv_qyWslwB-MYw56fjbDg?pwd=1234
提取码:1234
引入包
import pandas as p
1. Series() – 创建 Series 对象
【Pandas中Series的属性、方法、常用操作以及使用示例】
2. DataFrame() – 创建 DataFrame 对象
【Pandas中DataFrame的属性、方法、常用操作以及使用示例】
3. read_csv() – 读取 csv 文件
filepath_or_buffer – csv 文件对应的路径
使用 filepath_or_buffer 指定需要打开的 csv 文件的路径。
data = pd.read_csv('./数据文件/距离最小的三个点.csv') print(data)
sep – 指定分隔符
csv 文件默认的分隔符为 ,
,可以使用 sep 指定数据之间的分隔符
csv文件中的数据:
distance1#distance2#distance3#dot1#dot2#dot3 14.3#14.567#21.508#1.0,11#0,2.0 10.568#34.101#37.41#1.0#11.0#10.0
第二行中2.0前的逗号没有进行修改
data = pd.read_csv('./数据文件/距离最小的三个点.csv', sep='#') print(data
header – 指定第几行为列名
使用 header 指定 csv 文件中的第几行数据作为表的列名。默认 header = 0,即表的第一行为列名;header = None 表示不指定表中的数据为列名,用于数据中不存在列名的情况。
data = pd.read_csv( './数据文件/距离最小的三个点.csv', sep='#' ) print(data)
data = pd.read_csv( './数据文件/距离最小的三个点.csv', sep='#', header=0 ) print(data)
csv文件中的数据:
distance1#distance2#distance3#dot1#dot2#dot3 14.3#14.567#21.508#1.0,11#0#2.0 10.568#34.101#37.41#1.0#11.0#10.0 10.568#34.101#37.41#1.0#11.0#10.0 10.568#34.101#37.41#1.0#11.0#10.0 10.568#34.101#37.41#1.0#11.0#10.0
data = pd.read_csv( './数据文件/距离最小的三个点.csv', sep='#', header=2 ) print(data)
被指定为列名的行以前的数据都不会出现在数据表中。
data = pd.read_csv( './数据文件/距离最小的三个点.csv', sep='#', header=None ) print(data)
header=None,如果不指定列名,会自动默认分配一个 0 ~ (n-1) 的数字索引为列名。
names – 指定列名
使用 names 可以自己指定列名,需要保证自己指定的列名不能存在重复。
data = pd.read_csv( './数据文件/距离最小的三个点.csv', sep='#', header=None, names=['a','b','c','d','e','f'] ) print(data)
注意:
如果自己指定了列名,会覆盖原有的列名。
data = pd.read_csv( './数据文件/距离最小的三个点.csv', sep='#', header=0, names=['a','b','c','d','e','f'] ) print(data)
4. read_excel() – 读取 excel 文件
filepath – excel 文件对应的路径
使用 filepath 指定需要打开的 excel 文件的路径。
data = pd.read_excel('./数据文件/信表节点的坐标.xlsx') print(data)
header – 指定第几行为列名
使用 header 指定 excel 文件中的第几行数据作为表的列名。默认 header = 0,即表的第一行为列名;header = None 表示不指定表中的数据为列名,用于数据中不存在列名的情况。
data = pd.read_excel('./数据文件/信表节点的坐标.xlsx') print(data)
data = pd.read_excel( './数据文件/信表节点的坐标.xlsx', header = 0 ) print(data)
data = pd.read_excel( './数据文件/信表节点的坐标.xlsx', header = 2 ) print(data)