Pandas中的方法及使用示例(一)

简介: Pandas中的方法及使用示例

b2076fd92f93431cb863f717c76af5d0.png

前言

系列文章目录

[Python]目录

视频及资料和课件

链接:https://pan.baidu.com/s/1LCv_qyWslwB-MYw56fjbDg?pwd=1234

提取码:1234

引入包

import pandas as p

1. Series() – 创建 Series 对象

【Pandas中Series的属性、方法、常用操作以及使用示例】

2. DataFrame() – 创建 DataFrame 对象

【Pandas中DataFrame的属性、方法、常用操作以及使用示例】

3. read_csv() – 读取 csv 文件

filepath_or_buffer – csv 文件对应的路径

使用 filepath_or_buffer 指定需要打开的 csv 文件的路径。

data = pd.read_csv('./数据文件/距离最小的三个点.csv')
print(data)

sep – 指定分隔符

csv 文件默认的分隔符为 ,,可以使用 sep 指定数据之间的分隔符

csv文件中的数据:

distance1#distance2#distance3#dot1#dot2#dot3
14.3#14.567#21.508#1.0,11#0,2.0
10.568#34.101#37.41#1.0#11.0#10.0

第二行中2.0前的逗号没有进行修改

data = pd.read_csv('./数据文件/距离最小的三个点.csv', sep='#')
print(data

header – 指定第几行为列名

使用 header 指定 csv 文件中的第几行数据作为表的列名。默认 header = 0,即表的第一行为列名;header = None 表示不指定表中的数据为列名,用于数据中不存在列名的情况。

data = pd.read_csv(
  './数据文件/距离最小的三个点.csv', 
  sep='#'
)
print(data)

data = pd.read_csv(
  './数据文件/距离最小的三个点.csv',
  sep='#', 
  header=0
)
print(data)

csv文件中的数据:

distance1#distance2#distance3#dot1#dot2#dot3
14.3#14.567#21.508#1.0,11#0#2.0
10.568#34.101#37.41#1.0#11.0#10.0
10.568#34.101#37.41#1.0#11.0#10.0
10.568#34.101#37.41#1.0#11.0#10.0
10.568#34.101#37.41#1.0#11.0#10.0
data = pd.read_csv(
  './数据文件/距离最小的三个点.csv', 
  sep='#',
  header=2
)
print(data)

被指定为列名的行以前的数据都不会出现在数据表中。

data = pd.read_csv(
  './数据文件/距离最小的三个点.csv', 
  sep='#',
  header=None
)
print(data)

header=None,如果不指定列名,会自动默认分配一个 0 ~ (n-1) 的数字索引为列名。

names – 指定列名

使用 names 可以自己指定列名,需要保证自己指定的列名不能存在重复。

data = pd.read_csv(
  './数据文件/距离最小的三个点.csv', 
  sep='#',
  header=None,
  names=['a','b','c','d','e','f']
)
print(data)

注意:

如果自己指定了列名,会覆盖原有的列名。

data = pd.read_csv(
  './数据文件/距离最小的三个点.csv', 
  sep='#',
  header=0,
  names=['a','b','c','d','e','f']
)
print(data)

4. read_excel() – 读取 excel 文件

filepath – excel 文件对应的路径

使用 filepath 指定需要打开的 excel 文件的路径。

data = pd.read_excel('./数据文件/信表节点的坐标.xlsx')
print(data)

header – 指定第几行为列名

使用 header 指定 excel 文件中的第几行数据作为表的列名。默认 header = 0,即表的第一行为列名;header = None 表示不指定表中的数据为列名,用于数据中不存在列名的情况。

data = pd.read_excel('./数据文件/信表节点的坐标.xlsx')
print(data)

data = pd.read_excel(
  './数据文件/信表节点的坐标.xlsx',
  header = 0
)
print(data)

data = pd.read_excel(
  './数据文件/信表节点的坐标.xlsx',
  header = 2
)
print(data)


相关文章
|
1月前
|
数据采集 机器学习/深度学习 Python
【机器学习】数据清洗——基于Pandas库的方法删除重复点
【机器学习】数据清洗——基于Pandas库的方法删除重复点
143 1
|
1月前
|
人工智能 安全 数据挖掘
Pandas AI:Pandas与人工智能的结合,让你不再拘泥于如何使用pandas方法及处理语法
Pandas AI:Pandas与人工智能的结合,让你不再拘泥于如何使用pandas方法及处理语法
130 1
|
1月前
|
数据挖掘 索引 Python
在Pandas中通过时间频率来汇总数据的三种常用方法
在Pandas中通过时间频率来汇总数据的三种常用方法
87 0
|
1月前
|
SQL 索引 Python
Pandas Query 方法深度总结
Pandas Query 方法深度总结
|
9月前
|
机器学习/深度学习 算法 物联网
时间序列的重采样和pandas的resample方法介绍
重采样是时间序列分析中处理时序数据的一项基本技术。它是关于将时间序列数据从一个频率转换到另一个频率,它可以更改数据的时间间隔,通过上采样增加粒度,或通过下采样减少粒度。在本文中,我们将深入研究Pandas中重新采样的关键问题。
92 1
|
1月前
|
Python
使用Python pandas的sort_values()方法可按一个或多个列对DataFrame排序
【5月更文挑战第2天】使用Python pandas的sort_values()方法可按一个或多个列对DataFrame排序。示例代码展示了如何按'Name'和'Age'列排序 DataFrame。先按'Name'排序,再按'Age'排序。sort_values()的by参数接受列名列表,ascending参数控制排序顺序(默认升序),inplace参数决定是否直接修改原DataFrame。
43 1
|
1月前
|
数据可视化 数据挖掘 C++
数据分析综合案例讲解,一文搞懂Numpy,pandas,matplotlib,seaborn技巧方法
数据分析综合案例讲解,一文搞懂Numpy,pandas,matplotlib,seaborn技巧方法
|
1月前
|
数据处理 Python
使用Pandas解决问题:对比两列数据取最大值的五种方法
​在数据处理和分析中,经常需要比较两个或多个列的值,并取其中的最大值。Pandas库作为Python中数据处理和分析的强大工具,提供了多种灵活的方法来实现这一需求。本文将详细介绍五种使用Pandas对比两列数据并取最大值的方法,通过代码示例和案例分析,帮助新手更好地理解并掌握这些技巧。
50 0
|
1月前
|
存储 数据可视化 数据挖掘
Pandas 28种常用方法使用总结(下)
Pandas 28种常用方法使用总结
|
1月前
|
数据挖掘 Serverless 数据处理
Pandas 28种常用方法使用总结(上)
Pandas 28种常用方法使用总结